Продукты Oracle для разработки аналитических систем: области применения "нового" и "старого" инструментария

Источник: oracle
Андрей Майоров, руководитель Отдела аналитических систем компания РДТЕХ

Автор: Андрей Майоров, руководитель Отдела аналитических систем компания РДТЕХ

За последние два-три года Oracle сделал большой шаг вперед в области бизнес-аналитики. В первую очередь позиции корпорации укрепились за счет появления новой аналитической платформы Oracle Business Intelligence Enterprise Edition. Этому также способствовало приобретение новой многомерной базы Essbase и интеграция средств построения регламентированных отчетов (Publisher) в новую платформу. Немаловажным фактором является и значительное число готовых приложений, построенных на этих инструментальных средства. Однако одновременно с новыми приобретениями сохраняется и старая линейка программных продуктов Oracle, существовавших на протяжении многих лет. В связи с этим у ряда клиентов возникают определенные колебания. Некоторые придерживаются принципа, что лучшее враг хорошего, и продолжают использовать старые продукты, игнорируя расширенные функциональные возможности, предоставляемые новыми продуктами. Другие, напротив, стремятся как можно быстрее перейти на новую линейку продуктов без явной необходимости, полностью копируя существующий функционал аналитической системы. В данной статье нам хотелось бы рассказать о том как компания РДТЕХ, в течение многих лет работающая на рынке аналитических систем и хранилищ данных, видит позиционирование продуктов Oracle в области аналитики и хранилищ данных с точки зрения наиболее интересных для разработчиков свойств и возможных "подводных камней" при их использовании.

Oracle Business Intelligence Enterprise Edition

Oracle BI Enterprise Edition, безусловно, следует относить к флагманским продуктам Oracle в области бизнес-аналитики. Продукт предоставляет огромный выбор графических средств и возможностей по кастомизации разрабатываемых приложений, существенно превосходя в этом отношении своего предшественника - Oracle Discoverer. Наряду с привычными таблицами, крос-таблицами и графиками появились такие весьма выразительные средства как индикаторы, бегущие строки, возможности интеграции с картографическими средствами. Возможность быстрого создания очень качественных с точки зрения пользовательского интерфейса аналитических информационных панелей также является существенным преимуществом Oracle BI Enterprise Edition. Но основные преимущества Oracle BI Enterprise Edition заключаются, конечно, в его архитектурных решениях. В отличие от Oracle Discoverer, являющегося замкнутым продуктом, Oracle BI Enterprise Edition может легко интегрироваться в сложные системы. В качестве источника данных может использоваться уже не только сервер Oracle, а любая ODBC-доступная база данных. Более того, сам Oracle BI Enterprise Edition может служить источником как на уровне ODBC, так и как web-service. При этом в Oracle BI Enterprise Edition очень отчетливо разделены вопросы представления данных от их логического и физического представления. Причем не только на уровне метаданных, но и на архитектурном уровне - отдельные BI сервер для работы с данными (формирование запроса, исполнение и т.п.) и презентационный сервер, ответственный за представление результатов запроса. Именно эти особенности позволяют говорить об Oracle BI Enterprise Edition не как о продукте, а о платформе для BI приложений, в которую могут интегрироваться различные продукты.

Так, например, в Oracle BI Enterprise Edition была интегрирована регламентированная "бумажная" отчетность (Oracle Publisher), причем сделано это на уровне метаданных. Если ранее в проектах, где заказчику требовались и OLAP технологии, и регламентированная отчетность высокого полиграфического качества, разработчики вынуждены были использовать такие продукты, как Oracle Reports, по сути повторяя многие отчеты, разработанные в Oracle Discoverer, то теперь на основе одних и тех же метаданных возможно строить как ad hoc запросы, так и отчеты полиграфического качества. Другое интересное свойство - возможность автономного анализа, позволяющее аналитику выгрузить данные в свою персональную небольшую базу данных, отключиться от сервера и работать с данными, например, находясь в командировке.

Являясь источником данных, BI сервер может служить единым источником данных организации, репозитарий может использоваться как единая система метаданных или, другими словами, система документирования, через которую можно получать данные не только для собственно аналитики, но и для других приложений. Особый интерес это представляет в случаях, наследуемых систем, функционирующих на протяжении долгого времени с плохим уровнем документирования. Но богатство возможностей Oracle BI Enterprise Edition несет в себе и подводные камни, так что их следует использовать с осторожностью. Так, например, Oracle BI Enterprise Edition позволяет одновременно работать с несколькими физическими источниками данных на уровне одного репозитария и одних метаданных. Соглашаясь со стремлением распространять аналитику по всему предприятию, отметим, что данное свойство Business Intelligence вряд ли следует использовать для объединения "перекрывающихся" источников данных, т.е. информационных ресурсов, автоматизирующих одну и ту же бизнес-задачу. Исторически может сложиться, что одна и та же бизнес-функция (например, склад) поддерживается разными приложениями в разных подразделениях предприятия. С точки зрения бизнеса, обе системы могут быть абсолютно эквивалентны, вплоть до номенклатуры складируемых товаров, однако можно с уверенностью сказать, что справочники систем будут наверняка существенно отличны как по логической модели, так и по способам кодирования, а ведь именно справочники становятся скелетом аналитики - размерностями, по которым выполняется анализ. Потенциально в Oracle BI Enterprise Edition можно указать оба источника и попытаться построить единое представление данных. Однако с нашей точки зрения, разумнее было бы предварительно построить витрину или хранилище, решающее проблемы согласования данных. Нам кажется, что использование этой опции адекватно лишь в тех случаях, когда либо информационные области систем не пересекаются, либо для объединения источников различного уровня агрегации, когда, например, в реляционной базе данных содержатся более детальные данные, а в многомерной базе - консолидированные данные.

Oracle Discoverer и Oracle Siebel

В настоящее время продуктовая линейка Oracle включает одновременно Oracle BI Standard Edition со "старым" Oracle Discoverer и Oracle BI Enterprise Edition, выпущенный на базе продуктов Siebel. По нашему мнению, не стоит категорически отказываться от использования Oracle Discoverer в пользу Oracle BI Enterprise Edition, без достаточных для этого оснований. Если на предприятии уже имеется аналитика на Oracle Discoverer и не требуется расширение ее функционала за обеспечиваемые Oracle Discoverer рамки, такие как автономный анализ или автоматическое извещение о событиях, то разумнее сделать инвестиции в другие области. Тем более, что Oracle неоднократно заявлял о планах по конвергации продуктов. Более того, даже в новых проектах, особенно малобюджетных, следует использовать Оracle Discoverer, рассматривая его как некую персональную аналитику. В случаях небольших аналитических приложений на уровне подразделений предприятия и при углубленном анализе данных, осуществляемом ограниченным количеством людей, Oracle Discoverer до сих пор является разумным выбором. Oracle BI EE рационально применять тогда, когда речь идет о корпоративной аналитике и большом количестве пользователей, которые в основном занимаются "справочной" аналитикой, т.е в основном используют информационные панели для отслеживания определенных показателей. В этом случае особенно эффективны такие свойства Oracle Enterprise Edition, как кэширование запросов и возможность более тонкой настройки пользовательского интерфейса с помощью презентационного слоя.

Oracle Warehouse Builder и Oracle Data Integrator

Ни одно серьезное аналитическое приложение не может обойтись без хранилища данных и витрин данных. У Oracle существуют множество программных продуктов, которые в той или иной степени могут быть использованы для создания хранилищ. Часть этих продуктов имеет существенное пересечение по функционалу. Наиболее ярким примером могут служить Oracle Warehouse Builder и Oracle Data Integrator. Однако, не смотря на существенное пересечение функциональных возможностей, в действительности различия между продуктами и область их оптимального применения весьма существенны.

И Oracle Warehouse Builder, и Oracle Data Integrator- это ETL инструменты, что, собственно, и смущает многих пользователей. Но с нашей точки зрения, Oracle Warehouse Builder, являясь ETL инструментом, прежде всего средство проектирования хранилищ и аналитических приложений, в то время как Oracle Data Integrator, главным образом, интеграционный инструмент.

В качестве средства проектирования Oracle Warehouse Builder интересен тем, что в нем можно не просто описать таблицы хранилища, но и работать со специализированными типами объектов, такими как размерности и кубы. При этом Oracle Warehouse Builder поддерживает специализированные алгоритмы загрузки данных. Чрезвычайно важным с нашей точки зрения является то, что использованием этих специализированных типов объектов Warehouse Builder воплощает лучшие практики в области хранилищ, что особенно важно для начинающих разработчиков. Использование средств проектирования общего назначения с акцентом на ER моделирование, таких как, например, Oracle Designer или Erwin, часто приводит начинающих разработчиков к весьма неоптимальным структурам хранилища. Важным аспектом так же является возможность генерации метаданных для BI. Так, например, Oracle Warehouse Builder интегрирован с Oracle Discoverer, что позволяет, спроектировав хранилище, не покидая Oracle Warehouse Builder сгенерировать метаданные для Oracle Discoverer. В этом плане нам кажутся весьма интересными планы по обеспечению возможности генерации метаданных и для Oracle BI Enterprise Edition.

Oracle Essbase

В течение ряда лет после выхода весьма успешного продукта - Oracle Express Server, направление многомерных баз не слишком активно развивалось Oracle. Появление Oracle Essbase существенным образом изменило ситуацию. Oracle Essbase демонстрирует отличные показатели производительности как по скорости выполнения запросов, так и по объему хранимых данных, позволяя держать в многомерной базе не только агрегированные, но и детальные данные и не использовать гибридных схем (HOLAP). Однако это не означает, что многомерная база данных может полностью заменить реляционную. Многомерные базы, безусловно, являютсяадекватной альтернативой в случае витрин данных, но в случае крупных корпоративных хранилищ многомерная база не способна дать той необходимой степени универсальности, какую предоставляет реляционная модель. Средства администрирования и защита информации также существенно отстают в многомерных базах по сравнению с реляционными. Кроме того, такие существенные для аналитики вопросы, как очистка и согласование данных очень сложно решить в многомерных базах данных.

Поэтому мы в своей практике для хранилищ данных используем реляционные базы. Если же речь идет о построении витрин и сложных аналитических приложений, требующих существенных нагрузок в плане используемых аналитических функций и производительности запросов, применение многомерных баз, таких как Oracle Essbase, может быть чрезвычайно выигрышным.

Подводя итоги

Подводя итог, можно сказать, что оснащенность Oracle продуктами в области аналитики и хранилищ данных на сегодняшний день очень высока, и многие аспекты разработки могут быть выполнены различными инструментами. Предпочтения компании РДТЕХ в случае построения аналитических систем кратко могут быть просуммированы следующим образом:

  • Проектирование хранилища и аналитических систем - Oracle Warehouse Builder;
  • Хранилище данных - Oracle Server;
  • Витрина данных - Oracle Server или Oracle Hyperion Essbase;
  • ETL - Oracle Warehouse Builder и лишь в специальных случаях Oracle Data Integrator;
  • Аналитика - Oracle BI Enterprise Edition на корпоративном уровне и Oracle Discoverer на "персональном" уровне.

Страница сайта http://www.interface.ru
Оригинал находится по адресу http://www.interface.ru/home.asp?artId=21571