Очередной снэпшот технологии баз данных

Источник: citcity

24-25 апреля 2008 г. в Красном зале Президиума РАН состоялась очередная техническая конференция "Корпоративные базы данных". Конференция проводилась при поддержке Российского фонда фундаментальных исследований. Генеральным спонсором конференции являлась компания Microsoft, спонсором - компания Intersystems, и партнером - компания Релэкс. Состав участников был очень пестрым: представители крупных коммерческих компаний, государственных учреждений, военных организаций, ВУЗ"ов и исследовательских институтов из Центрального региона, Урала, Сибири, Дальнего Востока, Украины, Казахстана, Латвии и т.д.

За два дня работы конференции на ней было сделано 17 докладов специалистами компаний Microsoft, Oracle, IBM, Intersystems, Релэкс, MySQL, Айбэйс, Российской группы PostgreSQL, Института системного программирования РАН, Санкт-Петербургского государственного университета. В докладах обсуждались особенности новых продуктов и технологий, подходы к разработке и настройке приложений, перспективы развития технологий средств управления данными и их анализа.

24 апреля первые два доклада были посвящены новой версии одного из ведущих продуктов компании Microsoft - SQL Server 2008. Доклад "Microsoft SQL Server 2008: обзор продукта" представил Андрей Хромов. Новый выпуск MS SQL Server официально объявлен (в России - 18 марта 2008 г. на конференции "Герои среди нас", но реально система появится в виде продукта только в третьем квартале.

В докладе основные новые возможности SQL Server 2008 были сгруппированы в четыре класса: (1) возможности, поддерживающие использование MS SQL Server в качестве корпоративной платформы данных; (2) возможности, расширяющие границы использования MS SQL Server как только реляционной платформы; (3) средства динамичной разработки приложений и (4) новые возможности бизнес-анализа. К первому классу относятся возможности прозрачного шифрования данных, внешнего управления ключами, аудита данных, зеркалирования баз данных, оптимизации производительности системы, обеспечения предсказуемого уровня производительности, управления инфраструктурой баз данных на основе политик. Второй класс новых возможностей обеспечивается за счет поддержки технологии FILESTREAM (работа с внешними файлами средствами СУБД), долгожданных типов данных Data/Time, новых средств полнотекстового поиска, типов данных GEOMETRY и GEOGRAPHY. Третий класс опирается, главным образом, на технологию LINQ, обеспечивающую средства создания приложений баз данных в терминах бизнес-объектов (другими словами, поддерживающую единые средства объектно-реляционного отображения для всех языков платформы .NET). Наконец, средства бизнес-анализа SQL Server 2008 во многих отношениях превосходят соответствующие средства SQL Server 2005, и их обзору был посвящен отдельный доклад 25 апреля.

Доклад Кирилла Панова "Microsoft SQL Server 2008: новые средства безопасности и управления" был посвящен двум темам: прозрачному шифрованию и средствам управления на основе политик. Фактически, более подробно, с демонстрациями конкретных вариантов использования обсуждались две новые возможности SQL Server 2008.

Марк Ривкин (Oracle) в этом году отошел от традиции рассказывать об основных чертах новых выпусков СУБД Oracle и выступил с более широким докладом "Тенденции развития коммерческих СУБД", в котором попытался обобщить тенденции, присущие продуктам основных поставщиков СУБД. Он выделил 13 таких тенденций: виртуализация ресурсов и GRID-технологии; ILM (Information LifeCycle Management) в СУБД; самоуправление, самодиагностика, самолечение; Real Application Testing - механизмы промышленного тестирования версий и изменений; совершенствование архитектур максимальной доступности, минимизация времени плановых простоев, модификация приложений и версий СУБД; включение измерения времени в СУБД; новые типы данных (XML, RFID, Semantic Web, геном, медицина, быстрые LOB и т.д.); умные механизмы сжатия и устранения избыточности; совершенствование защиты данных (Data Vault, Audit Vault, Access&Identity); искажение данных; СУБД реального времени с поддержкой баз данных в основной памяти как кэш для коммерческих СУБД; интеграция данных, универсальные и специализированные подходы (динамические DW, BDW - Banking Data Warehouse); включение баз данных в пространство поиска поисковых систем. Трудно сказать, насколько эти тенденции действительно окажутся едиными для всех SQL-ориентированных СУБД, но, похоже, что это некоторый вариант дорожной карты компании Oracle.

С совершенно неожиданным для публики докладом "IBM Information Management : построение высокопроизводительных OLTP систем" выступил Григорий Власов (IBM). Он сказал, что для компаний, нуждающихся в схерхпроизводительных системах категории OLTP (таких компаний немного во всем мире и пока нет в России), не годятся SQL-ориентированные СУБД. По его мнению, для таких систем подходит лишь старейшая СУБД компании IBM IMS, функционирующая на мощных мейнфреймах. Хотя IMS имеет почти 40-летнюю историю, в настоящее время это современная и мощная система, в которой исторически поддерживается иерархическая модель данных. По словам г-на Власова, сейчас IMS - это и лучшая в мире XML-СУБД, поскольку иерархическая модель данных идеально соответствует модели XML, и для IMS имеется полная и эффективная реализация XQuery. На вопрос, какое же место он отводит DB2, Григорий Власов ответил, что DB2 должна поддерживать хранилища данных и аналитическую обработку. Доклад породил в умах участников конференции массу сомнений и недоумений о дальнейшей стратегии компании IBM в России. Впрочем, вполне возможно, что г-н Власов высказал лишь свою частную точку зрения, в пользу чего, в частности, говорит тот факт, что он выступал без слайдов, и какие-либо документальные подтверждения его выступления отсутствуют.

Доклад Бориса Егорова (Intersystems) "Процесс проектирования информационных систем в постреляционной СУБД Cache" был достаточно традиционным для специалистов этой компании. В СУБД Cache поддерживаются четыре разновидности интерфейсов с базами данных, доступные разработчикам приложений: "естественный" навигационный интерфейс на основе доступа к "глобалям" (B-деревьям); объектно-ориентированный интерфейс; SQL-интерфейс и Web-интерфейс. Каждый из этих интерфейсов может оказаться предпочтительным при разработке конкретного приложения, и в каждом случае Intersystems предоставляет соответствующие инструментальные средства.

В докладе про СУБД Линтер "Особенности работы СУБД ЛИНТЕР в операционных системах реального времени", который в этом году представлял Михаил Ермаков, действительно затрагивались только те черты системы, которые связаны с ее использованием в системах (мягкого) реального времени. Впечатляет, что на сегодняшний день СУБД Линтер работает в среде операционных систем QNX 4 и QNX 6, VxWorks, ОС РВ, ОС/9, OS9000, Windows CE, Linux. В системе поддерживается ряд специальных свойств, способствующих достижению характеристик реального времени в приложениях: асинхронный вызов операций SQL, секционирование данных, приоритетность запросов и т.д. Г-н Ермаков также рассказал о планах компании Релэкс по полной, хотя и постепенной переработке ядра СУБД Линтер с использованием принципов микроядра.

Три последних доклада 24-го апреля посвящались СУБД категории open source. С докладом "Firebird в 2008 году: эволюция или революция" традиционно выступил Дмитрий Кузьменко. В эволюции системы автор отнес выход в первом квартале 2008 г. версии системы 2.1, в которой поддерживаются средства мониторинга состояния сервера, расширения SQL (Common Table Expressions, Replace/Merge), временные таблицы, аутентификация в стиле Windows, триггеры уровня БД. Возможной революцией окажется версия 2.5 (и следующая за ней версия 3.0), в которой ожидается поддержка кэша базы данных с размером более 2 гигабайт; поддержка регулярных выражений в условиях раздела WHERE (SIMILAR); расширение списка 64-разрядных дистрибутивов для новых операционных систем; поддержка автономных транзакций, гетерогенных запросов, архитектуры СуперКлассик и т.д.

Дмитрий Ленев (MySQL) выступил с докладом "Новое в MySQL 5.1 и 6.0". Основными направлениями разработки версии MySQL 5.1, выпуск которой намечен на второй квартал 2008 г., докладчик считает средства, облегчающие администрирование баз данных: разделение данных (partitioning), диспетчер событий, новые средства аудита, улучшенные возможности поддержки высокого уровня доступности (в том числе, возможность сохранения части данных в кластерном варианте MySQL на диске) и новые средства манипуляции данных (полнотекстовый поиск, поддержка XPath для доступа к XML-данным). В версии 6.0, выпуск которой планируется на четвертый квартал 2008 г., будет присутствовать возможность использования новой подсистемы управления хранением и транзакциями Falcon. Эта подсистема обеспечивает управление ACID-транзакциями на основе поддержки версий, хорошо масштабируется на многоядерных архитектурах и для некоторых классов приложений является более эффективной, чем InnoDB. Кроме того, в версии 6.0 должна быть реализована возможность оперативного резервного копирования баз данных и улучшены средства оптимизации запросов.

Доклад "Что нового в PostgreSQL 8.3 и другие новости" представляли Николай Самохвалов и Олег Бартунов. Г-н Самохвалов рассказал про основные новые возможности PostgreSQL 8.3. Он выделил четыре категории новшеств, относящиеся, соответственно, к производительности системы, разработке приложений, администрирования баз данных и проектам-спутникам. Производительность системы удалось существенно повысить за счет новой реализации операции UPDATE, не требующей модификации индексов, ключи которых не изменяются; введения асинхронного режима фиксации транзакций; "сглаживания" операции установки контрольной точки; появления возможности синхронного сканирования одной и той же таблицы несколькими транзакциями и т.д. Для разработчиков приложений в версии 8.3 поддерживаются улучшенные возможности полнотекстового поиска; введен тип данных XML и обеспечивается поддержка XPath; реализованы обновляемые курсоры, табличные функции и т.д. В помощь администратору появилась возможность автоматического удаления из базы данных всех объектов, принадлежащих данному пользователю, если сам пользователь удаляется из системы. Наконец, среди проектов-спутников Николай отметил ряд средств, разработанных компанией Skype. О других новостях, относящихся к PostgreSQL, и планах на будущее рассказал Олег Бартунов. Участников конференции очень заинтересовала новость о реализации компанией EnterprizeDB, которая в этом году получила солидное финансирование от компании IBM, open source системы GridSQL, являющейся массивно-параллельным (sharing-nothing) вариантом PostgreSQL. Г-н Бартунов рассказал об ожидаемых возможностях PostgreSQL 8.4, выпуск которой планируется в начале 2009 г.

Второй день работы конференции также начался с двух докладов представителей компании Microsoft. Андрей Хромов выступил с докладом "SQL Server 2008 BI: "Быстрее, выше, сильнее"". Г-н Хромов показал общий стек решений бизнес-аналитики компании Microsoft и отметил, что в основе платформы BI SQL Server 2008 лежат службы интеграции данных, отчетности и анализа данных. В службе интеграции данных SQL Server 2008 обеспечиваются улучшенные возможности выполнения процедуры ETL путем идентификации нужных данных в больших таблицах, снижение объема передаваемых данных за счет передачи только измененных данных, профилирования информации для выявления "грязных" данных. Специальным образом оптимизируются запросы к хранилищам данных. В службе отчетности появились новый дизайнер отчетов, масштабируемый процессор отчетов, возможность отображения и генерации отчетов в Microsoft Word, улучшенная возможность их отображения и генерации в Microsoft Excel и т.д. По поводу службы анализа данных была показана запись эффектной презентации, озвученной Алексеем Шулениным на конференции "Герои среди нас" в марте 2008 г.

Андрей Прохоров выступил с докладом "PerformancePoint Server - центр управления эффективностью бизнеса". Microsoft Office PerformancePoint Server - это приложение для управления эффективностью работы компаний, позволяющее более обоснованно принимать бизнес-решения и осуществлять больший контроль за бизнес процессами. Приложение обеспечивает необходимые средства для управления и контроля эффективности работы компании, включая карты показателей эффективности (scorecards), инструментальные панели (dashboards), управленческую отчетность, аналитику, средства планирования, бюджетирования, прогнозирования и консолидации. PerformancePoint Server позволяет строить прогнозы, осуществлять планирование и бюджетирование, а также производить оперативный мониторинг текущих показателей и сравнение запланированной и фактически достигнутой эффективности.

Доклад "Стратегия и продукты Oracle в области бизнес-анализа" представила Ольга Горчинская. Как и компании Microsoft, лозунгом BI-направления Oracle является "Pervasive BI", что г-жа Горчинская переводит как "BI для всех". Аналитическая платформа Oracle теперь представляется в виде трех слоев, нижним из которых является слой хранилищ и витрин данных, средним - слой инструментов бизнес-анализа и верхним - слой приложений управления эффективностью бизнеса и приложений BI. В своем выступлении Ольга практически не касалась верхнего уровня, отметив лишь, что приложения управления эффективностью бизнеса почти целиком взяты Oracle из продуктов приобретенной ей в прошлом году компании Hyperion. Что касается низшего слоя, основную роль в нем играет СУБД Oracle 11.g, в которой поддерживаются новые средства повышения производительности и уровня масштабируемости, обеспечивается ряд новых и очень мощных аналитических функций и поддерживаются развитые встроенные средства интеллектуального анализа данных (data mining). Для эффективной поддержки OLAP Oracle возлагает большие надежды на сервер многомерных данных Hyperion Essbase, являющийся теперь собственностью компании Oracle. Основой среднего слоя платформы является Siebel Analytics Server, перешедший в собственность компании Oracle после приобретения ею компании Siebel.

Евгений Велесевич (Cognos) выступил с докладом "Eдиная информационно-аналитическая система организации на платформе IBM Cognos 8 Business Intelligence". Известно, что в начале этого года компания Cognos была поглощена компанией IBM, и участники конференции ожидали услышать в этом докладе какие-нибудь новости о будущем основного продукта Cognos и перспективах его интеграции с продуктами IBM. Однако г-н Веселевич заявил, что Cognos настолько активно контактировала с IBM на протяжении многих лет, что им незачем интегрироваться, и что объединение повлияет только на стратегию распространения и продаж продукта. Фактически, доклад Евгения Веселевича оказался повторением прошлогоднего доклада про Cognos 8 Business Intelligence, сделанного на конференции в прошлом году Андреем Ведешиным из Robertson & Blums Corporation.

Андрей Грачев сделал доклад "Новые возможности BI в СУБД Cache". Свой доклад г-н Грачев начал с того, что на рынке практически не осталось независимых поставщиков решений BI и ETL. По его мнению, подтверждаемому мнением аналитиков, это лишает потребителей возможностей создания конечных аналитических систем из наиболее подходящих для них компонентов. Далее Андрей перешел к рассказу о решении BI компании Intersystems. В отличие от подходов других компаний, это решение основывается на приобретенной Intersystems системе DeepSee, изготовленной одним из партнеров Intersystems компанией Speedminer на основе СУБД Cache. Для хранения многомерных кубов применяется базовая структура хранения данных СУБД Cache на основе деревьев. DeepSee можно будет использовать непосредственно с Cache или поверх интеграционной платформы Ensemble. В последнем случае для DeepSee будут доступны все возможности доступа к внешним данным, поддерживаемые адаптерами Ensemble. Продукт DeepSee был неофициально объявлен в конце марта на конференции InterSystems DEVCON2008, но дата его официального выпуска, насколько я понимаю, пока не определена.

Валерий Юдин в своем докладе "Система поддержки принятия решений для практикующих врачей" рассказал о применении технологии вывода по прецедентам, примененной при создании системы "Спутник врача". При рассмотрении нового случая система находит один или несколько похожих прецедентов и советует врачу использовать их решение, возможно, адаптировав его к текущему случаю. После того, как данный случай будет обработан, он вносится в базу прецедентов вместе со своим решением для последующего использования в будущем. В отличие от применяемых в медицине экспертных систем, "Спутник врача" не навязывает врачу решение, а лишь рекомендует учесть найденные прецеденты.

На этом часть второго дня работы конференции, посвященная анализу данных, была завершена, и совсем на другую тему перед участниками выступил профессор СПбГУ и консультант финской компании @Business OY Борис Новиков, представивший доклад "Практические методы и приемы настройки приложений баз данных". В течение многих лет г-н Новиков сам занимается настройкой приложений баз данных с целью оптимизации их производительности и собирается сведения о проблемах и решениях, применяемых в других компаниях. По мнению Бориса, основные проблемы, связанные с производительностью приложений, проистекают из недостаточной квалификации их разработчиков, использования ими паттернов объектно-ориентированной разработки в случаях, для которых они не были предназначены. Действия, (неумышленно) совершаемые разработчиками для снижения производительности приложений баз данных, докладчик называет "пессимизацией" приложений. На ряде примеров в докладе были продемонстрированы приемы оптимизации "пессимизированных" приложений.

Наконец, завершил конференцию ваш покорный слуга, выступивший с докладом "Кризис технологий СУБД и пути его преодоления".

В области СУБД имеет место кризис. "Безразмерные" универсальные системы, поставляемые основными производителями СУБД, с каждым выпуском становятся все более сложными. В каждом конкретном приложении используются доли процентов функциональных возможностей этих систем. Сложность стандарта языка SQL делает его непостижимым и практически не реализуемым.

Майкл Стоунбрейкер предлагает революционный путь к преодолению этого кризиса за счет перехода к специализированным системам управления данными, ориентированным на ограниченные классы приложений.

Однако имеются сомнения в том, что пользователи баз данных и разработчики приложений действительно желают такой революции, а также в том, что предложения и разработки Стоунбрейкера действительно обеспечивают реальную основу для революционных изменений технологии. Подробности см. в заметке "Универсальность и специализация: время разбивать камни?".

Конференция прошла как никогда активно. Каждому докладчику задавалась масса вопросов, и времени на Q&A не хватало. Тем не менее, и докладчики, и слушатели остались довольны, но просили на следующей конференции более правильно планировать время и, может быть, все-таки перейти к трехдневному формату конференции. Нужно подумать… Возможно, я не очень объективен в своей оценке, но мне конференция очень понравилась. Даже мне, хотя в целом я знал, о чем будут говорить докладчики, было очень интересно. Даже мне, хотя я командовал временем, этого времени на вопросы не хватало. Даже мне не удалось хорошо поговорить ни с докладчиками, ни со слушателями. Бог даст, следующая конференция будет (еще) лучше.


Страница сайта http://www.interface.ru
Оригинал находится по адресу http://www.interface.ru/home.asp?artId=16759