SAP предлагает средство эффективной обработки и анализа больших массивов данных в реальном времени

Источник: Sybase

SAP AG (NYSE: SAP) объявила об интеграции Apache Hadoop в системы хранилищ данных реального времени, предложив новое комплексное решение для обработки "больших данных" и стратегию вывода на рынок в альянсе с компаниями Cloudera, Hitachi Data Systems, Hortonworks, HP и IBM. Продукт базируется на флагманской платформе SAP HANA и включает в себя сервер SAP Sybase IQ, ПО SAP Data Integrator и средства бизнес-аналитики SAP BusinessObjects. Это всеобъемлющее решение для анализа больших массивов накопленных данных в реальном времени, поступающих из разнообразных источников. 

В сферах, где некогда традиционные СУБД доминировали над корпоративными системами аналитических хранилищ данных, Hadoop набирает популярность среди компаний, нуждающихся в эффективных и доступных средствах хранения и обработки данных, объем которых постоянно увеличивается. При этом компаниям необходима интеграция Hadoop с их бизнес-аналитическими системами и налаженными процедурами работы с хранилищами данных. Комплексное решение для обработки "больших данных", подкрепленное альянсами с вендорами Hadoop по выводу на рынок, дает клиентам SAP законченную стратегию аналитической обработки данных в хранилищах. Эта стратегия сочетает потенциал Hadoop со скоростью, свойственной обработке баз данных в оперативной памяти и поколоночной организации данных.

Компания Mitsui Knowledge Industry, специализирующаяся на биоинформатике и геномном анализе, создала аналитическую базу данных реального времени, в которой на базе SAP HANA реализуются сложные алгоритмы итеративных расчетов геномных последовательностей, при этом предварительная обработка данных выполняется в Hadoop. Такое решение позволило сократить время анализа генома с нескольких дней до нескольких минут. Всемирный лидер в области исследований цифрового пространства компания comScore с помощью Hadoop обрабатывает терабайты данных каждый день. Результаты загружаются в корпоративное хранилище данных SAP Sybase IQ, где становятся доступны для анализа тысячам клиентов comScore с помощью средств самообслуживания.

"Наша задача - помочь организациям построить высокопроизводительное корпоративное хранилище данных, сочетающее мощь анализа в реальном времени с инфраструктурой обработки Hadoop, - сказал Стив Лукас (Steve Lucas), глобальный исполнительный вице-президент и генеральный менеджер подразделения "Database and Technology" фирмы SAP. - Благодаря новым средствам обработки "больших данных", выдающим результаты с беспрецедентной быстротой, клиенты могут выявлять и измерять недоступные ранее информационные сигналы в самых разных источниках данных, получая и используя важнейшую бизнес-информацию".

Совмещая скорость, масштаб, гибкость и доступность, необходимые для полного использования потенциала больших массивов данных, SAP предлагает следующие решения, интегрированные с Hadoop - как в едином пакете, так и по отдельности:

  • СУБД SAP HANA;
  • СУБД с поколоночным хранением и средство организации корпоративных хранилищ данных SAP Sybase IQ;
  • SAP Data Integrator;
  • инструментарий SAP BusinessObjects.

Клиенты SAP могут включить Hadoop в свои системы бизнес-аналитики и хранилищ данных разными способами, проведя интеграцию сообразно потребностям. С помощью SAP Data Integrator можно считывать данные из распределенных файловых систем Hadoop (HDFS) или баз данных Hive и выборочно загружать их в SAP HANA или SAP Sybase IQ, так что пользователи бизнес-аналитических систем гарантированно смогут использовать для работы с данными свои привычные средства аналитики и отчетности. Кроме того, можно выдавать федеративные запросы к совокупности систем SAP Sybase IQ и Hadoop environments, либо же запускать задачи MapReduce в среде массово-параллельной обработки SAP Sybase IQ, используя встроенную функциональность. Наконец, пользователи SAP BusinessObjects BI могут выдавать запросы к системе Hive - таким образом, бизнес-аналитики получают возможность работать со системой Hadoop непосредственно.

SAP в альянсе с основными поставщиками Hadoop-сервисов и услуг поддержки

Чтобы упростить организациям задачу создания решений по обработке больших массивов данных, в которых используется платформа SAP для обработки данных в реальном времени и Hadoop, члены организованного SAP партнерского альянса в сотрудничестве друг с другом разрабатывают рыночные стратегии и налаживают организованное взаимодействие с клиентами. Являясь ведущими поставщиками программ, систем и сервисов управления данными на базе Hadoop, а также образовательных услуг, компании Cloudera, Hitachi Data Systems, Hortonworks, HP и IBM помогут клиентам SAP быстро развернуть решения по обработке больших массивов данных, сочетающие обработку баз данных в реальном времени и Hadoop.


Страница сайта http://www.interface.ru
Оригинал находится по адресу http://www.interface.ru/home.asp?artId=30954