Исходный автор (авторы) | Arbor Software Corporation |
---|---|
Стабильный выпуск | 19.3 / сентябрь 2019 г.; 1 год назад (2019-09) |
Операционная система | Windows, Linux, IBM AIX, HP-UX, Solaris |
Тип | Многомерная база данных |
Лицензия | Собственный |
Веб-сайт | oracle.com / technetwork / middleware / essbase |
Essbase - это многомерная система управления базами данных (MDBMS), которая предоставляет платформу многомерной базы данных, на которой можно создавать аналитические приложения. Essbase начиналась как продукт компании Arbor Software, которая объединилась с Hyperion Software в 1998 году. Oracle Corporation приобрела Hyperion Solutions Corporation в 2007 году, а с 2009 года Oracle продавала Essbase как «Oracle Essbase» ( локальный продукт), а с недавних пор Essbase предлагается как часть Oracle Analytics Cloud. До конца 2005 года IBM также продавала OEM-версию Essbase как DB2 OLAP Server.
Исследователь баз данных Э. Ф. Кодд ввел термин «оперативная аналитическая обработка» (OLAP ) в техническом документе, в котором изложены двенадцать правил для аналитических систем (намек на его более ранний знаменитый набор двенадцати правил определение реляционной модели ). В этом техническом описании, опубликованном Computerworld, было несколько явных ссылок на функции Essbase, и когда позже выяснилось, что Кодда спонсировала Arbor Software, Computerworld отозвала этот документ.
В В отличие от «обработки транзакций в режиме онлайн» (OLTP ), OLAP определяет технологию базы данных, оптимизированную для обработки человеческих запросов, а не транзакций. Результатом такой ориентации стало то, что многомерные базы данных ориентировали свои требования к производительности на другой набор тестов (, APB-1), чем на RDBMS (Совет по производительности обработки транзакций (TPC)).
Hyperion переименовал многие из своих продуктов в 2005 году, дав Essbase официальное название Hyperion System 9 BI + Analytic Services, но это новое название в значительной степени игнорировалось практиками. Позднее торговая марка Essbase была возвращена к официальному названию продукта в маркетинговых целях, но серверное программное обеспечение по-прежнему носило название «Аналитические услуги», пока оно не было включено в продукт Oracle Business Intelligence Foundation Suite (BIFS).
В августе 2005 года журнал Information Age назвал Essbase одной из 10 самых влиятельных технологических инноваций за предыдущие 10 лет, наряду с Netscape, BlackBerry, Google, виртуализация, передача голоса по IP (VOIP ), Linux, XML, процессор Pentium и ADSL. Редактор Кенни Макивер сказал: «Hyperion Essbase была технологией многомерных баз данных, которая поместила онлайн-аналитическую обработку на карту бизнес-аналитики. Она стимулировала создание множества конкурирующих продуктов OLAP - и миллиардов кубов OLAP».
Essbase изначально была разработана для решения проблем масштабируемости, связанных с таблицами, такими как Lotus 1-2 -3 и Microsoft Excel. Действительно, в патенте (срок действия которого истек) Essbase использует электронные таблицы в качестве мотивирующего примера, чтобы проиллюстрировать необходимость в такой системе.
В этом контексте «многомерный» относится к представлению финансовых данных в формате электронной таблицы.. Типичная электронная таблица может отображать временные интервалы вдоль заголовков столбцов и имена учетных записей в заголовках строк. Например:
Ян | Феб | Мар | Всего | |
---|---|---|---|---|
Количество | 1000 | 2000 | 3000 | 6000 |
Продажи | $100 | $200 | $ 300 | 600 $ |
Расходы | $ 80 | $160 | 240 $ | 480 $ |
Прибыль | $20 | $40 | 60 $ | 120 $ |
Если пользователь хочет разбить эти значения по регионам, например, это обычно включает дублирование этой таблицы в нескольких электронных таблицах:
|
|
|
Альтернативное представление этой структуры потребовало бы трехмерной сетки электронной таблицы, что породило идею о том, что «Время», «Учетная запись» и «Регион» являются размеры. По мере добавления в систему дополнительных измерений становится очень трудно поддерживать электронные таблицы, которые правильно представляют многомерные значения. Многомерные базы данных, такие как Essbase, предоставляют хранилище данных для значений, которые существуют, по крайней мере, концептуально, в многомерном «гиперкубе ».
По мере увеличения количества и размера измерений разработчики многомерных баз данных все чаще сталкиваются с техническими проблемами при физическом представлении данных. Допустим, в приведенный выше пример добавлены измерения «Клиент» и «Продукт»:
Измерение | Количество значений измерения |
---|---|
Счета | 4 |
Время | 4 |
Регион | 3 |
Клиент | 10,000 |
Продукт | 5,000 |
Если бы многомерная база данных зарезервировала пространство для хранения для всех возможных значений, ей нужно было бы хранить 2 400 000 000 (4 × 4 × 3 × 10 000 × 5 000) ячеек. Если программное обеспечение отображает каждую ячейку как 64-битное значение с плавающей запятой, это соответствует требованиям к памяти не менее 17 гигабайт (ровно 19,2 ГБ). На практике, конечно, количество комбинаций «Клиент» и «Продукт», которые содержат значимые значения, будет составлять крошечное подмножество всего пространства. Это свойство многомерных пространств называется разреженность.
Системы OLAP обычно обеспечивают несколько уровней детализации в каждом измерении, упорядочивая элементы каждого измерения в одно или несколько иерархии. Измерение времени, например, может быть представлено в виде иерархии, начинающейся с «Общее время» и разбитой на несколько лет, затем кварталов, затем месяцев. Параметр «Счета» может начинаться с «Прибыль», которая подразделяется на «Доход» и «Расходы» и так далее.
В приведенном выше примере, если «Продукт» представляет отдельный продукт SKU, аналитики могут также захотеть составить отчет с использованием таких агрегатов, как «Группа продуктов», «Семейство продуктов», «Линия продуктов» и т. д. Аналогично, для «Заказчика» естественные агрегаты могут упорядочивать клиентов по географическому положению или отрасли.
Количество агрегированных значений, подразумеваемых набором входных данных, может стать удивительно большим. Если измерения «Клиент» и «Продукт» фактически имеют шесть «поколений», то одна точка данных влияет на 36 (6 × 6) агрегированных значений. Отсюда следует, что если все эти агрегированные значения должны быть сохранены, необходимый объем пространства пропорционален произведению глубины всех агрегированных измерений. Для больших баз данных это может привести к тому, что эффективные требования к хранилищу во много сотен раз превысят размер агрегируемых данных.
Начиная с версии 7, Essbase поддерживает два «варианта хранения», которые используют разреженность для минимизации объема физической памяти и дискового пространства, необходимого для представления больших многомерных пробелы. В патенте Essbase описан оригинальный метод, направленный на уменьшение объема необходимой физической памяти без увеличения времени, необходимого для поиска тесно связанных значений. С введением альтернативных вариантов хранения в маркетинговых материалах это было названо Вариант блочного хранения (Essbase BSO ), позже именуемый Essbase Analytics .
Короче говоря, Essbase требует разработчик пометит размеры как "плотные" или "разреженные". Затем система упорядочивает данные для представления гиперкуба в «блоки», где каждый блок представляет собой многомерный массив, состоящий из «плотных» измерений, и пространство выделяется для каждой потенциальной ячейки в этом блоке. Редкость используется, потому что система создает блоки только при необходимости. В приведенном выше примере предположим, что разработчик пометил «Учетные записи» и «Время» как «плотные», а «Регион», «Клиент» и «Продукт» - как «разреженные». Если имеется, скажем, 12 000 комбинаций региона, клиента и продукта, которые содержат данные, тогда будет создано только 12 000 блоков, причем каждый блок будет достаточно большим, чтобы хранить все возможные комбинации счетов и времени. Таким образом, количество сохраняемых ячеек составляет 192000 (4 × 4 × 12000), что требует менее 2 гигабайт памяти (точно 1536 МБ) плюс размер индекса, используемого для поиска соответствующих блоков.
Поскольку база данных скрывает эту реализацию от интерфейсных инструментов (т. Е. Отчет, который пытается получить данные из несуществующих ячеек, просто видит "нулевые" значения), по всему гиперкубу можно перемещаться естественным образом, и он можно загружать значения в любую ячейку в интерактивном режиме.
Пользователи могут указывать вычисления в Essbase BSO как:
Первый метод (агрегирование измерений) осуществляется неявно посредством сложения или выборочной маркировки ветвей иерархии, которые необходимо вычесть, умножить, разделены или проигнорированы. Кроме того, результат этой агрегации может быть сохранен в базе данных или рассчитан динамически по запросу - члены должны быть помечены как «Сохраненные» или «Динамические вычисления». чтобы указать, какой метод будет использоваться.
Второй метод (сохраненные вычисления) использует формулу для каждого вычисляемого элемента измерения - когда Essbase вычисляет этот элемент, результат сохраняется для этого элемента точно так же, как значение данных.
Третий метод (динамическое вычисление) задается точно в том же формате, что и сохраненные вычисления, но вычисляет результат, когда пользователь обращается к значению, адресованному этим членом; система не хранит такие рассчитанные значения.
Четвертый метод (сценарии вычислений) использует процедурный язык программирования, специфичный для механизма вычислений Essbase. Этот тип вычислений может воздействовать на любое значение данных в гиперкубе и, следовательно, может выполнять вычисления, которые нельзя выразить простой формулой.
Сценарий вычислений также должен быть выполнен для запуска вычисления агрегированных значений или сохраненных вычислений, как описано выше - для выполнения этого типа вычислений можно использовать встроенный сценарий вычислений (так называемый «расчет по умолчанию»)..
Хотя блочное хранилище эффективно минимизирует требования к хранилищу, не влияя на время извлечения, оно имеет ограничения в обработке агрегированных данных в больших приложениях, что мотивирует введение второго хранилища Engine с именем Aggregate Storage Option (Essbase ASO ) или, в последнее время, Enterprise Analytics . Этот вариант хранения делает базу данных более похожей на базу данных OLAP, например SQL Server Analysis Services.
После загрузки данных Essbase ASO не сохраняет никаких агрегированных значений, а вместо этого вычисляет их по запросу. Для больших баз данных, где время, необходимое для генерации этих значений, может стать неудобным, база данных может материализовать одно или несколько агрегированных "представлений", состоящих из одного агрегированного уровня из каждого измерения (например, база данных может вычислять все комбинации пятого генерация продукта с третьим поколением клиента), и эти представления затем используются для генерации других агрегированных значений, где это возможно. Этот процесс можно частично автоматизировать, когда администратор указывает объем дискового пространства, которое может быть использовано, а база данных создает представления в соответствии с фактическим использованием.
Этот подход имеет серьезный недостаток в том, что куб не может рассматриваться для целей вычислений как один большой гиперкуб, поскольку агрегированные значения нельзя напрямую контролировать, поэтому обратная запись из интерфейсных инструментов ограничена и сложна. вычисления, которые не могут быть выражены как выражения MDX, невозможны.
Essbase ASO может определять вычисления как:
Первый метод (агрегирование измерений) в основном дублирует алгоритм, используемый Essbase BSO.
Второй метод (динамические вычисления) оценивает выражения MDX по элементам измерения.
Большинство пользователей Essbase работают с данными Essbase через надстройку для Microsoft Excel (ранее также Lotus 1-2-3 ), известный как Smart View. Надстройка Essbase - это стандартный подключаемый модуль к Microsoft Excel, который создает дополнительное меню, которое можно использовать для подключения к базам данных Essbase, получения или записи данных и навигации по измерениям куба («Увеличение», «Смещение» и т. Д.).
В 2005 году Hyperion начал предлагать инструмент визуализации под названием Hyperion Visual Explorer (HVE), который был OEM от Tableau Software. Tableau Software возникла в Стэнфордском университете как исследовательский проект, спонсируемый правительством, для изучения новых способов взаимодействия пользователей с реляционными и OLAP базами данных.. Hyperion и Tableau построили вместе первые версии Tableau Software, которые были разработаны специально для многомерных (OLAP) баз данных. Oracle быстро расторгла договоренность OEM с Tableau Software вскоре после приобретения Hyperion в 2007 году.
Большинство других известных поставщиков аналитики предоставляют пользовательские приложения с поддержкой Essbase и включают;
Предыдущие предложения Hyperion получили новые имена, как указано ниже:
Предыдущие предложения Hyperion | Предложения Hyperion System 9 BI + |
---|---|
Hyperion Essbase ASO | Enterprise Analytics |
Hyperion Essbase BSO | Essbase Analytics |
Hyperion Analyzer | Web Analysis |
Hyperion Reports | Financial Reporting |
Hyperion Intelligence | Interactive Reporting |
Hyperion SQR | Production Reporting |
Hyperion Metrics Builder | Enterprise ise Metrics |
API доступны для C, Visual Basic и Java, а поддержка встроенных сценариев доступна для Perl. Стандартизированный протокол XML для анализа может запрашивать источники данных Essbase, используя язык MDX.
В 2007 году корпорация Oracle начала объединять инструменты Hyperion BI в Oracle Business Intelligence Enterprise Edition Plus.
Несколько стандартных интерфейсов могут управлять приложениями Essbase:
С 2017 года Essbase Cloud предлагает был доступен как часть Oracle Analytics Cloud (OAC), набора аналитических решений, который включает отчеты и информационные панели, визуализацию данных, встроенную подготовку данных и мобильные устройства.
Есть несколько важных конкуренты среди OLAP, аналитические продукты Essbase (HOLAP / MOLAP) на рынке, среди них SAP BPC, Microsoft SQL Server Microsoft Analysis Services, (MOLAP, HOLAP, ROLAP), IBM Cognos (ROLAP), IBM / Cognos / Applix TM1 (MOLAP), Oracle OLAP (ROLAP / MOLAP), MicroStrategy (ROLAP) и EXASolution (ROLAP).
Также обратите внимание, что из перечисленных выше конкурентов, включая Essbase, все используют разнородные реляционные (Microsoft SQL Server, Oracle, IBM DB / 2, TeraData, Access и т. Д.) Или нереляционные. источники данных (Excel, текстовые файлы, файлы CSV и т. д.) для подачи кубов (факты и размерные данные), за исключением Oracle OLAP, который может использовать только реляционный источник Oracle.
С 2009 года две опции могут экспортировать кубы Essbase в другие форматы:
Сервер IBM DB2 OLAP прекращает поддержку 31 января 2007 г.
.