Таблица фактов

редактировать
Принцип хранилища данных, таблица, состоящая из измерений, показателей или фактов бизнес-процесса Пример звездообразной схемы ; центральная таблица - это таблица фактов

В хранилищах данных таблица фактов состоит из измерений, показателей или фактов бизнес-процесса .. Он расположен в центре схемы звезды или схемы снежинки, окруженной таблицами измерений. Если используется несколько таблиц фактов, они организованы в виде схемы совокупности фактов . Таблица фактов обычно имеет два типа столбцов: те, которые содержат факты, и те, которые являются внешним ключом для таблиц измерений. Первичный ключ таблицы фактов обычно представляет собой составной ключ, состоящий из всех внешних ключей. Таблицы фактов содержат содержимое хранилища данных и хранят различные типы мер, такие как аддитивные, неаддитивные и полуаддитивные.

Таблицы фактов предоставляют (обычно) дополнительные значения, которые действуют как независимые переменные, по которым анализируются размерные атрибуты. Таблицы фактов часто определяются по их содержанию. Структура таблицы фактов представляет собой наиболее элементарный уровень, с помощью которого могут быть определены факты. Суть таблицы фактов продаж может быть указана как «объем продаж по дням по продуктам по магазинам». Таким образом, каждая запись в этой таблице фактов однозначно определяется днем, продуктом и магазином. Другие измерения могут быть членами этой таблицы фактов (например, местоположение / регион), но они ничего не добавляют к уникальности записей фактов. Эти «партнерские измерения» позволяют получить дополнительные срезы независимых фактов, но обычно обеспечивают понимание на более высоком уровне агрегирования (в регионе много магазинов).

Содержание
  • 1 Пример
  • 2 Типы показателей
  • 3 Типы таблиц фактов
  • 4 Этапы создания таблицы фактов
  • 5 Ссылки
Пример

Если бизнес-процесс - это продажи, тогда соответствующая таблица фактов обычно будет содержать столбцы, представляющие оба, и агрегаты в таких строках, как:

  • 12 000 долларов, что означает «продажи магазина в Нью-Йорке за 15- Январь-2005 ».
  • 34 000 долларов США, что означает« продажи магазина в Лос-Анджелесе за 15 января 2005 года »
  • 22 000 долларов США, являющиеся« продажами магазина в Нью-Йорке за 16 января 2005 года »
  • 21 000 долл. США, что составляет «среднесуточные продажи магазина в Лос-Анджелесе за январь 2005 г.»
  • 65 000 долл. США, что «среднедневные продажи магазина в Лос-Анджелесе за февраль 2005 г.»
  • 33 000 долл. США, представляющий собой «среднесуточные продажи магазина в Лос-Анджелесе за 2005 год»

«Среднесуточные продажи» - это показатель, который хранится в таблице фактов. Таблица фактов также содержит внешние ключи из таблиц измерений, где временной ряд (например, даты) и другие измерения (например, местоположение магазина, продавец, товар) хранятся.

Все внешние ключи между таблицами фактов и измерений должны быть суррогатными ключами, а не повторно используемыми ключами из рабочих данных.

Типы мер
  • Аддитивные - меры, которые могут быть добавлены по любому измерению.
  • Неаддитивные - меры, которые нельзя добавить ни по одному измерению.
  • Полусаддитивные - меры, которые могут быть добавлены к некоторым измерениям.

Таблица фактов может содержать факты уровня детализации или факты, которые были агрегированы (таблицы фактов, содержащие агрегированные факты, часто вместо этого называются сводными таблицами).

Следует проявлять особую осторожность при работе с соотношениями и процентами. Одно из хороших правил проектирования - никогда не хранить проценты или отношения в таблицах фактов, а только вычислять их в инструменте доступа к данным. Таким образом, сохраняйте в таблице фактов только числитель и знаменатель, которые затем можно агрегировать, а агрегированные сохраненные значения затем можно использовать для вычисления отношения или процента в инструменте доступа к данным.

В реальном мире можно иметь таблицу фактов, которая не содержит мер или фактов. Эти таблицы называются «таблицами фактов без фактов» или «таблицами соединений ».

Таблицы фактов, не содержащие фактов, могут использоваться для моделирования отношений «многие ко многим» или для захвата отметок времени событий.

Типы таблиц фактов

Есть четыре основных события измерения, которые характеризуют все таблицы фактов.

Транзакционная
Транзакционная таблица является самой простой и фундаментальной. Степень зерна, связанная с таблицей фактов транзакции, обычно указывается как «одна строка на строку в транзакции», например, каждая строка в квитанции. Обычно таблица фактов транзакций содержит данные самого детализированного уровня, поэтому с ней связано большое количество измерений.
Периодические снимки
Периодические снимки, как следует из названия, создает «картину момента», где моментом может быть любой определенный период времени, например сводная информация об эффективности продавца за предыдущий месяц. Таблица периодических снимков зависит от таблицы транзакций, так как для получения выбранных выходных данных производительности требуются подробные данные, содержащиеся в таблице фактов транзакций.
Накопление снимков
Этот тип фактов Таблица используется для отображения активности процесса, имеющего четко определенные начало и конец, например, обработка заказа. Заказ проходит определенные этапы, пока не будет полностью обработан. По мере выполнения шагов по выполнению заказа соответствующая строка в таблице фактов обновляется. Накопленная таблица моментальных снимков часто имеет несколько столбцов с датами, каждый из которых представляет веху в процессе. Поэтому важно иметь запись в связанном измерении даты, которая представляет неизвестную дату, поскольку многие даты вех неизвестны на момент создания строки.
Временные снимки
Применяя теорию и методы моделирования темпоральной базы данных, таблица фактов временного снимка позволяет получить эквивалент ежедневных снимков, фактически не имея ежедневных снимков. Он вводит концепцию временных интервалов в таблицу фактов, что позволяет сэкономить много места, оптимизировать производительность, позволяя конечному пользователю иметь логический эквивалент «картины момента», которая его интересует.
Шаги в разработка таблицы фактов
  • Определите бизнес-процесс для анализа (например, продажи).
  • Определите меры фактов (доллар продаж), задав такие вопросы, как «какое количество X имеет отношение к бизнес-процессу?», заменяя X различными вариантами, которые имеют смысл в контексте бизнеса.
  • Определите измерения для фактов (измерение продукта, измерение местоположения, измерение времени, измерение организации), задавая вопросы, которые имеют смысл в контексте бизнеса, например "анализировать по X", где X заменяется объектом тестирования.
  • Перечислите столбцы, описывающие каждое измерение (название региона, название филиала, название бизнес-единицы).
  • Определите самый низкий уровень (степень детализации) сводки в таблице фактов (например, кукла продаж ars).

Альтернативным подходом является четырехэтапный процесс проектирования, описанный в Кимбалле: выбор бизнес-процесса, декларирование зернистости, определение размеров, идентификация фактов.

Ссылки
Последняя правка сделана 2021-05-20 08:51:24
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте