Хранилище метаданных

редактировать

Хранилище метаданных представляет собой базу данных, созданную для хранения метаданных. Метаданные - это информация о структурах, которые содержат фактические данные. Метаданные часто называют «данными о данных», но это вводит в заблуждение. Профили данных являются примером реальных «данных о данных». Метаданные добавляют к этому определению еще один уровень абстракции - это данные о структурах, содержащих данные. Метаданные могут описывать структуру любых данных любой тематики, хранящихся в любом формате.

Хорошо спроектированный репозиторий метаданных обычно содержит данные, выходящие далеко за рамки простых определений различных структур данных. Типичные репозитории хранят от десятков до сотен отдельных фрагментов информации о каждой структуре данных.

Сравнение метаданных пары элементов данных - одного цифрового и одного физического - проясняет, что такое метаданные:

Во-первых, цифровой: для данных, хранящихся в базе данных, может быть таблица с названием «Пациент» с множеством столбцов, каждая из которых содержит данные, описывающие разные атрибуты каждого пациента. Один из этих столбцов может называться «Имя_Пациента». Какие метаданные относятся к столбцу, который содержит фактические фамилии пациентов в базе данных? Мы уже использовали два элемента: имя столбца, содержащего данные (Patient_Last_Name) и имя таблицы, содержащей столбец (Patient). Другие метаданные могут включать максимальную длину фамилии, которая может быть введена, требуется ли фамилия (можно ли иметь пациента без Patient_Last_Name?), И преобразует ли база данных любые фамилии, введенные в нижнем регистре, в верхний регистр. Метаданные безопасности могут отображать ограничения, которые ограничивают круг лиц, которые могут просматривать эти имена.

Во-вторых, физический: данные, хранящиеся в обычной библиотеке, имеют много томов и могут иметь различные носители, включая книги. Метаданные о книгах будут включать ISBN, Binding_Type, Page_Count, Author и т. Д. В Binding_Type метаданные будут включать возможные привязки, материал и т. Д.

Эта контекстная информация бизнес-данных включает в себя значение и содержание, управляющие политики, технические атрибуты, преобразующие спецификации и программы, которые манипулируют.

СОДЕРЖАНИЕ

  • 1 Определение
  • 2 Репозиторий против реестра
  • 3 Причина использования
  • 4 Дизайн
    • 4.1 Сущность-отношения / объектно-ориентированный
  • 5 См. Также
  • 6 Ссылки

Определение

Репозиторий метаданных отвечает за физическое хранение и каталогизацию метаданных. Данные в репозитории метаданных должны быть общими, интегрированными, текущими и историческими. Generic: метамодель должна хранить метаданные в виде общих терминов вместо того, чтобы хранить их определенным для конкретного приложения способом, чтобы при изменении стандарта вашей базы данных с одного продукта на другой физическая метамодель репозитория метаданных не нуждалась в изменении. Интеграция репозитория метаданных позволяет интегрировать метаданные всех областей бизнеса: охватывая все домены и предметные области организации. В репозитории метаданных должны быть доступны текущие и исторические метаданные. Репозитории метаданных раньше назывались словарем данных.

С переходом потребности в использовании метаданных для бизнес-аналитики увеличились, так же как и объем хранилища метаданных. Более ранние словари данных - это самое близкое место для взаимодействия технологий с бизнесом. Словари данных представляют собой совокупность репозитория метаданных на начальных этапах, но по мере увеличения объема бизнес-глоссарий и их тегов до различных флагов состояния появились в бизнес-части, в то время как потребление технологических метаданных, их происхождение и связи сделали репозиторий источником для ценные отчеты, которые объединяют бизнес и технологии и помогают упростить принятие решений по управлению данными, а также оценить стоимость изменений.

Хранилище метаданных исследует управление данными в масштабе предприятия, качество данных и управление основными данными (включая основные данные и справочные данные) и объединяет это богатство информации с интегрированными метаданными по всей организации, чтобы обеспечить систему поддержки принятия решений для структур данных, даже если он отражает только конструкции потребляются из различных систем.

Репозиторий против реестра

Основная статья: Реестр метаданных

Репозиторий имеет дополнительные функции по сравнению с реестром. Хранилище метаданных не только хранит метаданные, такие как реестр метаданных, но также добавляет связи со связанными типами метаданных. Метаданные, когда они связаны в потоке от точки входа в организацию до результатов, рассматриваются как происхождение этой точки данных. Метаданные, когда они связаны с другими связанными типами метаданных, называются связями. Предоставляя взаимосвязи со всеми точками метаданных в организации и поддерживая их целостность с архитектурой для обработки изменений, репозиторий метаданных предоставляет базовый материал для понимания всего потока данных, их определений и их влияния. Также важной особенностью является сохранение контроля версий, хотя это противопоставление открыто для обсуждения. Эти определения все еще развиваются, поэтому точность определений требует уточнения.

Цель реестра - определить элемент метаданных и поддерживать его в масштабах всей организации. А модели данных и другие группы управления данными обращаются к реестру для внесения любых изменений. В то время как репозиторий метаданных получает метаданные из различных систем метаданных в организациях и отражает то, что находится в восходящем направлении. Репозиторий никогда не выступает в качестве восходящего потока, в то время как реестр используется в качестве восходящего потока для изменений метаданных.

Причина использования

Репозиторий метаданных позволяет объединить всю структуру контейнеров данных организации в одно интегрированное место. Это открывает множество полезной информации для принятия взвешенных бизнес-решений. Этот инструмент использует одну общую форму модели данных для интеграции всех моделей, что позволяет объединить все приложения и программы организации в один формат. Кроме того, применение бизнес-определений и бизнес-процессов сближает бизнес и технологии, что помогает организациям составлять надежные дорожные карты с определенными целями. Обладая единой информацией, бизнес будет иметь больший контроль над изменениями и сможет проводить анализ воздействия инструмента. Обычно бизнес тратит много времени и денег на принятие решений, основанных на обнаружении и исследовании последствий для внесения изменений или добавления новых структур данных или удаления структур в управлении данными организации. Благодаря структурированному и хорошо обслуживаемому репозиторию перемещение продукта от идеи к доставке занимает минимум времени (учитывая, что другие переменные постоянны). Подвести итог:

  1. Интеграция метаданных в организации.
  2. Построение взаимосвязи между различными типами метаданных
  3. Стройте отношения между различными разрозненными системами.
  4. Определите бизнес золотую копию определений.
  5. Контроль версий изменений на уровне структуры.
  6. взаимодействие со Справочными данными
  7. связать представление с основными данными.
  8. автоматическая синхронизация с различными авторизованными системами источников метаданных.
  9. Больше контроля над бизнес-решениями.
  10. проверить структуры, перекрывая модели
  11. обнаружение несоответствий, пробелов, происхождения, показателей на уровне структуры данных.

Каждая система управления базами данных (СУБД) и инструменты баз данных имеют свой собственный язык для компонентов метаданных. Приложения баз данных уже имеют свои собственные репозитории или реестры, которые, как ожидается, обеспечат все необходимые функции для доступа к данным, хранящимся в них. Поставщики не хотят, чтобы другие компании могли легко переносить данные из их продуктов в продукты конкурентов, поэтому они являются собственностью в отношении того, как они обрабатывают метаданные. Инструменты CASE, словари СУБД, инструменты ETL, инструменты очистки данных, инструменты OLAP и инструменты интеллектуального анализа данных обрабатывают и хранят метаданные по-разному. Только репозиторий метаданных может быть разработан для хранения компонентов метаданных из всех этих инструментов.

Дизайн

Репозитории метаданных должны хранить метаданные в четырех классификациях: владение, описательные характеристики, правила и политики, а также физические характеристики. Право собственности, показывающее владельца данных и владельца приложения. Описательные характеристики определяют имена, типы и длину, а также определения, описывающие бизнес-данные или бизнес-процессы. Правила и политики будут определять безопасность, чистоту данных, сроки для данных и отношения. Физические характеристики определяют происхождение или источник и физическое местонахождение. Подобно построению логической модели данных для создания базы данных, логическая метамодель может помочь определить требования к метаданным для бизнес-данных. Хранилище метаданных будет централизованным, децентрализованным или распределенным. Централизованный дизайн означает, что существует одна база данных для репозитория метаданных, в которой хранятся метаданные для всех приложений в масштабах всего бизнеса. Централизованное хранилище метаданных имеет те же преимущества и недостатки, что и централизованная база данных. Легче управлять, потому что все данные находятся в одной базе данных, но недостатком является то, что могут возникнуть узкие места.

Децентрализованное хранилище метаданных хранит метаданные в нескольких базах данных, разделенных по местоположению и / или отделам бизнеса. Это делает управление репозиторием более сложным, чем централизованное хранилище метаданных, но преимущество состоит в том, что метаданные можно разбить на отдельные отделы.

Распределенный репозиторий метаданных использует децентрализованный метод, но в отличие от децентрализованного репозитория метаданных метаданные остаются в исходном приложении. Создается шлюз XML, который действует как каталог для доступа к метаданным в каждом отдельном приложении. Преимущества и недостатки распределенного репозитория метаданных отражают репозиторий распределенной базы данных.

Дизайн информационной модели должен включать различные уровни типов метаданных, которые должны перекрываться для создания интегрированного представления данных. Различные типы метаданных должны быть объединены с соответствующими элементами метаданных в модели сверху вниз, связанной с бизнес-глоссарием.

Слои метаданных:

  1. Бизнес-глоссарий: содержит рекурсивную связь с бизнес-терминами.
  2. Бизнес-теги: содержат различную принадлежность к этому термину или терминам.
  3. Словарь данных: содержит информацию из инструментов модели данных для определения элементов метаданных и их технических определений, предоставляемых данными или архитектурой предприятия.
  4. Концептуальные модели данных:
  5. Логические модели данных
  6. Физические модели данных
  7. Базы данных
  8. правила проверки и правила качества данных
  9. ETL, бизнес-правила и их связь с атрибутами и сущностями
  10. Отчеты
  11. Источник к целевым артефактам сопоставления (отношения)
  12. Требования к отчетности (отношения)
  13. бизнес-процессы и их связь с технологиями
  14. иерархия людей и их отношения
  15. отношения собственника

Сущность-отношения / объектно-ориентированный

Репозитории метаданных могут быть спроектированы как модель отношения сущностей или как объектно-ориентированный дизайн.

Смотрите также

использованная литература

Последняя правка сделана 2024-01-02 08:24:25
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте