ISO / IEC 11179 Реестр метаданных (MDR) - это международный стандарт ISO для представления метаданных для организации в реестре метаданных. Он документирует стандартизацию и регистрацию метаданных, чтобы сделать данные понятными и доступными для совместного использования.
Организации обмениваются данными между компьютерными системами, используя именно предприятие интеграция приложений технологий. Завершенные транзакции часто переносятся в отдельные хранилища данных и системы бизнес-правил со структурами, предназначенными для поддержки данных для анализа. Де-факто стандартной моделью для платформ интеграции данных является Метамодель Common Warehouse (CWM). Интеграция данных часто также решается как проблема данных, а не метаданных, с использованием так называемых основных данных. ISO / IEC 11179 утверждает, что это стандарт для обмена данными на основе метаданных в гетерогенной среде, основанный на точных определениях данных.
Модель ISO / IEC 11179 является результатом двух принципов семантической теории в сочетании с базовыми принципами моделирования данных.
Первый принцип семантической теории - это соотношение типа тезауруса между более широкими и более узкими (или конкретными) понятиями, например широкое понятие «доход» имеет отношение к более узкому понятию «чистый доход».
Второй принцип семантической теории - это отношение между концептом и его представлением, например, «покупка» и «покупка» - это одно и то же понятие, хотя используются разные термины.
Базовый принцип моделирования данных - это сочетание класса объекта и характеристики. Например, «Человек - цвет волос».
Применительно к моделированию данных ISO / IEC 11179 объединяет широкую «концепцию» с «классом объекта», чтобы сформировать более конкретную «концепцию элемента данных». Например, высокоуровневое понятие «доход» комбинируется с классом объекта «человек» для формирования концепции элемента данных «чистый доход человека». Обратите внимание, что «чистая прибыль» более конкретна, чем «прибыль».
Затем описываются различные возможные представления концепции элемента данных с использованием одного или нескольких элементов данных. Различия в представлении могут быть результатом использования синонимов или разных доменов значений в разных наборах данных в хранилище данных. Область значений - это допустимый диапазон значений для характеристики класса объектов. Примером области значений для «пола человека» является «M = мужской, F = женский, U = неизвестный». Буквы M, F и U - это допустимые значения пола человека в конкретном наборе данных.
Концепция элемента данных «ежемесячный чистый доход человека» может, таким образом, иметь один элемент данных, называемый «ежемесячный чистый доход физического лица по 100-долларовым группам», и один, называемый «ежемесячный чистый доход человека в диапазоне от 0 до 1000 долларов». и т. д. в зависимости от неоднородности представления, существующей в массивах данных, охватываемых одним реестром ISO / IEC 11179. Обратите внимание, что в этих двух примерах используются разные термины для класса объекта (человек / человек) и разные наборы значений (диапазон от 0 до 1000 долларов в отличие от групп по 100 долларов).
Результатом этого является каталог видов, в котором связанные концепции элементов данных сгруппированы по концепции высокого уровня и классу объектов, а элементы данных сгруппированы по концепции общих элементов данных. Строго говоря, это не иерархия, даже если она похожа на нее.
Собственно ISO / IEC 11179 не описывает данные в том виде, в котором они фактически хранятся. Это не относится к описанию физических файлов, таблиц и столбцов. Конструкции ISO / IEC 11179 являются «семантическими» в отличие от «физических» или «технических».
Стандарт преследует две основные цели: определение и обмен. Основной объект - это концепция элемента данных, поскольку она определяет концепцию и, в идеале, описывает данные независимо от их представления в какой-либо одной системе, таблице, столбце или организации.
Стандарт состоит из семи частей:
Часть 1 объясняет назначение каждой части. Часть 3 определяет метамодель, которая определяет реестр. Часть 7 выпущена в декабре 2019 года и является расширением части 3 для регистрации метаданных о наборах данных. Остальные части определяют различные аспекты использования реестра.
элемент данных является фундаментальной концепцией в реестре метаданных ISO / IEC 11179. Цель реестра - поддерживать семантически точную структуру элементов данных.
Каждый элемент данных в реестре метаданных ISO / IEC 11179:
Элементы данных, в которых хранятся «коды» или перечисляемые значения, также должны указывать семантику каждого из значений кода с точными определениями.
Реестр метаданных COTS (MDR) Software AG поддерживает стандарт ISO 11179 и продолжает продаваться и использоваться для этой цели как в коммерческих, так и в государственных приложениях (см. Раздел Инструменты поставщика ниже).
В то время как коммерческое внедрение расширяется, распространение ISO / IEC 11179 было более успешным в государственном секторе. Однако причина этого неясна. Членство в ISO открыто для организаций через их национальные органы. Страны с государственными репозиториями в различных отраслях промышленности включают Австралию, Канаду, Германию, США и Великобританию.
Организация Объединенных Наций и правительство США ссылаются на стандарты 11179 и используют их. 11179 настоятельно рекомендуется на веб-сайте правительства США XML. и продвигается The Open Group в качестве основы Universal Data Element Framework. Open Group - это технологически нейтральный консорциум, работающий над обеспечением доступа к интегрированной информации внутри предприятий и между ними на основе открытых стандартов и глобальной совместимости.
Хотя реестр метаданных ИСО / МЭК 11179 представляет собой стандарт из 6 частей, состоящий из нескольких сотен страниц, основная модель представлена в Части 3 и изображена на диаграммах UML для облегчения понимания и поддерживается нормативными документами. текст. Инициатива eXtended Metadata Registry, XMDR, возглавляемая США, исследовала использование онтологий в качестве основы для содержимого MDR, чтобы обеспечить более богатую семантическую структуру, чем можно было бы достичь только с помощью соглашений о лексическом и синтаксическом именовании. XMDR экспериментировал с прототипом, используя OWL, RDF и SPARQL, чтобы подтвердить концепцию. Результатом этой инициативы стало издание 3 стандарта ISO / IEC 11179. Первая опубликованная часть - ISO / IEC 11179-3: 2013. Основным расширением в редакции 3 является область концепций, расширяющая использование концептов до большего количества компонентов в рамках стандарта и поддерживающая регистрацию системы концепций для использования в реестре. Стандарт также поддерживает использование внешне определенных концептуальных систем. Версии 3-го издания частей 1, 5 и 6 были опубликованы в 2015 году. Часть 2, «Классификации», включена в концептуальную область в Части 3, но в настоящее время обновляется до Технического отчета (TR), чтобы предоставить руководство по разработке классификации. Схемы. Часть 4 описывает принципы формирования определений данных; Издание 3 не предлагалось.
В следующих реестрах метаданных указано, что они следуют рекомендациям ISO / IEC 11179, хотя формальных сторонних тестов, разработанных для проверки соответствия реестра метаданных, не проводилось.
Независимые агентства не сертифицировали ISO / IEC 11179 соответствие.