Отображение данных

редактировать

В вычислениях и управлении данными, отображение данных - это процесс создания отображения элемента данных между двумя различными моделями данных. Сопоставление данных используется в качестве первого шага для широкого спектра задач интеграции данных, включая:

Например, компания, которая хотела бы для передачи и получения покупок и счетов-фактур с другими компаниями можно использовать сопоставление данных для создания карт данных из данных компании в стандартизированные сообщения ANSI ASC X12 для таких элементов, как заказы на покупку и счета-фактуры.

Содержание
  • 1 Стандарты
  • 2 Ручное кодирование, графическое руководство
  • 3 Отображение на основе данных
  • 4 Семантическое отображение
  • 5 См. Также
  • 6 Ссылки
  • 7 Внешние ссылки
Стандарты

Стандарты X12 являются общими стандартами электронного обмена данными (EDI), разработанными, чтобы позволить компании обмениваться данными с любыми другими компания, независимо от отрасли. Стандарты поддерживаются Аккредитованным комитетом по стандартам X12 (ASC X12) с Американским национальным институтом стандартов (ANSI), аккредитованным для установления стандартов для EDI. Стандарты X12 часто называют стандартами ANSI ASC X12.

В будущем инструменты, основанные на языках семантической сети, такие как Resource Description Framework (RDF), Web Ontology Language (OWL) а стандартизированный реестр метаданных сделает отображение данных более автоматическим. Этот процесс будет ускорен, если каждое приложение выполнит публикацию метаданных. Полное автоматизированное отображение данных - очень сложная проблема (см. семантический перевод ).

Записанное вручную графическое руководство

Отображение данных может быть выполнено различными способами с использованием процедурного кода, создания преобразований XSLT или с помощью инструментов графического отображения, которые автоматически генерируют исполняемые программы преобразования. Это графические инструменты, которые позволяют пользователю «рисовать» линии от полей одного набора данных к полям другого. Некоторые графические инструменты отображения данных позволяют пользователям «автоматически соединять» источник и место назначения. Эта функция зависит от совпадения исходного и целевого имени элемента данных. Программы преобразования автоматически создаются на SQL, XSLT, языке программирования Java или C ++. Подобные графические инструменты можно найти в большинстве инструментов ETL (извлечение, преобразование и загрузка) в качестве основных средств ввода карт данных для поддержки перемещения данных. Примеры включают SAP BODS и Informatica PowerCenter.

Сопоставление, управляемое данными

Это новейший подход к сопоставлению данных, который включает одновременную оценку фактических значений данных в двух источниках данных с использованием эвристики и статистики для автоматического обнаружения сложных сопоставлений между двумя наборами данных. Этот подход используется для поиска преобразований между двумя наборами данных, обнаружения подстрок, конкатенаций, арифметики, операторов case, а также других видов логики преобразования. Этот подход также обнаруживает исключения данных, которые не соответствуют обнаруженной логике преобразования.

Семантическое отображение

Семантическое отображение аналогично функции автоматического подключения средств отображения данных за исключением того, что для поиска синонимов элементов данных можно обращаться к реестру метаданных. Например, если в исходной системе указано имя FirstName, а в списке назначения указано PersonGivenName, сопоставления все равно будут выполняться, если эти элементы данных указаны как синонимы в реестре метаданных. Семантическое сопоставление может только обнаруживать точные совпадения между столбцами данных и не обнаруживает никакой логики преобразования или исключений между столбцами.

Происхождение данных - это отслеживание жизненного цикла каждой части данных по мере того, как она принимается, обрабатывается и выводится системой аналитики. Это обеспечивает наглядность конвейера аналитики и упрощает отслеживание ошибок до их источников. Это также позволяет воспроизводить определенные части или входы потока данных для пошаговой отладки или восстановления потерянного вывода. Фактически, системы баз данных уже использовали такую ​​информацию, называемую происхождением данных, для решения аналогичных задач проверки и отладки.

См. Также
Ссылки
Внешние ссылки
Последняя правка сделана 2021-05-17 14:10:31
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте