Обмен данными

редактировать

Процесс управления данными

Обмен данными - это процесс взятия данных, структурированных в соответствии с исходной схемой, и их преобразования в данные, структурированные в соответствии с целевой схемой, поэтому что целевые данные являются точным представлением исходных данных. Обмен данными позволяет совместно использовать данные между различными компьютерными программами.

. Это похоже на связанную концепцию интеграции данных, за исключением того, что данные фактически реструктурируются (с возможной потерей содержимого) при обмене данными. Может не быть способа преобразовать экземпляр с учетом всех ограничений. И наоборот, может существовать множество способов преобразования экземпляра (возможно, бесконечно много), и в этом случае необходимо определить и обосновать «лучший» выбор решений.

Содержание

1 Однодоменный обмен данными
2 Языки обмена данными
- 2.1 Популярные языки, используемые для обмена данными
- 2.2 XML для обмена данными
- 2.3 YAML для обмена данными
- 2.4 REBOL для обмена данными
- 2.5 Gellish для обмена данными
3 См. Также
4 Ссылки

Однодоменный обмен данными

В некоторых доменах несколько десятков различных исходных и целевых схем ( собственные форматы данных) могут существовать. «Обмен» или «формат обмена» часто разрабатывается для одного домена, а затем записываются необходимые процедуры (сопоставления) для (косвенного) преобразования / преобразования каждой исходной схемы в каждую целевую схему с использованием формата обмена как промежуточный шаг. Это требует гораздо меньше работы, чем написание и отладка сотен различных подпрограмм, которые потребовались бы для прямого преобразования каждой исходной схемы непосредственно в каждую целевую схему.

Примеры этих трансформирующих форматов обмена включают:

Стандартный формат обмена для геопространственных данных;
Формат обмена данными для данных электронных таблиц;
Формат открытого документа для электронные таблицы, диаграммы, презентации и текстовые документы;
GPS eXchange Format или Keyhole Markup Language для описания данных GPS; и
GDSII для топологии интегральных схем.

Языки обмена данными

Язык / формат обмена (или обмена) данными - это язык, который не зависит от предметной области и может использоваться для данных из любая дисциплина. Они «эволюционировали из ориентированных на разметку и отображение для дальнейшей поддержки кодирования метаданных, описывающих структурные атрибуты информации».

Практика показала, что некоторые типы формальных языков являются лучше подходят для этой задачи, чем другие, так как их спецификация определяется формальным процессом, а не конкретными потребностями реализации программного обеспечения. Например, XML - это язык разметки, который был разработан для создания диалектов (определение подъязыков, зависящих от предметной области). Однако он не содержит тематических словарей или типов фактов. Для надежного обмена данными выгодно наличие стандартных словарей-таксономий и библиотек инструментов, таких как анализаторы, схемы валидаторы и инструменты преобразования.

Популярные языки, используемые для обмен данными

Ниже приводится неполный список популярных общих языков, используемых для обмена данными в нескольких доменах.

	Схемы	Гибкая	Семантическая проверка	Словарь	Информационная модель	Синонимы и омонимы	Диалект	Веб-стандарт	Преобразования	Облегченный	Человекочитаемый	Совместимость
RDF	Да	Да	Да	Да	Да	Да	Да	Да	Да	Да	Частично	Подмножество Семантической сети
XML	Да	Да	Нет	Нет	Нет	Нет	Да	Да	Да	Нет	Да	подмножество SGML, HTML
Atom	Да	Неизвестно	Неизвестно	Неизвестно	Нет	Неизвестно	Да	Да	Да	Нет	Нет	XML диалект
JSON	Нет	Неизвестно	Неизвестно	Неизвестно	Нет	Неизвестно	Нет	Да	Нет	Да	Да	подмножество YAML
YAML	No	Неизвестно	Неизвестно	Неизвестно	Нет	Неизвестно	Нет	Нет	No	Да	Да	расширенный набор JSON
REBOL	Да	Да	Нет	Да	Нет	Да	Да	Нет	Да	Да	Да
Gellish	Да	Да	Да	Да	Нет	Да	Да	ISO	Нет	Да	Частично	SQL, RDF / XML, OWL

Номенклатура

Схемы - Доступно ли определение языка в компьютерной интерпретируемой форме
Гибкий - Позволяет ли язык расширить возможности семантического выражения без изменения схемы
Семантическая проверка - позволяет ли определение языка семантическую проверку правильности выражений на языке
Словарь-таксономия - включает ли язык словарь и налог ономия (иерархия подтипа-супертипа) понятий с наследованием
Синонимы и омонимы - включает ли язык и поддерживает ли использование синонимов и омонимов в выражениях
Диалектирование - доступно ли определение языка на нескольких естественных языках или диалектах
Интернет или стандарт ISO - Организация, одобрившая этот язык в качестве стандарта
Преобразования - Включает ли язык перевод на другие стандарты
Легковесный - Доступна ли облегченная версия в дополнение к полной версии
Удобочитаема - являются ли выражения на языке удобочитаемыми (читаются людьми без обучения)
Совместимость - Какие другие инструменты можно использовать или которые требуются при использовании языка

Примечания:

^RDF - это язык с гибкой схемой.
^Схема XML содержит очень ограниченную грамматику и словарь.
^Доступно как расширение.
^В формате по умолчанию, без компактного синтаксиса.
^T синтаксис довольно прост (язык был разработан для удобства чтения); диалекты могут требовать знания предметной области.
^Стандартизированные типы фактов обозначаются стандартными английскими фразами, интерпретация и использование которых требует некоторого обучения.
^Диалект синтаксического анализа используется для определения, проверки, и преобразовывать диалекты.
^Английская версия включает Gellish English Dictionary-Taxonomy, которая также включает стандартизованные типы фактов (= виды отношений).

XML для обмена данными

Популярность XML для обмена данными в World Wide Web имеет несколько причин. Прежде всего, он тесно связан с уже существующими стандартами Standard Generalized Markup Language (SGML) и Hypertext Markup Language (HTML), и поэтому синтаксический анализатор, написанный для поддержки этих двух языков, может быть легко расширен для поддержки XML тоже. Например, XHTML был определен как формат, который является формальным XML, но правильно понимается большинством (если не всеми) анализаторами HTML.

YAML для обмена данными

YAML - это язык, который был разработан для удобства чтения (и поэтому его легко редактировать с помощью любого стандартного текстового редактора). Его понятие часто похоже на reStructuredText или синтаксис Wiki, который также пытается быть читаемым как людьми, так и компьютерами. YAML 1.2 также включает сокращенное понятие, совместимое с JSON, и поэтому любой документ JSON также является допустимым YAML; это, однако, не справедливо.

REBOL для обмена данными

REBOL - это язык, который был разработан для удобства чтения и редактирования с использованием любого стандартного текстового редактора. Для этого используется простой синтаксис произвольной формы с минимальным количеством знаков препинания и богатым набором типов данных. Типы данных REBOL, такие как URL-адреса, электронные письма, значения даты и времени, кортежи, строки, теги и т. Д., Соответствуют общим стандартам. REBOL спроектирован так, чтобы не нуждаться в каком-либо дополнительном метаязыке, он разработан в метациркульной форме. Метациркулярность языка является причиной того, почему, например, диалект Parse, используемый (не исключительно) для определений и преобразований диалектов REBOL, также сам по себе является диалектом REBOL. REBOL послужил источником вдохновения для JSON.

Gellish для обмена данными

Gellish English - это формализованное подмножество естественного английского языка, которое включает простую грамматику и большой расширяемый английский Словарь-Таксономия, который определяет общую терминологию и терминологию предметной области (термины для понятий), тогда как понятия организованы в иерархию подтип-супертип (таксономия), которая поддерживает наследование знаний и требований. Словарь-таксономия также включает стандартизованные типы фактов (также называемые типами отношений). Термины и типы отношений вместе могут использоваться для создания и интерпретации выражений фактов, знаний, требований и другой информации. Gellish можно использовать в сочетании с SQL, RDF / XML, OWL и другими различными метаязыками. Стандарт Gellish представляет собой комбинацию ISO 10303-221 (AP221) и ISO 15926.

См. Также

Atom (формат файла)
Легкий язык разметки
RSS

Ссылки

^А. Доан, А. Халеви и З. Айвз. «Принципы интеграции данных », Morgan Kaufmann, 2012, стр. 276
^Arenas, M.; Barceló, P.; Либкин, Л.; Мурлак, Ф. (2014). Основы обмена данными. Издательство Кембриджского университета. С. 1–11. ISBN 9781107016163. Проверено 25 мая 2018 г. CS1 maint: несколько имен: список авторов (ссылка )
^Clancy, JJ (2012). «Глава 1: Указания по обмену инженерными данными для автоматизированного проектирования и производства». In Wang, PCC (ed.). Advances in CAD / CAM: Case Studies. Springer Science Business Media. Стр. 1–36. ISBN 9781461328193. 25 мая 2018 г.
^Калиш, CE; Майер, MF (ноябрь 1981 г.). «DIF: формат для обмена данными между прикладными программами». BYTE Magazine: 174. CS1 maint: несколько имен: список авторов (ссылка )
^«О ODF». OpenDoc Society. Проверено 25 мая 2018 г.
^Чжу, X. (2016). ГИС для экологических приложений: практический подход. Routledge. ISBN 9781134094509. Проверено 25 мая 2018 г.
^«Справочник по KML». Google Developers. 21 января 2016 г. Получено 25 мая 2018 г.
^Martins, RMF; Лоуренсу, NCC; Орта, NCG (2012). Создание аналоговых схем ИС с помощью LAYGEN II. Springer Science Деловые СМИ. п. 34. ISBN 9783642331466. Проверено 25 мая 2018 г. CS1 maint: несколько имен: список авторов (ссылка )
^Billingsley, FC (1988). «Общий язык обмена данными». Архивы ISPRS. 27 (B3): 80–91. Проверено 25 мая 2018 г. Подпрограммы преобразования будут представлять собой язык и синтаксис, которые должны быть дисциплинированными и независимыми от машины.
^Нурсеитов, Н.; Полсон, М.; Reynolds, R.; Izurieta, C. (2009). «Сравнение форматов обмена данными JSON и XML: пример из практики». Сценарий: 157–162. CS1 maint: несколько имен: список авторов (ссылка )
^ Lewis, J.; Moscovitz, M. (2009). AdvancED CSS. APress. Pp. 5–6. ISBN 9781430219323. Проверено 25 Май 2018 г. CS1 maint: множественные имена: список авторов (ссылка )
^"читабельный". Oxford Dictionaries. Oxford University Press. Дата обращения 29 мая 2018 г.
^Bendersky, E. (22 ноября 2008 г.). «JSON - это YAML, но YAML - это не JSON». Веб-сайт Эли Бендерски. Проверено 29 мая 2018 г.
^Sassenrath, C. (2000). «The Язык сценариев REBOL ". Журнал доктора Добба. 25 (314): 64–8. Проверено 29 мая 2018 г.
^Sassenrath, C. (13 декабря 2012 г.). «На JSON и REBOL». REBOL.com. Проверено 29 мая 2018 г.
^van Renssen, A.; Vermaas, P.E.; Зварт, С. (2007). «Таксономия функций в гелландском английском». Труды Международной конференции по инженерному проектированию 2007: DS42_P_230. Проверено 29 мая 2018 г. CS1 maint: множественные имена: список авторов (ссылка )