Семантическая совместимость

редактировать

Семантическая совместимость - это способность компьютерных систем обмениваться данными с однозначный общий смысл. Семантическая функциональная совместимость - это требование для обеспечения машинно-вычислимой логики, вывода, обнаружения знаний и объединения данных между информационными системами.

Семантическая совместимость, следовательно, касается не только упаковки данных (синтаксис ), но одновременная передача значения с данными (семантика ). Это достигается путем добавления данных о данных (метаданные ), связывания каждого элемента данных с управляемым общим словарем . Смысл данных передается вместе с самими данными в одном самоописывающем «информационном пакете», который не зависит от какой-либо информационной системы. Именно этот общий словарь и связанные с ним ссылки на онтологию обеспечивают основу и возможности машинной интерпретации, вывода и логики.

Синтаксическая совместимость (см. ниже) является предпосылкой для семантической совместимости. Синтаксическая совместимость относится к механизмам упаковки и передачи данных. В здравоохранении NHL используется более тридцати лет (что предшествовало появлению Интернета и веб-технологий) и использует вертикальную черту (|) в качестве разделителя данных. Текущий интернет-стандарт для разметки документов - это XML, в котором в качестве разделителя данных используется «<>». Разделители данных не придают никакого значения, кроме как структурировать данные. Без словаря данных для перевода содержимого разделителей данные остаются бессмысленными. Несмотря на то, что существует множество попыток создания словарей данных и информационных моделей для связи с этими механизмами упаковки данных, ни одна из них не была осуществлена. Это только увековечило продолжающуюся «бабелизацию» данных и неспособность обмениваться данными со смыслом.

С момента введения Семантической паутины Тимом Бернерсом-Ли в 1999 г., W3C и его применение росли. (Консорциум World Wide Web), обеспечивающий возможности обмена семантическими данными в масштабе сети, объединения и логического вывода.

Содержание

  • 1 Семантика как функция синтаксической совместимости
  • 2 Слова и значения
  • 3 Требования к представлению знаний и языки
  • 4 Предварительное согласие не требуется
  • 5 Исследование онтологии
  • 6 Важность
  • 7 См. Также
  • 8 Ссылки
  • 9 Внешние ссылки

Семантика как функция синтаксической совместимости

Синтаксическая совместимость, обеспечиваемая, например, XML или Стандарты SQL, является предпосылкой семантики. Он включает в себя общий формат данных и общий протокол для структурирования любых данных, чтобы способ обработки информации можно было интерпретировать из структуры. Это также позволяет обнаруживать синтаксические ошибки, что позволяет принимающим системам запрашивать повторную отправку любого сообщения, которое кажется искаженным или неполным. Семантическая связь невозможна, если синтаксис искажен или не может представить данные. Однако информация, представленная в одном синтаксисе, в некоторых случаях может быть точно переведена в другой синтаксис. Там, где возможен точный перевод синтаксиса, системы, использующие другой синтаксис, также могут точно взаимодействовать. В некоторых случаях возможность точного перевода информации между системами с использованием различных синтаксисов может быть ограничена одним направлением, когда используемые формализмы имеют разные уровни выразительности (способности выражать информацию).

Единая онтология, содержащая представления каждого термина, используемого в каждом приложении, обычно считается невозможной из-за быстрого создания новых терминов или присвоения новых значений старым терминам. Однако, хотя невозможно предвидеть каждую концепцию, которую пользователь может пожелать представить на компьютере, существует возможность найти некоторый конечный набор «примитивных» концептуальных представлений, которые можно комбинировать для создания любых более конкретных концепций, которые пользователи может потребоваться для любого заданного набора приложений или онтологий. Наличие базовой онтологии (также называемой верхняя онтология ), которая содержит все эти примитивные элементы, обеспечит прочную основу для общей семантической совместимости и позволит пользователям определять любые новые термины, которые им нужны, используя базовый перечень элементов онтологии. и все еще иметь эти недавно определенные термины, должным образом интерпретируемые любой другой компьютерной системой, которая может интерпретировать базовую онтологию. Вопрос о том, действительно ли число таких примитивных представлений понятий конечно, или будет расти бесконечно, является предметом активного исследования. Если он конечен, то стабильная базовая онтология, подходящая для поддержки точной и общей семантической совместимости, может развиваться после того, как некоторая исходная базовая онтология была протестирована и использована широким кругом пользователей. В настоящее время ни одна фундаментальная онтология не была принята широким сообществом, поэтому такая стабильная фундаментальная онтология все еще в будущем.

Слова и значения

Одно постоянное недоразумение, повторяющееся при обсуждении семантики, - это «смешение слов и значений». Значения слов меняются, иногда быстро. Но формальный язык, используемый в онтологии, может кодировать значения (семантику) концепций в неизменяемой форме. Чтобы определить, что означает конкретное слово (или термин в базе данных, например), необходимо пометить каждое фиксированное представление концепта в онтологии словом (ами) или термином (ами).), который может относиться к этой концепции. Когда несколько слов относятся к одному и тому же (фиксированному) понятию в языке, это называется синонимией ; когда одно слово используется для обозначения более чем одного понятия, это называется неоднозначностью. Двусмысленность и синонимия являются одними из факторов, затрудняющих понимание языка компьютером. Использование слов для обозначения понятий (значения используемых слов) очень чувствительно к контексту и цели любого использования многих понятных человеку терминов. Использование онтологий для поддержки семантического взаимодействия заключается в предоставлении фиксированного набора концепций, значения и отношения которых стабильны и могут быть согласованы пользователями. Затем задача определения терминов и контекстов (каждая база данных - это отдельный контекст) отделяется от задачи создания онтологии и должна выполняться разработчиком базы данных или разработчиком формы для ввода данных. или разработчик программы для понимания языков. Когда значение слова, используемого в некотором интероперабельном контексте, изменяется, то для сохранения интероперабельности необходимо изменить указатель на элемент (ы) онтологии, который определяет значение этого слова.

Требования и языки представления знаний

Язык представления знаний может быть достаточно выразительным, чтобы описывать нюансы значения в хорошо понятных областях. У них как минимум пять уровней сложности.

Для общих полуструктурированных данных можно использовать язык общего назначения, такой как XML.

Языки с полной мощностью логики предикатов первого порядка может потребоваться для многих задач.

Человеческие языки очень выразительны, но считаются слишком двусмысленными, чтобы обеспечить желаемую точную интерпретацию, учитывая текущий уровень технологий человеческого языка.

Предварительное согласие не требуется

Семантическую совместимость можно отличить от других форм взаимодействия, учитывая, имеет ли передаваемая информация в своей переданной форме все значение, необходимое для интерпретации принимающей системой это правильно, даже если алгоритмы, используемые принимающей системой, неизвестны отправляющей системе. Рассмотрите возможность отправки одного числа:

Если этот номер предназначен для обозначения денежной суммы, которую одна компания должна другой, это подразумевает действие или бездействие со стороны как тех, кто его отправляет, так и тех, кто получает Это.

Он может быть правильно интерпретирован, если отправлен в ответ на конкретный запрос и получен в то время и в ожидаемой форме. Эта правильная интерпретация зависит не только от самого числа, которое может представлять почти любой из миллионов типов количественных измерений, но и зависит строго от обстоятельств передачи. То есть интерпретация зависит от того, ожидают ли обе системы, что алгоритмы в другой системе используют номер в точно таком же смысле, и в дальнейшем она зависит от всего пакета передач, которые предшествовали фактической передаче голого числа. Напротив, если передающая система не знает, как информация будет использоваться другими системами, необходимо иметь общее соглашение о том, как информация с определенным значением (из многих возможных значений) будет появляться в сообщении. Для конкретной задачи одним из решений является стандартизация формы, например, запроса на оплату; этот запрос должен будет стандартным образом закодировать всю информацию, необходимую для его оценки, такую ​​как: агент должен деньги, агент должен деньги, характер действия, приводящего к возникновению долга, агенты, товары, services и других участников этого действия; время действия; сумма задолженности и валюта, в которой рассчитывается задолженность; время, отведенное для оплаты; требуемая форма оплаты; и другая информация. Когда две или более системы договорились о том, как интерпретировать информацию в таком запросе, они могут достичь семантической совместимости для этого конкретного типа транзакции. Для семантической совместимости в целом необходимо предоставить стандартизованные способы описания значений гораздо большего, чем просто коммерческие транзакции, и количество концепций, представление которых необходимо согласовать, составляет как минимум несколько тысяч.

Исследование онтологий

Как достичь семантической совместимости для более чем нескольких ограниченных сценариев в настоящее время является предметом исследований и дискуссий. Для проблемы общей семантической совместимости требуется некоторая форма базовой онтологии ('верхняя онтология '), которая является достаточно всеобъемлющей, чтобы обеспечить определение концепций для более специализированных онтологий в нескольких областях. За последнее десятилетие было разработано более десяти базовых онтологий, но ни одна из них еще не была принята широкой пользовательской базой.

Потребности в единой всеобъемлющей всеобъемлющей онтологии для поддержки семантической совместимости можно избежать, разработав общую базовую онтологию как набор базовых («примитивных») концепций, которые можно комбинировать для создания логических описаний значения терминов, используемых в онтологиях локальной области или локальных базах данных. Эта тактика основана на следующем принципе:

Если:

(1) значения и использование примитивных элементов онтологии в базовой онтологии согласованы, и (2) элементы онтологии в онтологиях предметной области конструируются как логические комбинации элементов в базовой онтологии,

Тогда:

Предполагаемые значения элементов онтологии предметной области могут быть вычислены автоматически с использованием логики логики FOL (логики первого порядка) любой системой, которая принимает значения элементы в базовой онтологии, и имеет как базовую онтологию, так и логические спецификации элементов в онтологии предметной области.

Следовательно:

Любая система, желающая точно взаимодействовать с другой системой, должна передавать только данные, которые должны быть переданы, плюс любые логические описания терминов, используемых в этих данных, которые были созданы локально и еще не включены в общую базовую онтологию.

Эта тактика затем ограничивает необходимость предварительного согласования значений только теми элементами онтологии в общей онтологии основания (FO). Исходя из нескольких соображений, это, вероятно, будет менее 10 000 элементов (типов и отношений).

На практике, вместе с FO, сфокусированным на представлении примитивных концепций, вероятно, также будет использоваться набор онтологий расширения домена для FO с элементами, определенными с помощью элементов FO. Такие уже существующие расширения снизят стоимость создания онтологий предметной области, предоставив существующим элементам предполагаемое значение, и уменьшат вероятность ошибки при использовании элементов, которые уже были протестированы. Онтологии доменных расширений могут быть логически несовместимы друг с другом, и это необходимо определить, используются ли разные доменные расширения в любом обмене данными.

Также исследуется вопрос о том, можно ли избежать использования такой единой базовой онтологии с помощью сложных методов отображения среди независимо разработанных онтологий.

Важность

Практическое значение семантического взаимодействия было измерено в нескольких исследованиях, в которых оценивалась стоимость (в потерянной эффективности) из-за отсутствия семантического взаимодействия. Одно исследование, посвященное потерям эффективности в передаче медицинской информации, показало, что 77,8 млрд долларов США в год можно сэкономить, внедрив эффективный стандарт совместимости в этой области. Другие исследования, посвященные строительной отрасли и цепочке поставок автомобилестроения, оценивают затраты в более 10 миллиардов долларов США в год из-за отсутствия семантической совместимости в этих отраслях. В целом эти цифры можно экстраполировать, чтобы указать, что только в США теряется более 100 миллиардов долларов США в год из-за отсутствия широко используемого стандарта семантической совместимости.

Еще не проводилось исследование каждого поля политики, которое могло бы обеспечить значительную экономию средств за счет применения стандартов семантической совместимости. Но чтобы увидеть, какие поля политик могут получить прибыль от семантической совместимости, см. «Совместимость » в целом. К таким полям политики относятся электронное правительство, здоровье, безопасность и многие другие. ЕС также создал Европейский центр семантической совместимости в июне 2007 года.

См. Также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-06-07 09:39:06
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте