Универсальный сетевой язык

редактировать

Универсальный сетевой язык (UNL ) - это декларативный формальный язык, специально разработанный для представления семантических данных, извлеченных из естественного язык тексты. Он может использоваться в качестве основного языка в системах межъязыкового машинного перевода или в качестве языка представления знаний в приложениях поиска информации.

Содержание
  • 1 Объем и цели
  • 2 Структура
  • 3 История
  • 4 См. Также
  • 5 Внешние ссылки
    • 5.1 Общество UNL
Объем и цели

UNL разработан, чтобы установить простую основу для представления наиболее важных аспектов информации и значения в форме, независимой от машинного и человеческого языка. Как не зависящий от языка формализм, UNL стремится кодировать, хранить, распространять и извлекать информацию независимо от исходного языка, на котором она была выражена. В этом смысле UNL стремится предоставить инструменты для систематического преодоления языкового барьера.

На первый взгляд UNL может показаться своего рода интерлингва, в который исходные тексты конвертируются перед переводом на целевые языки. Фактически, его можно использовать для этой цели, причем очень эффективно. Однако его реальная сила - представление знаний, и его основная цель - предоставить инфраструктуру для обработки знаний, которые уже существуют или могут существовать на любом данном языке.

Тем не менее, важно отметить, что в настоящее время было бы глупо утверждать, что представляет собой «полное» значение любого слова, предложения или текста для любого языка. Тонкости намерения и интерпретации делают «полное значение», каким бы мы ни понимали его, слишком вариативным и субъективным для любого систематического рассмотрения. Таким образом, UNL избегает ловушек, связанных с попыткой представить «полное значение» предложений или текстов, ориентируясь вместо этого на «основное» или «согласованное» значение, которое им чаще всего приписывается. В этом смысле большая часть тонкости поэзии, метафор, образного языка, намеков и других сложных косвенных коммуникативных форм поведения выходит за рамки текущих целей и целей UNL. Вместо этого UNL нацелен на прямое коммуникативное поведение и буквальное значение как осязаемую, конкретную основу для большинства человеческих коммуникаций в практических, повседневных условиях.

Структура

В подходе UNL информация, передаваемая естественным языком, представлена ​​предложением за предложением в виде гиперграфа, составленного из набора направленных двоичных помеченных ссылок (называемых отношениями ) между узлами или гиперузлами (универсальные слова, или просто UW ), которые обозначают концепции. UW также могут быть аннотированы атрибутами, представляющими контекстную информацию.

Например, английское предложение «Небо было голубым ?!» может быть представлено на языке UNL следующим образом:

UNLGraph.svg

В приведенном выше примере «небо (icl>естественный мир)» и «синий ( icl>color) ", которые представляют отдельные концепции, являются UW; «aoj» (= атрибут объекта) - это направленное бинарное семантическое отношение, связывающее два UW; а «@def», «@interrogative», «@past», «@exclamation» и «@entry» - это атрибуты, изменяющие UW.

UW предназначены для представления универсальных концепций, но выражаются английскими словами или на любом другом естественном языке для удобства чтения. Они состоят из «заглавного слова» (корень UW) и «списка ограничений» (суффикс UW в круглых скобках), где ограничения используются для устранения неоднозначности общей концепции, передаваемой заглавным словом. Набор UW организован в онтологии UNL, в которой концепции высокого уровня связаны с концепциями более низкого уровня через отношения «icl» (= является разновидностью), «iof» (= является экземпляром) и « equ "(= равно).

Отношения предназначены для представления семантических связей между словами на всех существующих языках. Они могут быть онтологическими (например, «icl» и «iof», упомянутые выше), логическими (например, «и» и «или») и тематическими (например, «agt» = агент, «ins» = инструмент, «tim» = время, «plc» = место и т. д.). В настоящее время в спецификациях UNL 46 отношений. Они совместно определяют синтаксис UNL.

Атрибуты представляют информацию, которая не может быть передана UW и отношениями. Обычно они представляют информацию о времени («@past», «@future» и т. Д.), Справке («@def», «@indef» и т. Д.), Модальности («@can», «@must», и т. д.), фокус («@topic», «@focus» и т. д.) и т. д.

В программе UNL процесс представления предложений естественного языка в графах UNL называется UNLization, а процесс генерации предложений естественного языка из графов UNL называется NLization . UNLization, который включает анализ и понимание естественного языка, предназначен для полуавтоматического выполнения (то есть людьми с помощью компьютеров); и NLization предполагается проводить полностью автоматически.

История

Программа UNL началась в 1996 году по инициативе Института перспективных исследований Университета Организации Объединенных Наций в Токио, Япония. В январе 2001 года Университет Организации Объединенных Наций учредил автономную организацию UNDL Foundation, которая отвечала за разработку и управление Программой UNL. Фонд, некоммерческая международная организация, имеет независимую идентичность от Университета Организации Объединенных Наций, хотя имеет особые связи с ООН. Он унаследовал от УООН / ИПИ мандат на реализацию программы UNL, чтобы он мог выполнять свою миссию.

Программа уже прошла важные этапы. Общая архитектура системы UNL была разработана с набором базового программного обеспечения и инструментов, необходимых для ее функционирования. Они проходят испытания и улучшаются. За последние несколько лет было накоплено огромное количество лингвистических ресурсов по различным родным языкам, которые уже находятся в стадии разработки, а также по выражению UNL. Более того, техническая инфраструктура для расширения этих ресурсов уже существует, что с этого момента способствует участию гораздо большего числа языков в системе UNL. Ежегодно публикуется все больше научных работ и академических диссертаций по UNL.

Самым заметным достижением на данный момент является признание Договором о патентном сотрудничестве (PCT) инновационного характера и промышленной применимости UNL, которое было получено в мае 2002 г. через Всемирную организацию интеллектуальной собственности (WIPO).). Получение патентов (патенты США 6,704,700 и 7,107,206) для UNL является совершенно новым достижением в Организации Объединенных Наций.

См. Также
Внешние ссылки

UNL Society

Последняя правка сделана 2021-06-20 13:29:44
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте