Лексический ресурс

редактировать

В цифровой лексикографии, обработка естественного языка и цифровые гуманитарные науки, лексический ресурс - это языковой ресурс, состоящий из один или несколько словарей , например, в форме базы данных (Gil Francopoulo).

Содержание
  • 1 Характеристики
    • 1.1 Машиночитаемый словарь по сравнению с НЛП словарь
    • 1.2 Лексическая база данных
  • 2 ссылки
    • 2.1 См. также
    • 2.2 Примеры ресурсов
    • 2.3 Внешние ссылки
  • 3 ссылки
Характеристики

Различные стандарты для машины существуют читаемые версии лексических ресурсов, например, Lexical Markup Framework (LMF) и стандарт ISO для кодирования лексических ресурсов, включающий абстрактную модель данных и XML сериализация и OntoLex-Lemon, словарь RDF для публикации лексических ресурсов в виде графов знаний в Интернете, например, как Linguistic Linked Open Data.

В зависимости от типа адресованных языков лексический ресурс может быть квалифицирован как одноязычный, двуязычный или многоязычный. Для двуязычных и многоязычных лексических ресурсов слова могут быть связаны или не связаны с одного языка на другой. При подключении эквивалентность от одного языка к другому выполняется через двуязычную ссылку (для двуязычных лексических ресурсов, например, с использованием отношения vartrans: translatableAs в OntoLex-Lemon ) или через многоязычный нотации (для многоязычных лексических ресурсов, например, со ссылкой на один и тот же онтлекс: Концепция в ОнтоЛекс-Лимоне).

Также возможно создание и управление лексическим ресурсом, состоящим из разных лексиконов одного и того же языка, для например, один словарь для общих слов и один или несколько словарей для разных специализированных областей.

Машиночитаемый словарь по сравнению со словарем НЛП

Лексические ресурсы в цифровой лексикографии часто упоминаются как машиночитаемый словарь (MRD ), словарь, хранящийся в виде машинных (компьютерных) данных, а не распечатываемых на бумаге. Это электронный словарь и лексическая база данных. Термин MRD часто противопоставляется словарю NLP в том смысле, что MRD - это электронная форма словаря, который раньше печатался на бумаге. Хотя оба термина используются программами, термин «словарь НЛП», напротив, предпочтительнее, если словарь был создан с нуля с учетом НЛП.

Лексическая база данных

A лексическая база данных - это лексический ресурс, имеющий связанная программная среда база данных, которая разрешает доступ к ее содержимому. База данных может быть специально разработана для лексической информации или базы данных общего назначения, в которую была введена лексическая информация.

Информация, обычно хранящаяся в лексической базе данных, включает лексическую категорию и синонимы слов, а также семантические и фонологические отношения между разными словами или наборами слов.

Ссылки

См. Также

Примеры ресурсов

Внешние ссылки

Ссылки
Последняя правка сделана 2021-05-27 07:36:42
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте