BabelNet

редактировать
BabelNet
Логотип BabelNet.
Стабильный выпуск BabelNet 4.0 / февраль 2018
Операционная система
Тип
Лицензия Атрибуция- NonCommercial-ShareAlike 3.0 Unported
Веб-сайтbabelnet.org

BabelNet - это многоязычная лексикализованная семантическая сеть и онтология, разработанная группой НЛП Римского университета Сапиенца. BabelNet был автоматически создан путем связывания Википедии с наиболее популярной вычислительной лексикой английского языка, WordNet. Интеграция выполняется с использованием автоматического сопоставления и заполнения лексических пробелов в языках с ограниченными ресурсами с помощью статистического машинного перевода. Результатом является энциклопедический словарь , который предоставляет понятия и именованные сущности , лексикализованные на многих языках и связанные с большим количеством семантических . отношения. Дополнительные лексики и определения добавляются путем ссылки на бесплатные словарные сети, OmegaWiki, английский Wiktionary, Wikidata, FrameNet, VerbNet и другие. Подобно WordNet, BabelNet группирует слова на разных языках в наборы синонимов, которые называются Babel синсетами. Для каждого синсета Babel BabelNet предоставляет короткие определения (называемые glosses ) на многих языках, взятые из WordNet и Wikipedia.

BabelNet - это многоязычная семантическая сеть, полученная в результате интеграции WordNet и Википедии.

Содержание

  • 1 Статистика BabelNet
  • 2 Приложения
  • 3 Призы и благодарности
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки

Статистика BabelNet

По состоянию на февраль 2018 года BabelNet (версия 4.0) охватывает 284 языков, включая все европейские языки, большинство азиатских языки и латинский. BabelNet 4.0 содержит почти 16 миллионов синсетов и около 833 миллионов значений слов (независимо от их языка). Каждый набор синонимов Babel содержит по 2 синонима для каждого языка, то есть в среднем значения слов. Семантическая сеть включает все лексико-семантические отношения из WordNet (гипернимия и гипонимия, меронимия и холонимия, антонимия и синонимия и т. д., всего около 364 000 ребер отношений), а также недоопределенное отношение родства из Википедии (всего около 1,3 миллиарда ребер). Версия 4.0 также связывает около 53 миллионов изображений с наборами синхронизации Babel и обеспечивает кодировку ресурса Lemon RDF, доступную через конечную точку SPARQL. 2,67 миллиона синсетов присвоены метки домена.

Приложения

Было показано, что BabelNet поддерживает многоязычные приложения обработки естественного языка. Было показано, что лексикализованное знание, доступное в BabelNet, дает самые современные результаты в:

Призы и благодарности

BabelNet получил приз META 2015 за «новаторскую работу по преодолению языковых барьеров с помощью многоязычной лексикализованной семантической сети и онтологии с использованием разнородных источников данных».

BabelNet занял видное место в статье журнала TIME о новой эре инновационных и современных ресурсов лексических знаний, доступных в сети.

См. Также

Ссылки

Внешние ссылки

Последняя правка сделана 2021-05-11 04:51:30
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте