Стабильный выпуск | BabelNet 4.0 / февраль 2018 |
---|---|
Операционная система | |
Тип | |
Лицензия | Атрибуция- NonCommercial-ShareAlike 3.0 Unported |
Веб-сайт | babelnet.org |
BabelNet - это многоязычная лексикализованная семантическая сеть и онтология, разработанная группой НЛП Римского университета Сапиенца. BabelNet был автоматически создан путем связывания Википедии с наиболее популярной вычислительной лексикой английского языка, WordNet. Интеграция выполняется с использованием автоматического сопоставления и заполнения лексических пробелов в языках с ограниченными ресурсами с помощью статистического машинного перевода. Результатом является энциклопедический словарь , который предоставляет понятия и именованные сущности , лексикализованные на многих языках и связанные с большим количеством семантических . отношения. Дополнительные лексики и определения добавляются путем ссылки на бесплатные словарные сети, OmegaWiki, английский Wiktionary, Wikidata, FrameNet, VerbNet и другие. Подобно WordNet, BabelNet группирует слова на разных языках в наборы синонимов, которые называются Babel синсетами. Для каждого синсета Babel BabelNet предоставляет короткие определения (называемые glosses ) на многих языках, взятые из WordNet и Wikipedia.
BabelNet - это многоязычная семантическая сеть, полученная в результате интеграции WordNet и Википедии.По состоянию на февраль 2018 года BabelNet (версия 4.0) охватывает 284 языков, включая все европейские языки, большинство азиатских языки и латинский. BabelNet 4.0 содержит почти 16 миллионов синсетов и около 833 миллионов значений слов (независимо от их языка). Каждый набор синонимов Babel содержит по 2 синонима для каждого языка, то есть в среднем значения слов. Семантическая сеть включает все лексико-семантические отношения из WordNet (гипернимия и гипонимия, меронимия и холонимия, антонимия и синонимия и т. д., всего около 364 000 ребер отношений), а также недоопределенное отношение родства из Википедии (всего около 1,3 миллиарда ребер). Версия 4.0 также связывает около 53 миллионов изображений с наборами синхронизации Babel и обеспечивает кодировку ресурса Lemon RDF, доступную через конечную точку SPARQL. 2,67 миллиона синсетов присвоены метки домена.
Было показано, что BabelNet поддерживает многоязычные приложения обработки естественного языка. Было показано, что лексикализованное знание, доступное в BabelNet, дает самые современные результаты в:
BabelNet получил приз META 2015 за «новаторскую работу по преодолению языковых барьеров с помощью многоязычной лексикализованной семантической сети и онтологии с использованием разнородных источников данных».
BabelNet занял видное место в статье журнала TIME о новой эре инновационных и современных ресурсов лексических знаний, доступных в сети.