Разрешение имен (семантика и извлечение текста)

редактировать

В семантике и извлечении текста разрешение имени относится к возможности программного обеспечения интеллектуального анализа текста чтобы определить, к какому фактическому человеку, действующему лицу или объекту относится конкретное использование имени. Его также можно назвать разрешение объекта.

Содержание
  • 1 Разрешение имени в простом тексте
  • 2 Разрешение имени в разных документах
  • 3 См. Также
  • 4 Ссылки
Разрешение имени в простой текст

Например, в поле интеллектуального анализа текста программе часто требуется интерпретировать следующий текст:

Джон дал Эдварду книгу. Затем он встал и позвал Джона вернуться в комнату.

В этих предложениях программа должна определить, относится ли местоимение «он» к «Джону» или «Эдварду» из первого предложения. Программа также должна определить, является ли «Джон», упомянутый во втором предложении, тем же, что «Джон» в первом предложении, или третьим лицом, имя которого также оказывается «Джон». Такие примеры применимы практически ко всем языкам, а не только к английскому.

Разрешение имен в документах

Часто этот тип разрешения имен также используется в документах, например, чтобы определить, упоминается ли «Джордж Буш » в старой газете Статья в качестве президента Соединенных Штатов (Джордж Буш-старший ) - это тот же человек, что и "Джордж Буш", упомянутый в отдельной новостной статье несколько лет спустя о человеке, который баллотируется в президенты (Джордж У.. Буш.) Поскольку многие люди могут иметь одно и то же имя, аналитики и программное обеспечение должны учитывать значительно больше информации, чем только имя, чтобы определить, действительно ли две идентичные ссылки («Джордж Буш») относятся к одному и тому же конкретному объекту или человек.

Разрешение имени / сущности в извлечении текста и семантике - общеизвестно трудная проблема, отчасти потому, что во многих случаях недостаточно информации для точного определения. Существует множество частичных решений, основанных на конкретных контекстных подсказках, обнаруженных в данных, но в настоящее время нет известного общего решения.

Проблема иногда упоминается как устранение неоднозначности имени, а для электронных библиотек - устранение неоднозначности автора.

Примеры программного обеспечения, которое может обеспечить преимущества разрешения имен, см. Также:

  • AeroText
  • AlchemyAPI
  • Attensity
  • Autonomy
  • Basis Technology
  • Dandelion API, обеспечение настраиваемого подхода к разрешению имен с использованием внутреннего графа знаний (построенного на Википедии, DBpedia и других источниках)
  • DBpedia Spotlight, обеспечивающее простой подход к разрешению имен с использованием DBpedia и Wikipedia
  • NetOwl
См. также
Ссылки
Последняя правка сделана 2021-05-31 08:53:21
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте