Семантический анализ (машинное обучение)

редактировать

В машинном обучении, семантический анализ из corpus - это задача построения структур, приближающих концепции из большого набора документов. Обычно это не предполагает предварительного семантического понимания документов. метаязык, основанный на логике предикатов, может анализировать человеческую речь. Еще одна стратегия понимания семантики текста - это заземление символа. Если язык обоснован, это равносильно распознаванию машиночитаемого значения. Для ограниченной области пространственного анализа была продемонстрирована компьютерная система понимания языка.

Скрытый семантический анализ (иногда скрытое семантическое индексирование) - это класс методов, в которых документы представлены как векторы в терминологическом пространстве. Ярким примером является PLSI.

Скрытое распределение Дирихле включает приписывание терминов документа темам.

n-граммы и скрытые модели Маркова работают, представляя поток терминов в виде цепочки Маркова, где каждый термин является производным от нескольких терминов перед ним.

См. Также
Ссылки
Последняя правка сделана 2021-06-07 09:38:52
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте