A семантическая сеть, или сеть кадров - это база знаний, которая представляет семантические отношения между концептами в сети. Это часто используется как форма представления знаний. Это ориентированный или неориентированный граф, состоящий из вершин, которые представляют концепции, и ребер, которые представляют семантические отношения между концептами, отображение или соединение семантических полей. Семантическая сеть может быть создана как, например, база данных графа или карта понятий.
Типичные стандартизованные семантические сети выражаются как семантические тройки.
Семантические сети используются в обработка естественного языка приложения, такие как семантический синтаксический анализ и устранение смысловой неоднозначности.
Примеры использования семантических сетей в логике, ориентированных ациклических графов как мнемонического инструмента, восходят к столетиям. Самое раннее задокументированное использование - это комментарий греческого философа Порфирия к категориям Аристотеля в третьем веке нашей эры.
В истории вычислительной техники «семантические сети» для исчисления высказываний были впервые реализованы для компьютеров Ричардом Х. Риченсом из Кембриджского исследовательского отдела языка в 1956 году в качестве «interlingua » для машинного перевода из естественных языков. Хотя важность этой работы и CLRU была осознана лишь с опозданием.
Семантические сети были также независимо реализованы Робертом Ф. Симмонсом и Шелдоном Кляйном, используя в качестве основы исчисление предикатов первого порядка после того, как они были вдохновлены демонстрацией Виктора Ингве. Это направление исследований было инициировано первым президентом ассоциации [Association for Computational Linguistics] Виктором Ингве, который в 1960 году опубликовал описания алгоритмов использования грамматики фразовой структуры для генерации синтаксически правильно сформированных бессмысленных предложений. Шелдон Кляйн и Примерно в 1962-1964 годах я был очарован этой техникой и обобщил ее до метода контроля смысла того, что было создано, путем соблюдения семантических зависимостей слов в том виде, в каком они встречаются в тексте ». Другие исследователи, в первую очередь М. Росс Куиллиан и другие сотрудники System Development Corporation, помогли внести свой вклад в их работу в начале 1960-х годов в рамках проекта SYNTHEX. Именно из этих публикаций в SDC большинство современных производных от термина «семантическая сеть» цитируют как основу. Позже выдающиеся работы были выполнены Алланом М. Коллинзом и Куиллианом (например, Коллинз и Куиллиан; Коллинз и Лофтус Куиллиан). Еще позже, в 2006 году, Герман Хельбиг полностью описал MultiNet.
. В конце 1980-х два нидерландских университета, Гронинген и Твенте, совместно начали проект под названием «Графы знаний», которые являются семантическими сетями, но с дополнительным ограничением, заключающимся в том, что ребра должны быть из ограниченного набора возможных отношений, чтобы упростить алгебры на графе. В последующие десятилетия различия между семантическими сетями и графами знаний были размыты. В 2012 году Google дала своему графу знаний название Сеть знаний.
. Сеть семантических связей систематически изучалась как метод социальной семантической сети. Его базовая модель состоит из семантических узлов, семантических связей между узлами и семантического пространства, которое определяет семантику узлов и ссылок, а также правила рассуждения о семантических связях. Систематическая теория и модель были опубликованы в 2004 году. Это направление исследований можно проследить до определения правил наследования для эффективного поиска модели в 1998 году и Active Document Framework ADF. С 2003 года исследования развиваются в направлении социальных семантических сетей. Эта работа является систематическим нововведением в эпоху всемирной паутины и глобальных социальных сетей, а не приложением или простым расширением семантической сети (сети). Его цель и масштаб отличаются от семантической сети (или сети). Правила рассуждений, эволюции и автоматического обнаружения неявных ссылок играют важную роль в сети семантических ссылок. Недавно он был разработан для поддержки киберфизического и социального интеллекта. Он был использован для создания общего метода реферирования. Самоорганизующаяся сеть семантических связей была интегрирована с многомерным пространством категорий для формирования семантического пространства для поддержки расширенных приложений с многомерными абстракциями и самоорганизованными семантическими связями. Было подтверждено, что сеть семантических связей играет важную роль в понимании. и представление через приложения для обобщения текста. Для исследования особой социальной семантики, отношения конкуренции и отношения симбиоза, а также их роли в развивающемся обществе были изучены в новой теме: Киберфизический социальный интеллект
Для конкретного использования были созданы более специализированные формы семантических сетей. Например, в 2008 году докторская диссертация Фоси Бендека формализовала сеть семантического сходства (SSN), которая содержит специализированные отношения и алгоритмы распространения для упрощения представления и вычислений семантического сходства.
Семантическая сеть используется, когда человек обладает знаниями, которые лучше всего понимаются как набор концепций, связанных друг с другом.
Большинство семантических сетей основаны на когнитивных способностях. Они также состоят из дуг и узлов, которые могут быть организованы в таксономическую иерархию. Семантические сети внесли идеи активации распространения, наследования и узлов как протообъектов.
В следующем коде показан пример семантической сети на языке программирования Лисп с использованием списка ассоциаций.
(setq * database * '((canary (is-a bird) (color yellow) (size small)) (пингвин (это-птица) (движение плавать)) (птица (это-позвоночное) (имеет- часть крыльев) (воспроизводство яйцекладки))))
Чтобы извлечь всю информацию о типе «канарейка», можно использовать функцию assoc
с ключом «канарейка».
Примером семантической сети является WordNet, лексическая база данных английского языка. Он группирует английские слова в наборы синонимов, называемых синсетами, предоставляет короткие общие определения и записывает различные семантические отношения между этими наборами синонимов. Некоторые из наиболее распространенных семантических отношений: меронимия (A - мероним B, если A является частью B), холонимия (B - холоним A, если B содержит A), гипонимия (или тропонимия ) (A подчиняется B; A является разновидностью B), гипернимия (A подчиняется B), синонимия (A обозначает то же, что и B) и антонимия (A обозначает противоположность B).
Свойства WordNet были изучены с точки зрения теории сети и по сравнению с другими семантическими сетями, созданными из задач Тезаурус и ассоциации слов. С этой точки зрения все три из них представляют собой структуру маленького мира.
Также возможно представить логические описания с использованием семантических сетей, таких как экзистенциальные графы из Чарльз Сандерс Пирс или связанные с ним концептуальные графы из Джона Ф. Сова. Они обладают выразительной силой, равной или превышающей стандартную логику предикатов первого порядка. В отличие от WordNet или других лексических сетей или сетей просмотра, семантические сети, использующие эти представления, могут использоваться для надежного автоматического логического вывода. Некоторые автоматизированные средства рассуждений используют теоретико-графические особенности сетей во время обработки.
Другими примерами семантических сетей являются модели Gellish. Gellish English с его Gellish English Dictionary - это формальный язык, который определяется как сеть отношений между концептами и названиями концептов. Gellish English является формальным подмножеством естественного английского языка, так же как Gellish Dutch - формальным подмножеством голландского языка, тогда как несколько языков разделяют одни и те же концепции. Другие сети Gellish состоят из моделей знаний и информационных моделей, которые выражаются на Gellish языке. Сеть Gellish - это сеть (бинарных) отношений между вещами. Каждое отношение в сети является выражением факта, классифицируемого по типу отношения. Каждый тип отношения сам по себе является понятием, определенным в словаре гелльского языка. Каждая связанная вещь - это либо понятие, либо отдельная вещь, которая классифицируется понятием. Определения понятий созданы в форме моделей определений (сетей определений), которые вместе образуют Gellish Dictionary. Сеть Gellish может быть задокументирована в базе данных Gellish и интерпретируется компьютером.
SciCrunch - это совместно редактируемая база знаний для научных ресурсов. Он предоставляет однозначные идентификаторы (идентификаторы исследовательских ресурсов или RRID) для программного обеспечения, лабораторных инструментов и т. Д., А также предоставляет возможности для создания связей между RRID и сообществами.
Другой пример семантических сетей, основанный на теории категорий, - это ologs. Здесь каждый тип - это объект, представляющий набор вещей, а каждая стрелка - это морфизм, представляющий функцию. Коммутативные диаграммы также предписаны для ограничения семантики.
В социальных науках люди иногда используют термин семантическая сеть для обозначения сетей совместного возникновения. Основная идея состоит в том, что слова, которые одновременно встречаются в единице текста, например предложения, семантически связаны друг с другом. Связи, основанные на совместной встречаемости, затем могут использоваться для построения семантических сетей.
Существуют также тщательно продуманные типы семантических сетей, связанные с соответствующими наборами программных инструментов, используемых для лексической инженерии знаний, таких как семантическая Система сетевой обработки (SNePS ) Стюарта С. Шапиро или парадигма MultiNet Германа Хельбига, особенно подходящая для семантического представления выражений естественного языка и используемая в нескольких НЛП приложений.
Семантические сети используются в специализированных задачах поиска информации, таких как обнаружение плагиата. Они предоставляют информацию об иерархических отношениях, чтобы использовать семантическое сжатие, чтобы уменьшить языковое разнообразие и дать системе возможность сопоставить значения слов независимо от используемых наборов слов.
Сеть знаний, предложенная Google в 2012 году, на самом деле представляет собой приложение семантической сети в поисковой системе.
Моделирование множественных реляционных данных, таких как семантические сети, в низкоразмерных пространствах с помощью форм встраивания имеет преимущества в выражении взаимосвязей сущностей, а также в извлечении взаимосвязей из таких носителей, как текст. Существует множество подходов к изучению этих встраиваний, в частности, с использованием байесовских структур кластеризации или структур на основе энергии, а в последнее время - TransE (NIPS 2013). Приложения для встраивания данных базы знаний включают Анализ социальных сетей и Извлечение отношений.
На Wikimedia Commons есть материалы, связанные с семантическими сетями. |