Граф знаний

редактировать
Тип базы знаний

A граф знаний - это база знаний, которая использует графическая модель данных или топология для интеграции данных. Графы знаний часто используются для хранения взаимосвязанных описаний сущностей - объектов, событий, ситуаций или абстрактных концепций - с семантикой произвольной формы.

С момента развития семантической сети, графы знаний часто связаны с связанными проектами открытых данных, уделяя особое внимание связям между концепциями и сущностями. Они также широко используются в таких поисковых системах, как Google, Bing и Yahoo ; системы знаний и службы ответов на вопросы, такие как WolframAlpha, Apple Siri и Amazon Alexa ; и социальные сети, такие как LinkedIn и Facebook.

Содержание

  • 1 История
  • 2 Определения
    • 2.1 Реализации
  • 3 Использование графа знаний для анализа данных
  • 4 См. Также
  • 5 Ссылки
  • 6 Внешние ссылки

История

Этот термин был придуман еще в 1972 году при обсуждении того, как создавать модульные системы обучения для курсов. В конце 1980-х университеты Гронингена и Твенте совместно начали проект под названием «Графы знаний», сосредоточенный на разработке семантических сетей с ребрами, ограниченными ограниченным набором отношений, чтобы упростить алгебры на график. В последующие десятилетия различия между семантическими сетями и графами знаний были размыты.

Некоторые ранние графики знаний были тематическими. В 1985 году была основана Wordnet, улавливающая семантические отношения между словами и значениями - применение этой идеи к самому языку. В 2005 году Марк Вирк основал Geonames, чтобы фиксировать взаимосвязи между различными географическими названиями, местами и связанными с ними объектами. В 1998 году Эндрю Эдмондс из Science in Finance Ltd в Великобритании создал систему под названием ThinkBase, которая предлагала рассуждения на основе нечеткой логики в графическом контексте.

В 2007 году и DBpedia, и Freebase были созданы как хранилища знаний общего назначения на основе графов. DBpedia сосредоточилась исключительно на данных, извлеченных из Википедии, в то время как Freebase также включала ряд общедоступных наборов данных. Ни те, ни другие не называли себя «графом знаний», но разработали и описали связанные концепции.

В 2012 году Google представила свою Сеть знаний, основанную на DBpedia и Freebase среди других источников. Позже они включили контент RDFa, Microdata, JSON-LD, извлеченный из проиндексированных веб-страниц, включая CIA World Factbook, Викиданные и Википедия.. Типы сущностей и отношений, связанные с этим графом знаний, были дополнительно организованы с использованием терминов из словаря schema.org. Google Сеть знаний стала успешным дополнением к поиску на основе строк в Google, а его популярность в Интернете привела к более широкому использованию этого термина.

С тех пор несколько крупных транснациональных корпораций рекламировали свои знания использование графиков, дальнейшая популяризация этого термина. К ним относятся Facebook, LinkedIn, Airbnb, Microsoft, Amazon, Uber и eBay.

Определения

Не существует единого общепринятого определения графа знаний. Большинство определений рассматривают тему через призму семантической паутины и включают следующие особенности:

  • Гибкие отношения между знаниями в тематических областях: граф знаний (i) определяет абстрактные классы и отношения сущностей в схеме, (ii) в основном описывает реальный мир объекты и их взаимосвязи, организованные в виде графа, (iii) позволяет потенциально связывать произвольные объекты друг с другом, и (iv) охватывает различные тематические области.
  • Общая структура: сеть объектов, их семантические типы, свойства и отношения.
  • Подтверждение рассуждений по предполагаемым онтологиям: граф знаний собирает и интегрирует информацию в онтологию и применяет рассуждение для получения новых знаний.

Однако существует множество представлений графов знаний, для которых некоторые из этих функций не актуальны. Для таких графов знаний это более простое определение может быть более полезным:

  • Цифровая структура, которая представляет знания как концепции и отношения между ними (факты). Граф знаний может включать в себя онтологию, которая позволяет людям и машинам понимать его содержимое и рассуждать о нем.

Реализации

В дополнение к приведенным выше примерам этот термин использовался для описания проектов открытых знаний, таких как YAGO и Викиданные ; федерации, такие как облако связанных открытых данных; ряд коммерческих инструментов поиска, в том числе Spark, помощник по семантическому поиску Yahoo, Knowledge Graph от Google и Satori от Microsoft; и диаграммы сущностей LinkedIn и Facebook. Этот термин также все чаще используется в приложениях для создания заметок, позволяющих пользователю построить свой личный граф знаний.

Использование графа знаний для анализа данных

Граф знаний формально представляет семантику, описывая сущности и их отношения. Графы знаний могут использовать онтологии в качестве слоя схемы. Делая это, они позволяют логический вывод для получения неявных знаний, а не только разрешают запросы, запрашивающие явные знания.

Чтобы разрешить использование графов знаний в различных задачах машинного обучения, было разработано несколько методов для получения латентных представлений функций сущностей и отношений. Эти вложения графа знаний позволяют подключать их к методам машинного обучения, которые требуют векторов признаков, таких как встраивания слов. Это может дополнять другие оценки концептуального сходства.

См. Также

В Викиданных : граф знаний (Q33002955)

Ссылки

Внешние ссылки

  • Will Douglas Heaven (4 сентября 2020 г.). «Этот всезнайка ИИ учится, непрерывно читая всю сеть». Обзор технологий MIT. Проверено 5 сентября 2020 г. Diffbot строит крупнейший в истории граф знаний, применяя распознавание изображений и обработку естественного языка к миллиардам веб-страниц.
Последняя правка сделана 2021-05-25 11:39:42
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте