A граф знаний - это база знаний, которая использует графическая модель данных или топология для интеграции данных. Графы знаний часто используются для хранения взаимосвязанных описаний сущностей - объектов, событий, ситуаций или абстрактных концепций - с семантикой произвольной формы.
С момента развития семантической сети, графы знаний часто связаны с связанными проектами открытых данных, уделяя особое внимание связям между концепциями и сущностями. Они также широко используются в таких поисковых системах, как Google, Bing и Yahoo ; системы знаний и службы ответов на вопросы, такие как WolframAlpha, Apple Siri и Amazon Alexa ; и социальные сети, такие как LinkedIn и Facebook.
Этот термин был придуман еще в 1972 году при обсуждении того, как создавать модульные системы обучения для курсов. В конце 1980-х университеты Гронингена и Твенте совместно начали проект под названием «Графы знаний», сосредоточенный на разработке семантических сетей с ребрами, ограниченными ограниченным набором отношений, чтобы упростить алгебры на график. В последующие десятилетия различия между семантическими сетями и графами знаний были размыты.
Некоторые ранние графики знаний были тематическими. В 1985 году была основана Wordnet, улавливающая семантические отношения между словами и значениями - применение этой идеи к самому языку. В 2005 году Марк Вирк основал Geonames, чтобы фиксировать взаимосвязи между различными географическими названиями, местами и связанными с ними объектами. В 1998 году Эндрю Эдмондс из Science in Finance Ltd в Великобритании создал систему под названием ThinkBase, которая предлагала рассуждения на основе нечеткой логики в графическом контексте.
В 2007 году и DBpedia, и Freebase были созданы как хранилища знаний общего назначения на основе графов. DBpedia сосредоточилась исключительно на данных, извлеченных из Википедии, в то время как Freebase также включала ряд общедоступных наборов данных. Ни те, ни другие не называли себя «графом знаний», но разработали и описали связанные концепции.
В 2012 году Google представила свою Сеть знаний, основанную на DBpedia и Freebase среди других источников. Позже они включили контент RDFa, Microdata, JSON-LD, извлеченный из проиндексированных веб-страниц, включая CIA World Factbook, Викиданные и Википедия.. Типы сущностей и отношений, связанные с этим графом знаний, были дополнительно организованы с использованием терминов из словаря schema.org. Google Сеть знаний стала успешным дополнением к поиску на основе строк в Google, а его популярность в Интернете привела к более широкому использованию этого термина.
С тех пор несколько крупных транснациональных корпораций рекламировали свои знания использование графиков, дальнейшая популяризация этого термина. К ним относятся Facebook, LinkedIn, Airbnb, Microsoft, Amazon, Uber и eBay.
Не существует единого общепринятого определения графа знаний. Большинство определений рассматривают тему через призму семантической паутины и включают следующие особенности:
Однако существует множество представлений графов знаний, для которых некоторые из этих функций не актуальны. Для таких графов знаний это более простое определение может быть более полезным:
В дополнение к приведенным выше примерам этот термин использовался для описания проектов открытых знаний, таких как YAGO и Викиданные ; федерации, такие как облако связанных открытых данных; ряд коммерческих инструментов поиска, в том числе Spark, помощник по семантическому поиску Yahoo, Knowledge Graph от Google и Satori от Microsoft; и диаграммы сущностей LinkedIn и Facebook. Этот термин также все чаще используется в приложениях для создания заметок, позволяющих пользователю построить свой личный граф знаний.
Граф знаний формально представляет семантику, описывая сущности и их отношения. Графы знаний могут использовать онтологии в качестве слоя схемы. Делая это, они позволяют логический вывод для получения неявных знаний, а не только разрешают запросы, запрашивающие явные знания.
Чтобы разрешить использование графов знаний в различных задачах машинного обучения, было разработано несколько методов для получения латентных представлений функций сущностей и отношений. Эти вложения графа знаний позволяют подключать их к методам машинного обучения, которые требуют векторов признаков, таких как встраивания слов. Это может дополнять другие оценки концептуального сходства.
В Викиданных : граф знаний (Q33002955) |
Diffbot строит крупнейший в истории граф знаний, применяя распознавание изображений и обработку естественного языка к миллиардам веб-страниц.