Индуктивное логическое программирование

редактировать

Индуктивное логическое программирование (ILP ) - это подполе символического искусственного интеллекта, который использует логическое программирование как единое представление для примеров, базовых знаний и гипотез. С учетом кодирования известных исходных знаний и набора примеров, представленных в виде логической базы данных фактов, система ILP будет выводить гипотетическую логическую программу, которая влечет за собой все положительное и ничего из отрицательные примеры.

Схема: положительные примеры + отрицательные примеры + базовые знания ⇒ гипотеза.

Индуктивное логическое программирование особенно полезно в биоинформатике и обработке естественного языка. Гордон Плоткин и Эхуд Шапиро заложили первоначальную теоретическую основу для индуктивного машинного обучения в логической среде. Шапиро построил свою первую реализацию (Model Inference System) в 1981 году: программу Prolog, которая индуктивно выводила логические программы из положительных и отрицательных примеров. Термин «индуктивное логическое программирование» был впервые представлен в статье Стивена Магглетона в 1991 году. Магглетон также основал ежегодную международную конференцию по индуктивному логическому программированию, представил теоретические идеи изобретения предикатов, Обратное разрешение, и обратное следствие. Muggleton первым реализовал обратное следование в системе PROGOL. Термин «индуктивный» здесь относится к философской (т. Е. Предложению теории для объяснения наблюдаемых фактов), а не к математической (т. Е. К доказательству свойства для всех членов хорошо упорядоченного множества) индукции..

Содержание

1 Формальное определение
2 Пример
3 Система индуктивного логического программирования
- 3.1 Поиск гипотез
- 3.2 Реализации
4 См. Также
5 Ссылки
6 Далее чтение

Формальное определение

Базовые знания даются в виде теории логики B, обычно в форме предложений Хорна, используемых в логическом программировании. Положительный и отрицательный примеры даны как союз $E + {\ displaystyle E ^ {+}}$ $E^{+}$ и $E - {\ displaystyle E ^ {-}}$ $E ^ {-}$ незадействованных и инвертированных ground литералов соответственно. Правильная гипотеза h - это логическое предложение, удовлетворяющее следующим требованиям.

Необходимость: B ⊭ E + Достаточность: B ∧ h ⊨ E + Слабая согласованность: B ∧ h ⊭ false Сильная согласованность: B ∧ h ∧ E - ⊭ false { \ displaystyle {\ begin {array} {llll} {\ text {Necessity:}} B \ not \ models E ^ {+} \\ {\ text {Достаточность:}} B \ land h \ color {blue} {\ models} E ^ {+} \\ {\ text {Слабая согласованность:}} B \ land h \ not \ models {\ textit {false}} \\ {\ text {Сильная согласованность:}} B \ land h \ land E ^ {-} \ not \ models {\ textit {false}} \ end {array}}}

{\ displaystyle {\ begin {array} {llll} {\ text {Необходимость:}} B \ not \ models E ^ {+} \\ {\ text {Достаточность:}} B \ land h \ color {blue} {\ mo dels} E ^ {+} \\ {\ text {Слабая согласованность:}} B \ land h \ not \ models {\ textit {false}} \\ {\ text {Сильная согласованность:}} B \ land h \ земля E ^ {-} \ not \ models {\ textit {false}} \ end {array}}}

«Необходимость» не налагает ограничения на h, но запрещает любое создание гипотезы, пока положительные факты объяснимы и без него. «Достаточность» требует, чтобы любая сгенерированная гипотеза h объясняла все положительные примеры $E + {\ displaystyle E ^ {+}}$ $E^{+}$ . «Слабая согласованность» запрещает создание любой гипотезы h, которая противоречит фоновым знаниям B. «Сильная согласованность» также запрещает создание любой гипотезы h, которая несовместима с отрицательными примерами $E - {\ displaystyle E ^ {-}}$ $E ^ {-}$ , учитывая базовые знания B; это подразумевает «Слабую последовательность»; если не приводятся отрицательные примеры, оба требования совпадают. Джероски требует только «Достаточность» (называемая там «Полнота») и «Сильная согласованность».

Пример

Предполагаемые семейные отношения в разделе «Пример»

В следующем хорошо известном примере изучения определений семейных отношений используются сокращения

par: parent, fem: female, dau: дочь., g: Джордж, h: Хелен, m: Мэри, t: Том, n: Нэнси и e: Ева.

Все начинается с базовых знаний (см. рисунок)

par (h, m) ∧ par (час, t) ∧ par (g, m) ∧ par (t, e) ∧ par (n, e) ∧ fem (h) ∧ fem (m) ∧ fem (n) ∧ fem (e) {\ displaystyle {\ textit {par}} (h, m) \ land {\ textit {par}} (h, t) \ land {\ textit {par}} (g, m) \ land {\ textit {par}} ( t, e) \ land {\ textit {par}} (n, e) \ land {\ textit {fem}} (h) \ land {\ textit {fem}} (m) \ land {\ textit {fem} } (n) \ land {\ textit {fem}} (e)}

{\ textit {par}} (h, m) \ land {\ textit { par}} (h, t) \ land {\ textit {par}} (g, m) \ land {\ textit {par}} (t, e) \ land {\ textit {par}} (n, e) \ land {\ textit {fem}} (h) \ land {\ textit {fem}} (m) \ land {\ textit {fem}} (n) \ land {\ textit {fem}} (e)

положительные примеры

dau (m, h) ∧ dau (e, t) {\ displaystyle {\ textit {dau}} ( m, h) \ land {\ textit {dau}} (e, t)}

{\ textit {dau}} (m, h) \ land {\ textit {dau}} (e, t)

и тривиальное утверждение истинно для обозначения отсутствия отрицательных примеров.

Для получения предложения о том, как формально определить дочернее отношение dau, следует использовать подход Плоткина к индуктивному логическому программированию "относительного наименьшего общего обобщения (rlgg)".

В этом подходе используются следующие шаги.

Релятивизируйте каждый положительный пример литерала с полным базовым знанием:
$dau (m, h) ← par (h, m) ∧ par (h, t) ∧ par (g, m) ∧ par (t, e) ∧ par (n, e) ∧ fem (h) ∧ fem (m) ∧ fem (n) ∧ fem (e) dau (e, t) ← par (h, m) ∧ par (h, t) ∧ par (g, m) ∧ par (t, e) ∧ par (n, e) ∧ fem (h) ∧ fem (m) ∧ fem (n) ∧ fem (e) {\ displaystyle {\ begin {align} {\ textit {dau}} (m, h) \ leftarrow {\ textit {par}} (h, m) \ land {\ textit {par}} (h, t) \ land {\ textit {par}} (g, m) \ land {\ textit {par}} (t, e) \ land {\ textit {par}} (n, e) \ land {\ textit {fem}} (h) \ land {\ textit {fem} } (m) \ land {\ textit {fem}} (n) \ land {\ textit {fem}} (e) \\ {\ textit {dau}} (e, t) \ leftarrow {\ textit {par} } (h, m) \ land {\ textit {par}} (h, t) \ land {\ textit {par}} (g, m) \ land {\ textit {par}} (t, e) \ land {\ textit {par}} (n, e) \ land {\ textit {fem}} (h) \ land {\ textit {fem}} (m) \ land {\ textit {fem}} (n) \ land {\ textit {fem}} (e) \ end {align}}}$ ${\ displaystyle {\ begin {align} {\ textit {dau }} (m, h) \ leftarrow {\ textit {par}} (h, m) \ land {\ textit {par}} (h, t) \ land {\ textit {par}} (g, m) \ земля {\ textit {par}} (t, e) \ land {\ textit {par}} (n, e) \ land {\ textit {fem}} (h) \ land {\ textit {fem}} (m) \ land {\ textit {fem}} (n) \ land {\ textit {fem}} (e) \\ {\ textit {dau}} (e, t) \ leftarrow {\ textit {par}} (h, m) \ land {\ textit {par}} (h, t) \ land {\ textit {par}} (g, m) \ land {\ textit {par}} (t, e) \ land {\ textit {par}} (n, e) \ land {\ textit {fe m}} (h) \ land {\ textit {fem}} (m) \ land {\ textit {fem}} (n) \ land {\ textit {fem}} (e) \ end {align}}}$ ,
Преобразовать в нормальную форму предложения :
$dau (m, h) ∨ ¬ par (h, m) ∨ ¬ par (h, t) ∨ ¬ par (g, m) ∨ ¬ par (t, e) ∨ ¬ par (n, e) ∨ ¬ fem (h) ∨ ¬ fem (m) ∨ ¬ fem (n) ∨ ¬ fem (e) dau (e, t) ∨ ¬ par (h, m) ∨ ¬ par (h, t) ∨ ¬ par (g, m) ∨ ¬ par (t, e) ∨ ¬ par (n, е) ∨ ¬ fem (час) ∨ ¬ fem (m) ∨ ¬ fem (n) ∨ ¬ fem (e) {\ displaystyle {\ begin {align} {\ textit {dau}} (m, h) \ lor \ lnot {\ textit {par}} (h, m) \ lor \ lnot {\ textit {par}} (h, t) \ lor \ lnot {\ textit {par}} (g, m) \ lor \ lnot {\ textit {par}} (t, e) \ lor \ lnot {\ textit {par}} (n, e) \ lor \ lnot {\ textit {fem}} (h) \ lor \ lnot {\ textit { fem}} (м) \ lor \ lnot {\ textit {fem}} (n) \ lor \ lnot {\ textit {fem}} (e) \\ {\ textit {dau}} (e, t) \ lor \ lnot {\ textit {par}} (h, m) \ lor \ lnot {\ textit {par}} (h, t) \ lor \ lnot {\ textit {par}} (g, m) \ lor \ lnot {\ textit {par}} (t, e) \ lor \ lnot {\ textit {par}} (n, e) \ lor \ lnot {\ textit {fem}} (h) \ lor \ lnot {\ textit { fem}} (m) \ lor \ lnot {\ textit {fem}} (n) \ lor \ lnot {\ textit {fem}} (e) \ end {align}}}$ ${\ displaystyle {\ begin {align} {\ textit { dau}} (m, h) \ lor \ lnot {\ textit {par}} (h, m) \ lor \ lnot {\ textit {par}} (h, t) \ lor \ lnot {\ textit {par}} (g, m) \ lor \ lnot {\ textit {par}} (t, e) \ lor \ lnot {\ textit {par}} (n, e) \ lor \ lnot {\ textit {fem}} (h) \ lor \ lnot {\ textit {fem}} (m) \ lor \ lnot {\ textit {fem}} ( п) \ lor \ lnot {\ textit {fem}} (e) \\ {\ textit {dau}} (e, t) \ lor \ lnot {\ textit {par}} (h, m) \ lor \ lnot {\ textit {par}} (h, t) \ lor \ lnot {\ textit {par}} (g, m) \ lor \ lnot {\ textit {par}} (t, e) \ lor \ lnot {\ textit {par}} (n, e) \ lor \ lnot {\ textit {fem}} (h) \ lor \ lnot {\ textit {fem}} (m) \ lor \ lnot {\ textit {fem}} ( n) \ lor \ lnot {\ textit {fem}} (e) \ end {align}}}$ ,
Анти-унификация каждая совместимая пара литералов:
- $dau (xme, xht) {\ displaystyle {\ textit {dau}} (x_ {me}, x_ {ht})}$ ${\ textit {dau}} (x_ { {me}}, x _ {{ht}})$ из $dau (m, h) {\ displaystyle {\ textit {dau}} ( m, h)}$ ${\ textit {dau}} (m, h)$ и $dau (e, t) {\ displaystyle {\ textit {dau}} (e, t)}$ ${\ textit {dau}} (e, t)$ ,
- $¬ par (xht, xme) {\ displaystyle \ lnot {\ textit {par}} (x_ {ht}, x_ {me})}$ $\ lnot {\ textit {par}} (x _ {{ht} }, x _ {{me}})$ из $¬ par (h, m) {\ displaystyle \ lnot {\ textit {par}} (h, m)}$ $\ lnot {\ textit {par}} (h, m)$ и $¬ par (t, e) {\ displaystyle \ lnot {\ textit {par}} (t, e)}$ $\ lnot { \ textit {par}} (t, e)$ ,
- $¬ fem (xme) { \ displaystyle \ lnot {\ textit {fem}} (x_ {me})}$ $\ lnot {\ textit {fem}} (x _ {{ меня}})$ из $¬ fem (m) {\ displaystyle \ lnot {\ textit {fem}} (m)}$ $\ lnot {\ textit {fem}} (m)$ и $¬ fem (e) {\ displaystyle \ lnot {\ textit {fem}} (e)}$ $\ lnot {\ textit {fem}} (e)$ ,
- $¬ par (g, m) {\ displaystyle \ lnot {\ textit {par }} (g, m)}$ $\ lnot {\ textit {par}} (g, m)$ из $¬ par (g, m) {\ displaystyle \ lnot {\ textit {par}} (g, m)}$ $\ lnot {\ textit {par}} (g, m)$ и $¬ par (g, m) {\ displaystyle \ lnot {\ textit {par}} (g, m)}$ $\ lnot {\ textit {par}} (g, m)$ , аналогично для всех других литералов фоновых знаний
- $¬ par (xgt, xme) {\ displaystyle \ lnot {\ textit {par}} (x_ {gt}, x_ {me})}$ $\ lnot {\ textit {par}} (x _ {{gt}}, x _ {{me}})$ из $¬ par (g, m) {\ displaystyle \ lnot {\ textit {par}} (g, m)}$ $\ lnot {\ textit {par}} (g, m)$ и $¬ par ( t, e) {\ displaystyle \ lnot {\ textit {par}} (t, e)}$ $\ lnot { \ textit {par}} (t, e)$ и многие другие отрицательные литералы
Удалите все отрицательные литералы, содержащие переменные, которые не встречаются в положительный литерал:
- после удаления всех отрицательных литералов, содержащих другие переменные, кроме $xme, xht {\ displaystyle x_ {me}, x_ {ht}}$ $x_{{me}},x_{{ht}}$ , только $dau ( xme, xht) ∨ ¬ par (xht, xme) ∨ ¬ fem (xme) {\ displaystyle {\ textit {dau}} (x_ {me}, x_ {ht}) \ lor \ lnot {\ textit {par}} (x_ {ht}, x_ {me}) \ lor \ lnot {\ textit {fem}} (x_ {me})}$ ${\ textit {dau}} (x _ {{me}}, x _ {{ht}}) \ lor \ lnot {\ textit {par}} (x _ {{ht}}, x _ {{me}}) \ lor \ lnot {\ textit {fem}} (x _ {{меня }})$ остается вместе со всеми наземными литералами из фоновых знаний
Преобразовать предложения обратно в форму Рога:
- $dau (xme, xht) ← par (xht, xme) ∧ fem (xme) ∧ (все основные факты знаний) {\ displaystyle {\ textit {dau}} (x_ {me}, x_ {ht}) \ leftarrow {\ textit {par}} (x_ {ht}, x_ {me}) \ land {\ textit {fem}} (x_ {me}) \ land ({\ text {all background k теперь знание фактов}})}$ ${\ textit {dau}} (x _ {{me}}, x _ {{ht}}) \ leftarrow {\ textit {par}} (x _ {{ ht}}, x _ {{me}}) \ land {\ textit {fem}} (x _ {{me}}) \ land ({\ text {все основные факты о знаниях}})$

Результирующее предложение Хорна - это гипотеза h, полученная с помощью подхода rlgg. Игнорируя фоновые факты знаний, предложение неофициально гласит: « $xme {\ displaystyle x_ {me}}$ $x _ {{me}}$ называется дочерью $xht {\ displaystyle x_ {ht}}$ $x _ {{ht}}$ , если $xht {\ displaystyle x_ {ht}}$ $x _ {{ht}}$ является родительским для $xme {\ displaystyle x_ {me}}$ $x _ {{me}}$ и $xme {\ displaystyle x_ {me}}$ $x _ {{me}}$ - женский ", что является общепринятым определением.

Что касается требований выше, «Необходимость» была удовлетворена, поскольку предикат dau не появляется в фоновых знаниях, что, следовательно, не может подразумевать какое-либо свойство, содержащее этот предикат, например положительные примеры находятся. «Достаточность» удовлетворяется вычисленной гипотезой h, поскольку она вместе с $par (h, m) ∧ fem (m) {\ displaystyle {\ textit {par}} (h, m) \ land {\ textit {fem}} (m)}$ ${\ textit {par}} (h, m) \ land {\ textit {fem}} (m)$ из базовых знаний подразумевает первый положительный пример $dau (m, h) {\ displaystyle {\ textit {dau}} (m, h)}$ ${\ textit {dau}} (m, h)$ , и аналогично h и $par (t, e) ∧ fem (e) {\ displaystyle {\ textit {par}} (t, e) \ land {\ textit {fem}} (e)}$ ${\ textit {par}} (t, e) \ land {\ textit {fem}} (e)$ из базовых знаний подразумевает второй положительный пример $dau (e, t) {\ displaystyle {\ textit {dau}} (e, t)}$ ${\ textit {dau}} (e, t)$ . «Слабая согласованность» удовлетворяется h, поскольку h выполняется в (конечной) структуре Эрбранда, описанной фоновыми знаниями; аналогично «Сильная консистенция».

Распространенное определение отношения бабушки, а именно. $гра (x, z) ← fem (x) ∧ par (x, y) ∧ par (y, z) {\ displaystyle {\ textit {gra}} (x, z) \ leftarrow {\ textit {fem }} (x) \ land {\ textit {par}} (x, y) \ land {\ textit {par}} (y, z)}$ ${\ textit {gra}} (x, z) \ leftarrow {\ textit {fem}} (x) \ land {\ textit {par}} (x, y) \ land {\ textit {par}} (y, z)$ , не может быть изучен с использованием вышеуказанного подхода, поскольку переменная y встречается только в теле предложения; соответствующие литералы были бы удалены на 4-м шаге подхода. Чтобы преодолеть этот недостаток, этот шаг необходимо модифицировать так, чтобы его можно было параметризовать с помощью различных буквальных эвристик после выбора. Исторически реализация GOLEM основана на подходе rlgg.

Система индуктивного логического программирования

Система индуктивного логического программирования - это программа, которая принимает в качестве входных логических теорий $B, E +, E - {\ displaystyle B, E ^ {+}, E ^ {-}}$ $B, E ^ {+}, E ^ {-}$ и выводит правильную гипотезу H относительно теорий $B, E +, E - {\ displaystyle B, E ^ {+}, E ^ {-}}$ $B, E ^ {+}, E ^ {-}$ Алгоритм системы ILP состоит из двух частей: поиска гипотезы и выбора гипотезы. Сначала выполняется поиск гипотезы с помощью процедуры индуктивного логического программирования, затем подмножество найденных гипотез (в большинстве систем одна гипотеза) выбирается алгоритмом выбора. Алгоритм выбора оценивает каждую из найденных гипотез и возвращает те, которые имеют наивысшую оценку. Пример функции оценки включает минимальную длину сжатия, когда гипотеза с наименьшей сложностью Колмогорова имеет наивысшую оценку и возвращается. Система ILP является полной, если для любых теорий входной логики $B, E +, E - {\ displaystyle B, E ^ {+}, E ^ {-}}$ $B, E ^ {+}, E ^ {-}$ любая правильная гипотеза H относительно эти теории ввода можно найти с помощью процедуры поиска гипотез.

Поиск гипотез

Современные системы ILP, такие как Progol, Hail и Imparo, находят гипотезу H, используя принцип обратного следования теорий B, E, H: $B ∧ H ⊨ E ⟺ В ∧ ¬ E ⊨ ¬ H {\ displaystyle B \ land H \ models E \ iff B \ land \ neg E \ models \ neg H}$ $B \ land H \ models E \ iff B \ land \ neg E \ models \ neg H$ . Сначала они создают промежуточную теорию F, называемую теорией мостов, удовлетворяющую условиям $B ∧ ¬ E ⊨ F {\ displaystyle B \ land \ neg E \ models F}$ $B \ land \ neg E \ models F$ и $F ⊨ ¬ H {\ Displaystyle F \ models \ neg H}$ $F \ модели \ neg H$ . Затем, как $H ⊨ ¬ F {\ displaystyle H \ models \ neg F}$ $H \ models \ neg F$ , они обобщают отрицание теории моста F с анти-следствием. Однако операция анти-следствия, поскольку она сильно недетерминирована, требует больших вычислительных затрат. Следовательно, поиск альтернативной гипотезы может быть проведен с использованием операции обратного подчинения (анти-подчинения), которая менее недетерминирована, чем анти-влечение.

Возникают вопросы полноты процедуры поиска гипотезы конкретной системы ПДОДИ. Например, процедура поиска гипотезы Прогола, основанная на правиле вывода обратного следования, не завершается в примере Ямамото . С другой стороны, Imparo завершается как процедурой предотвращения вовлечения, так и своей расширенной процедурой обратного подчинения.

Реализации

1BC и 1BC2: наивные байесовские классификаторы первого порядка:
ACE (A Combined Engine)
Aleph
Atom
Claudien
DL-Learner
DMax
FastLAS (быстрое обучение на основе наборов ответов)
FOIL
Golem (ILP)
ILASP (индуктивное изучение программ наборов ответов)
Imparo
Inthelex (инкрементальный изучающий теорию из примеров)
Лайм
Метагол
Mio
MIS (Система вывода моделей) от Эхуда Шапиро
PROGOL
RSD
Warmr (теперь включен в ACE)
ProGolem

См. Также

Ссылки

Дополнительная литература