Согласованная эвристика

редактировать

В При исследовании проблем поиска пути в искусственном интеллекте эвристическая функция называется непротиворечивой или монотонной, если его оценка всегда меньше или равна расчетному расстоянию от любой соседней вершины до цели, плюс стоимость достижения этого соседа.

Формально для каждого узла N и каждого преемника P из N оценочная стоимость достижения цели из N не превышает стоимость шага перехода к P плюс оценочная стоимость достижение цели из P. То есть:

h (N) ≤ c (N, P) + h (P) {\ displaystyle h (N) \ leq c (N, P) + h (P)}h (N) \ leq c (N, P) + h (P) и
h (G) = 0. {\ displaystyle h (G) = 0. \,}h (G) = 0. \,

где

  • h - согласованная эвристическая функция
  • N - любой узел в графе
  • P является любым потомком N
  • G является любым целевым узлом
  • c (N, P) - это стоимость достижения узла P из N

Последовательная эвристика также допустима, т. Е. Она никогда не переоценивает стоимость достижения цели (обратное, однако, не всегда верно). Это доказывается индукцией по m {\ displaystyle m}m , длине наилучшего пути от узла к цели. По предположению час (N m) ≤ h ∗ (N m) {\ displaystyle h (N_ {m}) \ leq h ^ {*} (N_ {m})}h (N_ {m}) \ leq h ^ {*} (N_ { m}) , где h ∗ (n) {\ displaystyle h ^ {*} (n)}h ^ {*} (n) обозначает стоимость кратчайшего пути от n до цели. Следовательно,

h (N m + 1) ≤ c (N m + 1, N m) + h (N m) ≤ c (N m + 1, N m) + h ∗ (N m) = h ∗. (N m + 1) {\ displaystyle h (N_ {m + 1}) \ leq c (N_ {m + 1}, N_ {m}) + h (N_ {m}) \ leq c (N_ {m + 1}, N_ {m}) + h ^ {*} (N_ {m}) = h ^ {*} (N_ {m + 1})}h (N _ {{m + 1}}) \ leq c (N _ {{m + 1}}, N_ {m}) + h (N_ {m}) \ leq c (N _ {{m + 1}}, N_ {m}) + h ^ {*} (N_ {m}) = h ^ {*} (N _ {{m + 1}}) ,

, что делает его допустимым. (N m + 1 {\ displaystyle N_ {m + 1}}N _ {{m + 1}} - любой узел, лучший путь которого к цели длиной m + 1 проходит через некоторый непосредственный дочерний элемент N m {\ displaystyle N_ {m}}N_ {{m}} , наилучший путь которого к цели имеет длину m.)

.

Последствия монотонности
Сравнение допустимой, но непоследовательной функции эвристической оценки.

Согласованная эвристика называется монотонной, потому что оценочная окончательная стоимость частичного решения, f (N j) = g (N j) + h (N j) {\ displaystyle f (N_ {j}) = g (N_ {j}) + h (N_ {j})}f (N_ {j}) = g (N_ {j}) + h (N_ {j}) монотонно неубывает по лучшему пути к цели, где g (N j) = ∑ i = 2 jc (N i - 1, N i) {\ displaystyle g (N_ {j}) = \ sum _ {i = 2} ^ {j} c (N_ {i-1}, N_ {i})}g (N_ {j}) = \ sum _ {{i = 2}} ^ { j} c (N _ {{i-1}}, N_ {i}) - стоимость наилучшего пути от начального узла N 1 {\ displaystyle N_ {1}}N_ {1} до N j {\ displaystyle N_ {j}}N_ {j} . Это необходимо и достаточно, чтобы эвристика подчинялась неравенству треугольника , чтобы быть согласованной.

В алгоритме поиска A * использование согласованной эвристики означает, что однажды узел расширяется, стоимость, с которой он был достигнут, является минимально возможной, при тех же условиях, которые требует алгоритм Дейкстры при решении задачи о кратчайшем пути (без циклов с отрицательной стоимостью). Фактически, если для поискового графа задана стоимость c '(N, P) = c (N, P) + h (P) - h (N) {\ displaystyle c' (N, P) = c ( N, P) + h (P) -h (N)}c'(N,P)=c(N,P)+h(P)-h(N)для согласованного h {\ displaystyle h}h , тогда A * эквивалентно поиску по первому наилучшему на этом графе с использованием алгоритма Дейкстры. В необычном случае, когда допустимая эвристика несовместима, узел будет нуждаться в повторном расширении каждый раз, когда для него будет достигнута новая лучшая (на данный момент) стоимость.

Если данная эвристика h {\ displaystyle h}h допустима, но не согласована, можно искусственно заставить эвристические значения вдоль пути быть монотонно неубывающими, используя

h ′ (P) ← max (h (P), h ′ (N) - c (N, P)) {\ displaystyle h '(P) \ gets \ max (h (P), h' (N) -c (N, P))}{\displaystyle h'(P)\gets \max(h(P),h'(N)-c(N,P))}

в качестве эвристического значения для P {\ displaystyle P}P вместо h (P) {\ displaystyle h (P)}{\ displaystyle h (P)} , где N {\ displaystyle N}N - это узел, непосредственно предшествующий P {\ displaystyle P}P на пути, а ч '(начало) = ч (начало) {\ Displaystyle ч' (начало) = ч (начало)}{\displaystyle h'(start)=h(start)}. Эта идея принадлежит Ласло Меро и теперь известна как pathmax. Вопреки распространенному мнению, pathmax не превращает допустимую эвристику в последовательную эвристику. Например, если A * использует pathmax и эвристику, которая допустима, но не согласована, не гарантируется наличие оптимального пути к узлу при первом расширении.

См. Также
Список литературы
  1. ^Перл, Иудея (1984). Эвристика: стратегии интеллектуального поиска для решения компьютерных проблем. Эддисон-Уэсли. ISBN 0-201-05594-5.
  2. ^Эделькамп, Стефан; Шредль, Стефан (2012). Эвристический поиск: теория и приложения. Морган Кауфманн. ISBN 978-0-12-372512-7.
  3. ^Меро, Ласло (1984). «Алгоритм эвристического поиска с изменяемой оценкой». Искусственный интеллект. 23 : 13–27. DOI : 10.1016 / 0004-3702 (84) 90003-1.
  4. ^Холте, Роберт (2005). «Распространенные заблуждения относительно эвристического поиска». Материалы третьего ежегодного симпозиума по комбинаторному поиску (SoCS).
Последняя правка сделана 2021-05-15 10:10:34
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте