Принцип однократного отклонения

редактировать

Принцип одноразового отклонения (также известный как свойство одного отклонения ) - это принцип оптимальности динамического программирования, применяемый к игре. теория. В нем говорится, что профиль стратегии конечной расширенной игры является идеальным равновесием (SPE) подигры тогда и только тогда, когда не существует выгодных одноразовых отклонений для каждой подигры и каждой игрок. Проще говоря, если ни один игрок не может увеличить свои выплаты за счет отклонения одного решения или периода от своей исходной стратегии, то выбранная им стратегия является SPE. В результате ни один игрок не может получить прибыль, отклонившись от стратегии на один период, а затем вернувшись к ней.

Кроме того, принцип одноразового отклонения очень важен для игр с бесконечным горизонтом, в которых этот принцип обычно не выполняется, так как для решения невозможно рассмотреть бесконечное количество стратегий и выплат. В игре с бесконечным горизонтом, где коэффициент дисконтирования меньше 1, профиль стратегии является совершенным равновесием подигры тогда и только тогда, когда он удовлетворяет принципу одноразового отклонения.

Определения

Ниже приводится перефразированное определение из Watson (2013)

Чтобы проверить, является ли стратегия s идеальным равновесием по Нэшу в подигре, мы должны спросить каждого игрока i и в каждой вспомогательной игре, если рассматривать s, существует стратегия s ', которая дает игроку i строго более высокий выигрыш, чем s во вспомогательной игре. Этот анализ эквивалентен рассмотрению единичных отклонений от s, то есть s ’отличается от s только в одном наборе информации. Обратите внимание, что варианты, связанные с s и s ’, одинаковы для всех узлов, которые являются преемниками узлов в информационном наборе, где s и s’ предписывают разные действия.

Пример

Рассмотрим симметричную игру с двумя игроками, в которой каждый игрок принимает бинарные решения выбора, A или B, в трех последовательностях. Обратите внимание, что каждый игрок сначала видит противоположную последовательность только после выбора трех персонажей. Всего существует 8 (2) чистых стратегий для каждого игрока: {AAA, AAB, ABA, ABB, BBB, BBA, BAB, BAA}. В этом примере рассмотрим, что игрок выбирает стратегию (AAA). Чтобы проверить, является ли эта стратегия SPE, принцип одноразового отклонения гласит, что игроку необходимо проверить выплаты только трех других стратегий, которые отличаются от исходной стратегии одним отклонением, а не всеми семью другими. Этими тремя стратегиями являются: (B AA), (A B A) и (AA B ). Если ни одна из этих трех стратегий не дает более высокого выигрыша, чем (AAA), то игрок может сделать вывод, что (AAA) является SPE.

Ссылки
Последняя правка сделана 2021-06-01 11:43:57
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте