Теорема об очищении

редактировать
Равновесия смешанной стратегии объясняются как предел равновесия чистой стратегии

В теории игр, теорема очищения была предложена нобелевским лауреатом Джоном Харсани в 1973 году. Цель теоремы - оправдать загадочный аспект смешанной стратегии Равновесие по Нэшу : каждый игрок совершенно безразличен к каждому из действий, которым он придает ненулевой вес, но он смешивает их, чтобы сделать равнодушными и всех остальных игроков.

Равновесия смешанной стратегии объясняются как предел чистой стратегии равновесия для нарушенной игры неполной информации, в которой выигрыши каждого игрока известны им самим но не их противники. Идея состоит в том, что предсказанная смешанная стратегия исходной игры возникает как постоянно улучшающее приближение к игре, чего не придерживается теоретик, создавший исходную, идеализированную игру.

Очевидно смешанный характер стратегии на самом деле является просто результатом того, что каждый игрок играет чистую стратегию с пороговыми значениями, которые зависят от распределения ожидаемого по континууму выплат, которые может получить игрок. Когда этот континуум сужается до нуля, стратегии игроков сходятся к предсказанным равновесиям Нэша исходной, невозмущенной игры с полной информацией.

Результат также является важным аспектом современных исследований в эволюционной теории игр, где возмущенные значения интерпретируются как распределения по типам игроков, случайно попавших в группу для игры в игры.

Пример
CD
C3, 32, 4
D4, 20, 0
Рис. 1: Игра «Ястреб-Голубь»

Рассмотрим игру «Ястреб-Голубь», показанную здесь. В игре есть два чистой стратегии равновесия (Дефект, Сотрудничество) и (Сотрудничество, Дефект). Он также имеет смешанное равновесие, в котором каждый игрок играет Кооператив с вероятностью 2/3.

Предположим, что каждый игрок i несет дополнительную плату a i за участие в совместной игре, которая равномерно распределяется на [-A, A]. Игроки знают только свою собственную стоимость этой стоимости. Итак, это игра с неполной информацией, которую мы можем решить, используя байесовское равновесие по Нэшу. Вероятность того, что a i ≤ a *, равна (a * + A) / 2A. Если игрок 2 сотрудничает, когда a 2 ≤ a *, то ожидаемая полезность игрока 1 от сотрудничества равна −a 1 + 3 (a * + A) / 2A + 2 (1 - ( а * + А) / 2А); его ожидаемая полезность от отказа составляет 4 (a * + A) / 2A. Следовательно, он должен сам сотрудничать, когда a 1 ≤ 2-3 (a * + A) / 2A. В поисках симметричного равновесия, при котором оба игрока взаимодействуют, если a i ≤ a *, мы решаем это для a * = 1 / (2 + 3 / A). Теперь, когда мы разработали a *, мы можем вычислить вероятность того, что каждый игрок будет играть в Cooperate, как

Pr (ai ≤ a ∗) = 1 2 + 3 / A + A 2 A = A 4 ​​A 2 + 6 A + 1 2. {\ displaystyle \ Pr (a_ {i} \ leq a ^ {*}) = {\ frac {{\ frac {1} {2 + 3 / A}} + A} {2A}} = {\ frac {A } {4A ^ {2} + 6A}} + {\ frac {1} {2}}.}{\ displaystyle \ Pr (a_ {i} \ leq a ^ {*}) = {\ frac {{\ frac {1} {2 + 3 / A}} + A} {2A}} = {\ frac {A } {4A ^ {2} + 6A}} + {\ frac {1} {2}}.}

При A → 0 это приближается к 2/3 - та же вероятность, что и в смешанной стратегии в полной информации игра.

Таким образом, мы можем рассматривать равновесие смешанной стратегии как результат чистых стратегий, которым следуют игроки, у которых есть небольшой объем частной информации о своих выигрышах.

Технические детали

Доказательство Харшани включает сильное предположение, что возмущения для каждого игрока не зависят от других игроков. Однако были предприняты дальнейшие усовершенствования, чтобы сделать теорему более общей.

Главный результат теоремы состоит в том, что все равновесия смешанной стратегии данной игры могут быть очищены с использованием одной и той же последовательности нарушенных игр. Однако, помимо независимости от возмущений, он полагается на то, что набор выплат для этой последовательности игр имеет полную меру. Есть игры патологического характера, для которых это условие не выполняется.

Основная проблема с этими играми относится к одной из двух категорий: (1) различные смешанные стратегии игры очищаются различными последовательностями нарушенных игр и (2) некоторые смешанные стратегии игры включают стратегии со слабым доминированием.. Никакая смешанная стратегия, включающая стратегию со слабым доминированием, не может быть очищена с помощью этого метода, потому что, если когда-либо существует какая-либо неотрицательная вероятность того, что противник будет играть стратегию, для которой стратегия со слабым доминированием не является лучшим ответом, тогда никто никогда не захочет играть стратегия со слабым доминированием. Следовательно, ограничение не соблюдается, поскольку оно связано с разрывом.

Ссылки
Последняя правка сделана 2021-06-02 11:03:07
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте