Концепция решения

редактировать
Выбрано равновесные уточнения в теории игр. Стрелки указывают от уточнения к более общему понятию (например, ESS ⊂ {\ displaystyle \ subset}\ subset Собственно).

В теории игр, a Концепция решения - это формальное правило для предсказания того, как будет проходить игра. Эти прогнозы называются «решениями» и описывают, какие стратегии будут приняты игроками и, следовательно, результат игры. Наиболее часто используемые концепции решения - это концепции равновесия, наиболее известная - равновесие по Нэшу.

Многие концепции решений для многих игр приводят к более чем одному решению. Это ставит под сомнение любое из решений, поэтому теоретик игр может применить уточнение, чтобы сузить круг решений. Каждая концепция последовательного решения, представленная ниже, улучшает предыдущую, устраняя неправдоподобные равновесия в более богатых играх.

Содержание
  • 1 Формальное определение
  • 2 Рационализируемость и повторяющееся доминирование
  • 3 Равновесие Нэша
  • 4 Обратная индукция
  • 5 Совершенное равновесие Нэша в подиграх
  • 6 Идеальное байесовское равновесие
  • 7 Вперед индукция
  • 8 См. также
  • 9 Ссылки
Формальное определение

Пусть Γ {\ displaystyle \ Gamma}\ Gamma будет классом всех игр и для каждой игра G ∈ Γ {\ displaystyle G \ in \ Gamma}G \ in \ Gamma , пусть SG {\ displaystyle S_ {G}}S_ {G} будет набором стратегии профили из G {\ displaystyle G}G . Концепция решения - это элемент прямого произведения Π G ∈ Γ 2 S G; {\ Displaystyle \ Pi _ {G \ in \ Gamma} 2 ^ {S_ {G}};}\ Pi _ {{G \ in \ Gamma}} 2 ^ {{S_ {G}}}; т.е. функция F: Γ → ⋃ G ∈ Γ 2 SG {\ displaystyle F : \ Gamma \ rightarrow \ bigcup \ nolimits _ {G \ in \ Gamma} 2 ^ {S_ {G}}}F: \ Gamma \ rightarrow \ bigcup \ nolimits _ {{G \ in \ Gamma}} 2 ^ {{S_ {G} }} такой, что F (G) ⊆ SG {\ displaystyle F (G) \ substeq S_ {G}}F (G) \ substeq S_ {G} для всех G ∈ Γ. {\ displaystyle G \ in \ Gamma.}G \ in \ Gamma.

Рационализируемость и повторяющееся доминирование

В этой концепции решения предполагается, что игроки рациональны, и поэтому стратегии строго доминируют исключены из набора стратегий, которые могут быть реализованы. Стратегия строго доминирует, когда игроку доступна какая-то другая стратегия, которая всегда имеет более высокий выигрыш, независимо от стратегий, выбранных другими игроками. (Строго доминирующие стратегии также важны в minimax поиске по дереву игр.) Например, в (одной точке) дилемма заключенных (показано ниже), Кооперировать строго доминирует дефект для обоих игроков, потому что любому игроку всегда лучше играть дефект, независимо от того, что делает его оппонент.

Заключенный 2 сотрудничаетДефект заключенного 2
Заключенный 1 сотрудничает−0,5, −0,5−10, 0
Дефект заключенного 10, −10−2, −2
Равновесие Нэша

Равновесие Нэша - это профиль стратегии (профиль стратегии определяет стратегию для каждого игрока, например, в вышеупомянутой игре дилеммы заключенного (сотрудничать, дефект) указывается, что заключенный 1 играет в кооператив, а игрок 2 играет в дефект), в которой каждая стратегия является лучшим ответом на любую другую сыгранную стратегию. Стратегия игрока - это лучший ответ на стратегию другого игрока, если не существует другой стратегии, которую можно было бы разыграть, которая принесла бы более высокий выигрыш в любой ситуации, в которой используется стратегия другого игрока.

Обратная индукция

Есть игры, в которых есть несколько равновесий по Нэшу, некоторые из которых нереалистичны. В случае динамических игр нереалистичные равновесия по Нэшу могут быть устранены путем применения обратной индукции, которая предполагает, что будущая игра будет рациональной. Следовательно, он устраняет ненадежные угрозы, потому что такие угрозы было бы нерационально реализовывать, если бы игрок когда-либо был призван сделать это.

Например, рассмотрим динамическую игру, в которой игроки являются действующей фирмой в отрасли и потенциальным участником этой отрасли. В настоящее время действующий оператор имеет монополию в отрасли и не хочет терять часть своей доли рынка в пользу новичка. Если новичок решает не вступать, выигрыш для действующего оператора высок (он сохраняет свою монополию), а новичок не теряет и не выигрывает (его выигрыш равен нулю). Если участник входит, действующий участник может драться или уступить место участнику. Он будет бороться, снижая цену, выгоняя новичка из бизнеса (и неся издержки выхода - отрицательный результат) и нанося ущерб собственной прибыли. Если он приспособит новичка, он потеряет часть своих продаж, но будет сохраняться высокая цена, и он получит большую прибыль, чем от снижения цены (но ниже прибыли монополии).

Если участник входит, лучший ответ действующего оператора - приспособиться. Если действующий оператор соглашается, лучший ответ новичка - войти (и получить прибыль). Следовательно, профиль стратегии, в котором действующий участник приспосабливается, если участник входит, и участник входит, если действующий участник приспосабливается, является равновесием по Нэшу. Однако, если действующий игрок собирается драться, лучший ответ участника - не входить. Если участник не входит, не имеет значения, что решит сделать действующий президент (поскольку нет другой фирмы, которая могла бы это сделать - обратите внимание, что если участник не входит, борьба и уступка принесут одинаковые выплаты обоим игрокам; действующий участник не будет снижать цены, если участник не войдет). Следовательно, бой можно рассматривать как лучший ответ действующего президента, если участник не входит. Следовательно, профиль стратегии, в котором действующий участник сражается, если участник не входит, и участник не входит, если действующий участник борется, является равновесием по Нэшу. Поскольку игра динамична, любое заявление действующего президента о том, что она будет сражаться, представляет собой невероятную угрозу, потому что к тому времени, когда будет достигнут узел принятия решения, в котором он может принять решение о бою (т. Е. Участник вошел), было бы нерационально делать это. Следовательно, это равновесие по Нэшу может быть устранено обратной индукцией.

См. Также:

Совершенное равновесие по Нэшу в подиграх

Обобщение обратной индукции - это совершенство подыгры. Обратная индукция предполагает, что вся будущая игра будет рациональной. В идеальном равновесии подыгры игра в каждой подигре является рациональной (в частности, равновесие по Нэшу). Обратная индукция может использоваться только в завершающих (конечных) играх определенной длины и не может применяться к играм с неполной информацией. В этих случаях можно использовать совершенство подигры. Устраненное равновесие по Нэшу, описанное выше, несовершенно, потому что это не равновесие по Нэшу для вспомогательной игры, которое начинается в узле, достигнутом после того, как участник вошел.

Совершенное байесовское равновесие

Иногда совершенство подыгры не накладывает достаточно больших ограничений на необоснованные результаты. Например, поскольку вспомогательные игры не могут проходить через информационные наборы, игра с несовершенной информацией может иметь только одну вспомогательную игру - саму себя - и, следовательно, совершенство вспомогательной игры не может использоваться для устранения любого равновесия по Нэшу. Идеальное байесовское равновесие (PBE) - это спецификация стратегий и убеждений игроков о том, какой узел в информационном наборе был достигнут в ходе игры. Убеждение об узле решения - это вероятность того, что конкретный игрок думает, что этот узел участвует или будет участвовать (на пути равновесия). В частности, интуиция PBE заключается в том, что он определяет стратегии игрока, которые являются рациональными с учетом определенных им убеждений игрока, и те убеждения, которые он определяет, согласуются со стратегиями, которые он определяет.

В байесовской игре стратегия определяет, во что играет игрок, при каждом информационном наборе, управляемом этим игроком. Требование, чтобы убеждения соответствовали стратегиям, не определяется совершенством подыгры. Следовательно, PBE является условием согласованности убеждений игроков. Так же, как в равновесии по Нэшу ни одна стратегия игрока не является строго доминируемой, в PBE для любого набора информации ни одна стратегия игрока не является строго доминируемой, начиная с этого набора информации. То есть для каждого убеждения, которое игрок мог бы придерживаться на этом наборе информации, не существует стратегии, которая дает больший ожидаемый выигрыш для этого игрока. В отличие от вышеупомянутых концепций решения, ни одна стратегия игрока не является строго доминируемой, начиная с любого набора информации, даже если он находится вне равновесного пути. Таким образом, в PBE игроки не могут угрожать стратегиями игры, в которых строго доминируют, начиная с любой информации, отклоняющейся от пути равновесия.

Байесовский принцип в названии этой концепции решения намекает на тот факт, что игроки обновляют свои убеждения в соответствии с теоремой Байеса. Они вычисляют вероятности с учетом того, что уже произошло в игре.

Прямая индукция

Прямая индукция называется так потому, что так же, как обратная индукция предполагает, что будущая игра будет рациональной, прямая индукция предполагает, что прошлая игра была рациональной. Если игрок не знает, к какому типу относится другой игрок (т.е. имеется несовершенная и асимметричная информация), этот игрок может сформировать представление о том, к какому типу принадлежит этот игрок, наблюдая за прошлыми действиями этого игрока. Следовательно, сформированное этим игроком убеждение в том, что вероятность того, что противник принадлежит к определенному типу, основано на рациональности прошлой игры этого противника. Игрок может по своему выбору сигнализировать о своем типе своими действиями.

Кольберг и Мертенс (1986) представили концепцию решения устойчивого равновесия, уточнение, которое удовлетворяет прямой индукции. Был найден контрпример, когда такое устойчивое равновесие не удовлетворяло обратной индукции. Чтобы решить эту проблему, Жан-Франсуа Мертенс представил то, что теоретики игр теперь называют концепцией стабильного равновесия по Мертенсу, вероятно, первую концепцию решения, удовлетворяющую как прямой, так и обратной индукции.

См. Также
Ссылки
Последняя правка сделана 2021-06-08 09:12:47
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте