Соответствующие гроши

редактировать

Эта статья посвящена игре двух лиц, изучаемой в теории игр. Чтобы узнать об уловке уверенности, см. Игру на сопоставление монет. Для других вариантов см morra (игра).

	Головы	Хвосты
Головы	+1, −1	-1, +1
Хвосты	-1, +1	+1, −1
Соответствующие пенни

Совпадение пенсов - это название простой игры, используемой в теории игр. В нее играют между двумя игроками, четным и нечетным. У каждого игрока есть пенни, и он должен тайно превратить его в орел или решку. Затем игроки одновременно раскрывают свой выбор. Если монеты совпадают (обе орлы или решки), то чет оставляет оба пенни, поэтому выигрывает один из нечетных (+1 для четных, -1 для нечетных). Если монеты не совпадают (одна решка и одна решка), Odd сохраняет обе монеты, поэтому получает одну из четных (-1 для четных, +1 для нечетных).

СОДЕРЖАНИЕ

1 Теория
- 1.1 Варианты
2 Лабораторные эксперименты
3 Реальные данные
4 См. Также
5 ссылки

Теория

Matching Pennies - это игра с нулевой суммой, потому что выигрыш или потеря полезности каждого участника точно уравновешиваются потерями или выигрышем от полезности других участников. Если сложить общую прибыль участников и вычесть их общие убытки, сумма будет равна нулю.

Игра может быть записана в виде матрицы выигрышей (на фото справа - с точки зрения Эвена). Каждая ячейка матрицы показывает выплаты двух игроков, причем выплаты Эвена указаны первыми.

Соответствие пенни используется в основном для иллюстрации концепции смешанных стратегий и смешанной стратегии равновесия по Нэшу.

В этой игре нет чистой стратегии равновесия по Нэшу, поскольку не существует чистой стратегии (орла или решки), которая была бы лучшим ответом на лучший ответ. Другими словами, не существует пары чистых стратегий, из которых ни один из игроков не захотел бы переключиться, если бы ему сказали, что сделает другой. Вместо этого уникальное равновесие по Нэшу в этой игре заключается в смешанных стратегиях : каждый игрок выбирает орел или решку с равной вероятностью. Таким образом, каждый игрок делает другого безразличным между выбором орла или решки, поэтому ни у одного из игроков нет стимула пробовать другую стратегию. Функции наилучшего отклика для смешанных стратегий показаны на рисунке 1 ниже:

Рисунок 1. Соответствие наилучшего ответа для игроков в игре на совпадение пенсов. Крайнее левое отображение предназначено для четного игрока, в центре показано отображение для нечетного игрока. Единственное равновесие по Нэшу показано на правом графике. x - вероятность того, что нечетный игрок сыграет решку, y - вероятность того, что четный игрок играет решку. Уникальное пересечение - это единственная точка, где стратегия четности является лучшим ответом на стратегию нечетной и наоборот.

Когда любой из игроков играет в равновесие, ожидаемый выигрыш для всех равен нулю.

Варианты

	Головы	Хвосты
Головы	+7, -1	-1, +1
Хвосты	-1, +1	+1, -1
Соответствующие пенни

Изменение выплат в матрице может изменить точку равновесия. Например, в таблице, показанной справа, Четный имеет шанс выиграть 7, если и он, и Нечетный играют решками. Чтобы вычислить точку равновесия в этой игре, обратите внимание, что игрок, играющий смешанную стратегию, должен безразлично выбирать между двумя своими действиями (в противном случае он переключился бы на чистую стратегию). Это дает нам два уравнения:

Для четного игрока ожидаемая выплата при игре решкой и решкой равна, и они должны быть одинаковыми, так что. ${\ Displaystyle +7 \ cdot x-1 \ cdot (1-x)}$ ${\ Displaystyle +7 \ cdot x-1 \ cdot (1-x)}$ ${\ Displaystyle -1 \ cdot х + 1 \ cdot (1-х)}$ ${\ Displaystyle -1 \ cdot х + 1 \ cdot (1-х)}$ ${\ displaystyle x = 0,2}$ ${\ displaystyle x = 0,2}$
Для нечетного игрока ожидаемая выплата при игре решкой и решкой равна, и они должны быть равны, так что. ${\ Displaystyle +1 \ CDOT Y-1 \ CDOT (1-Y)}$ ${\ Displaystyle +1 \ CDOT Y-1 \ CDOT (1-Y)}$ ${\ Displaystyle -1 \ CDOT Y + 1 \ CDOT (1-Y)}$ ${\ Displaystyle -1 \ CDOT Y + 1 \ CDOT (1-Y)}$ ${\ displaystyle y = 0,5}$ ${\ displaystyle y = 0,5}$

Обратите внимание, что это вероятность выпадения нечетных очков и вероятность четных голов. Таким образом, изменение выплаты Эвена влияет на стратегию Одда, а не на его собственную стратегию. ${\ displaystyle x}$ $Икс$ ${\ displaystyle y}$ $у$

Лабораторные эксперименты

Люди-игроки не всегда используют стратегию равновесия. Лабораторные эксперименты выявляют несколько факторов, которые заставляют игроков отклоняться от стратегии равновесия, особенно если совпадение пенни разыгрывается неоднократно:

Люди не умеют рандомизировать. Они могут пытаться создать «случайные» последовательности, переключая свои действия с орла на решку и наоборот, но они меняют свои действия слишком часто (из-за ошибки игрока ). Это позволяет опытным игрокам предсказывать свои следующие действия с вероятностью успеха более 50%. Таким образом может быть получен положительный ожидаемый выигрыш.
Люди обучены обнаруживать закономерности. Они пытаются обнаружить закономерности в последовательности действий оппонента, даже если таких схем не существует, и соответствующим образом корректировать свою стратегию.
На поведение людей влияют эффекты кадрирования. Когда нечетный игрок назван «вводящим в заблуждение», а четный игрок назван «угадывающим», первый фокусируется на попытке рандомизировать, а второй сосредотачивается на попытке обнаружить закономерность, и это увеличивает шансы на успех угадывающего. Кроме того, тот факт, что Эвен побеждает при совпадении, дает ему преимущество, поскольку люди лучше умеют сопоставление, чем несовпадение (из-за эффекта совместимости « стимул-ответ» ).

Более того, когда матрица выплат асимметрична, на поведение человека влияют другие факторы, даже если игра не повторяется:

Игроки склонны увеличивать вероятность совершения действия, которое дает им более высокий выигрыш, например, в приведенной выше матрице выигрышей Эвен будет играть больше голов. Это интуитивно понятно, но это не равновесие по Нэшу: как объяснялось выше, вероятность смешивания игрока должна зависеть только от выигрыша другого игрока, а не его собственного выигрыша. Это отклонение можно объяснить как равновесие квантового отклика. В равновесии квантового отклика кривые наилучшего отклика не являются резкими, как в стандартном равновесии Нэша. Скорее, они плавно переходят от действия, вероятность которого равна 0, к действию, вероятность которого равна 1 (другими словами, в то время как в равновесии по Нэшу игрок выбирает лучший ответ с вероятностью 1 и худший ответ с вероятностью 0, в квантовой -response-equilibrium игрок выбирает лучший ответ с высокой вероятностью, которая меньше 1, и худший ответ с меньшей вероятностью, которая больше 0). Точка равновесия - это точка пересечения сглаженных кривых двух игроков, которая отличается от точки равновесия по Нэшу.
Эффект собственной выгоды смягчается неприятием риска. Игроки склонны недооценивать высокие выигрыши и переоценивать большие потери; это сдвигает кривые квантового отклика и изменяет точку равновесия квантового отклика. Это явно противоречит теоретическим результатам о несоответствии неприятия риска в играх с конечным числом повторений и нулевой суммой.

Реальные данные

Выводы лабораторных экспериментов подвергались критике по нескольким причинам.

Игры в лабораторных экспериментах являются искусственными и упрощенными и не имитируют поведение в реальной жизни.
Результаты лабораторных экспериментов невелики, поэтому у испытуемых нет особого стимула для оптимальной игры. В реальной жизни рынок может «наказать» такую иррациональность и заставить игроков вести себя более рационально.
У испытуемых есть другие соображения, помимо максимизации денежных выплат, например, чтобы не выглядеть глупо или доставить удовольствие экспериментатору.
Лабораторные эксперименты непродолжительны, и у испытуемых нет достаточно времени, чтобы усвоить оптимальную стратегию.

Чтобы преодолеть эти трудности, несколько авторов провели статистический анализ профессиональных спортивных игр. Это игры с нулевой суммой и очень высокими выплатами, и игроки посвятили свою жизнь тому, чтобы стать экспертами. Часто такие игры стратегически похожи на сопоставление монет:

В футбольных пенальти у игрока, выполняющего удар, есть два варианта: удар влево или вправо, а у вратаря есть два варианта: прыгнуть влево или вправо. Вероятность забить гол выше, если варианты выбора не совпадают, и ниже, если варианты совпадают. В общем, выплаты асимметричны, потому что у каждого кикера более сильная нога (обычно правая нога), и его шансы выше при ударе ногой в противоположном направлении (влево). При внимательном изучении действий нападающих и вратарей было обнаружено, что их действия существенно не отклоняются от предсказания равновесия по Нэшу.
В теннисе с подачей и ответом ситуация аналогичная. Было обнаружено, что процент выигрышей согласуется с гипотезой минимакса, но выбор игроков не случаен: даже профессиональные теннисисты не умеют рандомизировать и слишком часто меняют свои действия.

Смотрите также

Шансы и эвены - игра с той же стратегической структурой, в которой играют пальцами, а не монетами.
Камень, ножницы, бумага - похожая игра, в которой у каждого игрока есть три стратегии вместо двух.
Игра на четность - несвязанная (и намного более сложная) логическая игра для двух игроков, играемая на цветном графе.

использованная литература

^ Гиббонс, Роберт (1992). Теория игр для экономистов-прикладников. Издательство Принстонского университета. С. 29–33. ISBN 978-0-691-00395-5.
^ «Соответствующие пенни». GameTheory.net. Архивировано из оригинала на 2006-10-01.
^ Мукхерджи, Дилип; Софер, Барри (1994). «Обучение поведению в экспериментальной игре на сопоставление пенни». Игры и экономическое поведение. 7: 62–91. DOI : 10,1006 / game.1994.1037.
^ Элиаз, Кфир; Рубинштейн, Ариэль (2011). «Загадка Эдгара Аллана По: эффекты кадрирования в повторяющихся играх на сопоставление пенсов». Игры и экономическое поведение. 71: 88–99. DOI : 10.1016 / j.geb.2009.05.010.
^ Окс, Джек (1995). «Игры с уникальными смешанными стратегиями равновесия: экспериментальное исследование». Игры и экономическое поведение. 10: 202–217. DOI : 10,1006 / game.1995.1030.
^ Маккелви, Ричард ; Палфри, Томас (1995). «Равновесия с квантовым откликом для игр нормальной формы». Игры и экономическое поведение. 10: 6–38. CiteSeerX 10.1.1.30.5152. DOI : 10,1006 / game.1995.1023.
^ Goeree, Джейкоб К.; Холт, Чарльз А.; Палфри, Томас Р. (2003). «Не склонное к риску поведение в обобщенных играх на совпадение пенсов» (PDF). Игры и экономическое поведение. 45: 97–113. DOI : 10.1016 / s0899-8256 (03) 00052-6.
^ Вудерс, Джон; Шахат, Джейсон М. (2001). «О неуместности отношения к риску в повторяющихся играх с двумя исходами». Игры и экономическое поведение. 34 (2): 342. DOI : 10,1006 / game.2000.0808. S2CID 2401322.
^ ^a ^b Chiappori, P.; Левитт, С. ; Groseclose, T. (2002). «Проверка равновесия смешанной стратегии, когда игроки неоднородны: случай штрафных ударов в футболе» (PDF). Американский экономический обзор. 92 (4): 1138–1151. CiteSeerX 10.1.1.178.1646. DOI : 10.1257 / 00028280260344678. JSTOR 3083302.
^ ^a ^b Паласиос-Уэрта, I. (2003). «Профессионалы играют в Минимакс». Обзор экономических исследований. 70 (2): 395–415. CiteSeerX 10.1.1.127.9097. DOI : 10.1111 / 1467-937X.00249.
^ Также есть возможность пинать / стоять посередине, но она используется реже.
^ Уокер, Марк; Вудерс, Джон (2001). "Minimax Play на Уимблдоне". Американский экономический обзор. 91 (5): 1521–1538. CiteSeerX 10.1.1.614.5372. DOI : 10,1257 / aer.91.5.1521. JSTOR 2677937.