Теория поведенческих игр

редактировать

Теория поведенческих игр анализирует интерактивные стратегические решения и поведение с помощью методов из теории игр, экспериментальной экономики и экспериментальной психологии. Эксперименты включают проверку отклонений от типичных упрощений экономической теории, таких как аксиома независимости и пренебрежение альтруизмом, справедливостью и эффектами кадрирования. Как исследовательская программа, этот предмет является разработкой последних трех десятилетий.

Традиционная теория игр фокусируется на математической структуре равновесий и имеет тенденцию использовать базовый рациональный выбор, включающий максимизацию полезности. Напротив, теория поведенческих игр фокусируется на том, как реальное поведение имеет тенденцию отклоняться от стандартных прогнозов: как мы можем объяснить и смоделировать эти отклонения и как мы можем сделать более точные прогнозы, используя более точные модели? Выбор, изучаемый в теории поведенческих игр, не всегда является рациональным и не всегда представляет собой выбор, максимизирующий полезность.

Теория поведенческих игр использует лабораторные и полевые эксперименты, а также теоретическое и компьютерное моделирование. Недавно методы из машинного обучения были применены в работе на стыке экономики, психологии и информатики для улучшения обоих прогнозов. и понимание поведения в играх.

Содержание

1 История
2 Сравнение с традиционной теорией игр
3 Примеры игр, используемых в исследованиях поведенческой теории игр
4 Факторы, влияющие на рациональность в играх
- 4.1 Убеждения
- 4.2 Социальное сотрудничество
- 4.3 Стимулы, последствия и обман
- 4.4 Групповые решения
5 См. Также
6 Ссылки

История

Начало поведенческой теории игры с работами Алле в 1953 г. и Эллсберга в 1961 г. Они открыли парадокс Алле и парадокс Эллсберга соответственно. Оба парадокса показывают, что выбор, сделанный участниками игры, не отражает выгоду, которую они ожидают получить от этого выбора. В 1970-х годах работы Вернона Смита показали, что экономические рынки можно исследовать экспериментально, а не только теоретически. В то же время несколько экономистов провели эксперименты, обнаружившие вариации традиционных моделей принятия решений, таких как теория сожаления, теория перспектив и гиперболическое дисконтирование. Эти открытия показали, что лица, принимающие решения, принимают во внимание множество факторов при выборе. Например, человек может стремиться свести к минимуму количество сожалений, которые он испытает после принятия решения, и взвесить свои варианты, исходя из количества сожалений, которые он ожидает от каждого из них. Поскольку они ранее не изучались традиционной экономической теорией, такие факторы, как сожаление, а также многие другие, стимулировали дальнейшие исследования.

Начиная с 1980-х годов экспериментаторы начали изучать условия, вызывающие расхождение с рациональным выбором. Ультиматум и игры торга исследовали влияние эмоций на предсказания поведения оппонента. Одним из наиболее известных примеров игры в ультиматум является телешоу Сделка или нет, в котором участники должны принимать решения о продаже или продолжении игры на основе денежных ультиматумов, данных им «банкиром». Эти игры также исследовали влияние доверия на результаты принятия решений и поведение, направленное на максимизацию полезности. Общие ресурсные игры использовались для экспериментальной проверки того, как сотрудничество и социальная желательность влияют на выбор субъекта. Реальным примером игры с обычными ресурсами может быть решение гостя вечеринки взять с собой блюдо. На решения гостей будет влиять не только то, насколько они голодны, но и то, сколько общего ресурса, еды, осталось, и если гость считает, что другие будут осуждать их за то, что они съели больше. Экспериментаторы в этот период считали поведение, не обеспечивающее максимальной полезности, результатом ошибочных рассуждений участников. На рубеже веков экономисты и психологи расширили это исследование. Модели, основанные на теории рационального выбора, были адаптированы для отражения предпочтений лиц, принимающих решения, и попытки рационализировать выбор, не обеспечивающий максимальной полезности.

Сравнение с традиционной теорией игр

Традиционная игра Теория использует теоретические модели для определения наиболее выгодного выбора для всех участников игры. Теория игр использует теорию рационального выбора наряду с предположениями, которые являются общеизвестными игроками, чтобы предсказать решения, максимизирующие полезность. Это также позволяет игрокам предсказывать стратегии своих противников. Традиционная теория игр - это прежде всего нормативная теория, поскольку она стремится точно определить решение, которое должны выбрать рациональные игроки, но не пытается объяснить, почему было принято это решение. Рациональность - это первичное допущение теории игр, поэтому не существует объяснений различных форм рациональных решений или иррациональных решений.

Поведенческая теория игр - это в первую очередь позитивная теория, а не нормативная теория. Положительная теория стремится описывать явления, а не предписывать правильные действия. Положительные теории должны быть проверены и могут быть доказаны как истинные, так и ложные. Нормативная теория субъективна и основана на мнениях. Из-за этого нормативные теории не могут быть доказаны истинными или ложными. Теория поведенческих игр пытается объяснить принятие решений с помощью экспериментальных данных. Теория допускает рациональные и иррациональные решения, потому что и то, и другое проверяется с помощью реальных экспериментов. В частности, теория поведенческих игр пытается объяснить факторы, влияющие на решения в реальном мире. Эти факторы не исследуются в области традиционной теории игр, но их можно постулировать и наблюдать с использованием эмпирических данных. Результаты теории поведенческих игр будут иметь более высокую внешнюю валидность и могут быть лучше применены к поведению в процессе принятия решений в реальном мире.

Примеры игр, используемых в исследованиях поведенческой теории игр

Факторы, влияющие на рациональность в играх

Убеждения

Предполагается, что убеждения о других людях в игре по принятию решений будут влиять на их способность делать рациональный выбор. Однако убеждения других также могут привести к отклонению экспериментальных результатов от равновесных решений, максимизирующих полезность. В эксперименте, проведенном Коста-Гомес (2008), участникам задавали вопросы об их убеждениях первого порядка о действиях своего оппонента до завершения серии игр нормальной формы с другими участниками. Участники соблюдали равновесие по Нэшу только в 35% случаев. Кроме того, участники только заявили, что их оппоненты будут соблюдать равновесие традиционной теории игр в 15% случаев. Это означает, что участники считали, что их противники будут менее рациональными, чем они были на самом деле. Результаты этого исследования показывают, что участники не выбирают действие, максимизирующее полезность, и ожидают, что их оппоненты поступят так же. Кроме того, результаты показывают, что участники не выбрали действие, максимизирующее полезность, которое соответствовало их представлениям о действиях оппонента. Хотя участники могли полагать, что их противник с большей вероятностью примет определенное решение, они все же принимали решения, как если бы их оппонент выбирал случайно. Другое исследование, в котором изучались участники телешоу Deal or No Deal, обнаружило расхождения с рациональным выбором. По мере прохождения игры участники с большей вероятностью основывали свои решения на предыдущих результатах. Неприятие риска уменьшалось, когда ожидания участников не оправдались в ходе игры. Например, субъект, получивший череду положительных результатов, с меньшей вероятностью согласился на сделку и закончил игру. То же самое относится и к субъекту, который в начале игры испытал в основном отрицательные результаты.

Социальное сотрудничество

Социальное поведение и сотрудничество с другими участниками - это два фактора, которые не моделируются в традиционной теории игр. но их часто можно увидеть в экспериментальных условиях. В моделях принятия решений не учитывалась эволюция социальных норм, но эти нормы влияют на то, как реальные люди взаимодействуют друг с другом и делают выбор. Одна из тенденций состоит в том, что человек решительно отвечает взаимностью. Этот тип людей вступает в игру с предрасположенностью к сотрудничеству с другими игроками. Они будут повышать уровень своего сотрудничества в ответ на сотрудничество с другими игроками и снижать уровень своего сотрудничества, даже за свой счет, чтобы наказать игроков, которые не сотрудничают. Это не поведение, направленное на максимизацию выигрыша, поскольку сильный реципрокатор готов уменьшить свой выигрыш, чтобы поощрять сотрудничество с другими..

Дюфвенберг и Кирхштайгер (2004) разработали модель, основанную на взаимности, названную равновесием последовательной взаимности. Эта модель адаптирует традиционную логику теории игр к идее о том, что игроки отвечают взаимностью в целях сотрудничества. Модель использовалась для более точного прогнозирования экспериментальных результатов классических игр, таких как дилемма заключенного и игра с многоножкой. Рабин (1993) также создал равновесие справедливости, которое измеряет влияние альтруизма на выбор. Он обнаружил, что когда игрок альтруистичен по отношению к другому игроку, второй игрок с большей вероятностью ответит на этот альтруизм взаимностью. Это связано с идеей справедливости. Равновесие справедливости принимает форму взаимного максимума, когда оба игрока выбирают результат, который приносит им обоим наибольшую пользу, или взаимного минимума, когда оба игрока выбирают исход, который больше всего вредит им обоим. Эти равновесия также являются равновесиями Нэша, но они включают в себя готовность участников сотрудничать и играть честно.

Стимулы, последствия и обман

Роль стимулов и последствий в принятии решений интересна теоретикам поведенческих игр, поскольку они влияют на рациональное поведение. Пост (2008) проанализировал поведение участников «Сделка или не сделка», чтобы сделать выводы о принятии решений, когда ставки высоки. Изучение выбора участников привело к выводу, что в последовательной игре с высокими ставками решения были основаны на предыдущих результатах, а не на рациональности. Игроки, которые сталкиваются с чередой хороших результатов, в этом случае исключают из игры малоценные случаи, или игроки, которые сталкиваются с чередой плохих исходов, становятся менее склонными к риску. Это означает, что игроки, которые имеют исключительно хорошие или исключительно плохие результаты, с большей вероятностью будут играть и продолжать играть, чем средние игроки. Удачливые или неудачливые игроки были готовы отклонить предложения на сумму, превышающую сто процентов ожидаемой суммы их кейса, чтобы продолжить игру. Это показывает переход от поведения, избегающего риска, к поведению, стремящемуся к риску. Это исследование выявляет поведенческие предубеждения, которые не учитываются традиционной теорией игр. Более рискованное поведение незадачливых участников может быть связано с эффектом безубыточности, который гласит, что игроки будут продолжать принимать рискованные решения, чтобы отыграть деньги. С другой стороны, более рискованное поведение удачливых участников можно объяснить эффектом домашних денег, который гласит, что выигравшие игроки с большей вероятностью примут рискованные решения, потому что они считают, что играют не на свои деньги. Этот анализ показывает, что стимулы влияют на рациональный выбор, особенно когда игроки принимают серию решений.

Стимулы и последствия также играют большую роль в обмане в играх. Гнизи (2005) изучал обман, используя дешевую игру «разговор отправитель-получатель». В этом типе игры игрок получает информацию о выплатах по варианту А и варианту Б. Затем первый игрок дает рекомендацию второму игроку о том, какой вариант выбрать. Первый игрок может обмануть второго игрока, а второй игрок может отказаться от его совета. Гнизи обнаружил, что участники более чувствительны к своей выгоде от лжи, чем к поражению оппонента. Он также обнаружил, что участники не были полностью эгоистичными и заботились о том, сколько их оппоненты потеряли из-за их обмана, но этот эффект уменьшался по мере увеличения их собственных выплат. Эти результаты показывают, что лица, принимающие решения, исследуют как стимулы лгать, так и последствия лжи, чтобы решить, лгать или нет. В целом люди не любят лгать, но при наличии правильных стимулов они склонны игнорировать последствия. Ван (2009) также использовал дешевую разговорную игру, чтобы изучить обман у участников, у которых есть стимул к обману. Используя отслеживание взгляда, он обнаружил, что участники, получившие информацию о выплатах, в два раза чаще, чем их оппоненты, сосредотачивались на собственном выигрыше. Это предполагает минимальное стратегическое мышление. Кроме того, зрачки участников расширились, когда они послали обман, и они расширились еще больше, когда они рассказали большую ложь. С помощью этих физических сигналов Ван пришел к выводу, что обман когнитивно сложно. Эти результаты показывают, что такие факторы, как стимулы, последствия и обман, могут приводить к иррациональным решениям и влиять на ход игры.

Групповые решения

Теория поведенческих игр рассматривает влияние групп на рациональность. В реальном мире многие решения принимаются командами, но традиционная теория игр использует человека в качестве лица, принимающего решения. Это создало потребность в моделировании группового поведения при принятии решений. Борнштейн и Янив (1998) исследовали разницу в рациональности между группами и отдельными людьми в игре ультиматумов. В этой игре первый игрок (или группа один) решает, какой процент выплаты отдать второму игроку (или группе два), а затем второй игрок решает, принять или отклонить это предложение. Участники группового условия были разделены на группы по три человека и позволили обдумать свои решения. Совершенно рационально в этой игре было бы, если бы первый игрок не предлагал второму игроку никакой выплаты, но в наблюдаемых предложениях этого почти не бывает. Борнштейн и Янив обнаружили, что группы были менее щедрыми, готовы отдать меньшую часть выигрыша при условии «один игрок» и более склонны принимать низкие предложения при условии «второй игрок», чем отдельные лица. Эти результаты говорят о том, что группы более рациональны, чем отдельные лица.

Кохер и Саттер (2005) использовали игру-конкурс красоты для изучения и сравнения индивидуального и группового поведения. Конкурс красоты - это игра, в которой все участники выбирают число от нуля до ста. Победителем становится участник, который выбирает число, наиболее близкое к двум третям среднего числа. В первом раунде рациональным выбором будет тридцать три, так как это две трети среднего числа, пятьдесят. Учитывая бесконечное количество раундов, все участники должны выбрать ноль согласно теории игр. Кочер и Саттер обнаружили, что в первом раунде игры группы не действовали более рационально, чем отдельные участники. Однако в последующих раундах группы выступали более рационально, чем отдельные участники. Это показывает, что группы могут изучать игру и адаптировать свою стратегию быстрее, чем отдельные лица.