Уровень риска

редактировать

Доминирование риска. Доминирование выплаты
A концепция решения в теории игр
Взаимосвязь
Подмножество	равновесия по Нэшу
Значимость
Предложено	Джон Харсани, Рейнхард Селтен
Используется для	некооперативных игр
Пример	Охота на оленя

Рисковое доминирование и выигрышное доминирование являются двумя взаимосвязанными уточнениями концепции решения равновесия Нэша (NE) в теории игр, определенных Джоном Харсани и Рейнхардом. Селтен. Равновесие Нэша считается доминирующим по выплате, если оно выше по Парето над всеми другими равновесиями по Нэшу в игре. Столкнувшись с выбором между равновесиями, все игроки согласятся с преобладающим равновесием выплат, поскольку оно предлагает каждому игроку, по крайней мере, такой же выигрыш, как и другие равновесия Нэша. И наоборот, равновесие по Нэшу считается доминирующим по риску, если оно имеет наибольшую область притяжения (т.е. менее рискованно). Это означает, что чем больше у игроков неуверенности в действиях другого игрока (-ов), тем больше вероятность, что они выберут соответствующую ему стратегию.

матрица выигрыша на рисунке 1 представляет собой простой пример игры с двумя игроками и двумя стратегиями с двумя чистыми равновесиями Нэша. Пара стратегий (Охота, Охота) является доминирующей по выплатам, поскольку выплаты выше для обоих игроков по сравнению с другим чистым NE (Собрать, Собрать). С другой стороны, риск (Собрать, Собрать) доминирует (Охота, Охота), поскольку, если существует неопределенность в отношении действий другого игрока, сбор обеспечит более высокий ожидаемый выигрыш. Игра на рис. 1 представляет собой хорошо известную теоретико-игровую дилемму под названием охота на оленей. Обоснование этого заключается в том, что совместные действия (охота) дают более высокую отдачу, если все игроки объединяют свои навыки, но если неизвестно, помогает ли другой игрок в охоте, сбор может оказаться лучшей индивидуальной стратегией для обеспечения еды, поскольку это не зависит от координации с другим игроком. Кроме того, собирание в одиночку предпочтительнее, чем соревнование с другими. Как и дилемма заключенного, она дает причину, почему коллективные действия могут потерпеть неудачу при отсутствии надежных обязательств.

	Hunt	Gather
Hunt	5, 5	0, 4
Gather	4, 0	2, 2
Рис. 1: Охота на оленя пример

	H	G
H	A, a	C, b
G	B, c	D, d
Рис. 2: Общая координационная игра

Содержание

1 Формальное определение
2 Равновесный выбор
3 Примечания
4 Ссылки

Формальное определение

Игра, представленная на рисунке 2 является координационной игрой, если для игрока 1 (строки) выполняются следующие неравенства выплат: A>B, D>C, и для игрока 2 (столбцы): a>b, d>c. Тогда пары стратегий (H, H) и (G, G) являются единственными чистыми равновесиями по Нэшу. Кроме того, существует смешанное равновесие по Нэшу, когда игрок 1 играет H с вероятностью p = (d-c) / (a-b-c + d) и G с вероятностью 1 – p; игрок 2 играет H с вероятностью q = (D-C) / (A-B-C + D) и G с вероятностью 1 – q.

Стратегическая пара (H, H) выигрыш доминирует (G, G), если A ≥ D, a ≥ d и хотя бы одно из двух является строгим неравенством: A>D или a>d.

Стратегическая пара (G, G) риск доминирует (H, H), если произведение потерь от отклонения является самым высоким для (G, G) (Harsanyi and Selten, 1988, Lemma 5.4.4). Другими словами, если выполняется следующее неравенство: (C - D) (c - d) ≥ (B - A) (b - a). Если неравенство строгое, то (G, G) строго доминирует риск (H, H) (то есть у игроков больше стимулов отклоняться).

Если игра симметрична, то есть если A = a, B = b и т. Д., Неравенство допускает простую интерпретацию: мы предполагаем, что игроки не уверены в том, какую стратегию выберет противник, и назначают вероятности для каждая стратегия. Если каждый игрок присваивает вероятности ½ H и G каждому, то (G, G) риск доминирует (H, H), если ожидаемый выигрыш от игры G превышает ожидаемый выигрыш от игры H: ½ B + ½ D ≥ ½ A + ½ C, или просто B + D ≥ A + C.

Другой способ вычисления равновесия с преобладанием риска - это вычисление фактора риска для всех равновесий и нахождение равновесия с наименьшим фактором риска. Чтобы рассчитать фактор риска в нашей игре 2x2, рассмотрим ожидаемый выигрыш для игрока, если он сыграет H: $E [π H] = p A + (1 - p) C {\ displaystyle E [\ pi _ {H }] = pA + (1-p) C}$ $E [\ pi _ {H}] = pA + (1-p) C$ (где p - вероятность того, что другой игрок сыграет H), и сравните ее с ожидаемой выплатой, если они сыграют G: $E [π G] знак равно п В + (1 - п) D {\ Displaystyle E [\ pi _ {G}] = пВ + (1-р) D}$ $E [\ pi _ { G}] = pB + (1-p) D$ . Значение p, которое уравнивает эти два ожидаемых значения, является фактором риска для равновесия (H, H), причем $1 - p {\ displaystyle 1-p}$ $1-p$ фактор риска для игры ( G, G). Вы также можете рассчитать фактор риска для игры (G, G), выполнив тот же расчет, но установив p как вероятность того, что другой игрок сыграет G. Интерпретация p заключается в том, что это наименьшая вероятность того, что противник должен разыграть эту стратегию. так что собственный выигрыш от копирования стратегии оппонента больше, чем если бы использовалась другая стратегия.

Выбор равновесия

С помощью ряда эволюционных подходов было установлено, что при игре в большой совокупности игроки могут не разыграть стратегию равновесия с преобладанием выигрыша и вместо этого в конечном итоге окажутся в выигрыше с преобладанием риска равновесие. Обе две отдельные эволюционные модели поддерживают идею о том, что равновесие с преобладанием риска более вероятно. Первая модель, основанная на динамике репликатора, предсказывает, что популяция с большей вероятностью примет равновесие с доминированием риска, чем равновесие с доминированием выплат. Вторая модель, основанная на наилучшем ответе и мутации, предсказывает, что состояние с доминированием риска является единственным стохастически стабильным равновесием. Обе модели предполагают, что в несколько игр для двух игроков играют N игроков. Игроки подбираются случайным образом с противниками, причем у каждого игрока есть равная вероятность вытащить любой из N − 1 других игроков. Игроки начинают с чистой стратегии, G или H, и используют эту стратегию против своего оппонента. В динамике репликатора популяционная игра повторяется в последовательных поколениях, где субпопуляции меняются в зависимости от успеха выбранных ими стратегий. В лучшем случае игроки обновляют свои стратегии, чтобы улучшить ожидаемые выплаты в последующих поколениях. Кандори, Майлат и Роб (1993) и Янг (1993) признали, что если правило обновления стратегии допускает мутацию, и вероятность мутации исчезает, т. Е. Асимптотически достигает нуля с течением времени, вероятность того, что доминирующее равновесие риска

Примечания

^1Единичное равновесие по Нэшу является тривиальным выигрышем и доминирует над риском, если оно является единственным NE в игре.
^2Подобные различия между строгим и слабые существуют для большинства определений здесь, но не обозначаются явно, за исключением случаев необходимости.
^3Харсани и Селтен (1988) предполагают, что доминирующее равновесие выигрыша является рациональным выбором в охоте на оленей, однако Харсани (1995) отказался от этого вывода, принять доминирование риска как соответствующий критерий отбора.

Ссылки

Сэмюэл Боулз: Микроэкономика: поведение, институты и эволюция, Princeton University Press, стр. 45–46 (2004) ISBN 0-691-09163-3
Дрю Фуденберг и Дэвид К. Левин: теория обучения в играх, MIT Press, стр. 27 (1999) ISBN 0-262-06194-5
Джон К. Харсани: «Новая теория равновесного выбора для игр с полной информацией», Игры и экономическое поведение 8, pp. 91–122 (1995)
Джон К. Харсани и Райнхард Селтен: Общая теория равновесного выбора в играх, MIT Press (1988) ISBN 0-262-08173-3
Мичихиро Кандори, Джордж Дж. Майлат и Рафаэль Роб : «Обучение, мутация и долгосрочное равновесие в играх», Econometrica 61, стр. 29–56 (1993) Реферат
Роджер Б. Майерсон: теория игр, анализ конфликта, Harvard University Press, стр. 118–119 (1991) ISBN 0-674-34115-5
Ларри Самуэльсон : Evolutionary Games and Equilibrium Selection, MIT Press (1997) ISBN 0-262-19382-5
ЧАС. Пейтон Янг: «Эволюция условностей», Econometrica, 61, стр. 57–84 (1993) Резюме
H. Пейтон Янг: индивидуальная стратегия и социальная структура, Princeton University Press (1998) ISBN 0-691-08687-7