Коррелированное равновесие

редактировать
Решение теории игр
Коррелированное равновесие
A концепция решения в теории игр
Взаимосвязь
Надмножестворавновесия по Нэшу
Значение
Предложено авторРоберт Ауманн
ПримерЦыпленок

В теории игр, коррелированное равновесие - это концепция решения, более общая чем хорошо известное равновесие по Нэшу. Впервые это обсуждалось математиком Робертом Ауманом в 1974 году. Идея состоит в том, что каждый игрок выбирает свое действие в соответствии с их наблюдениями за значением одного и того же открытого сигнала. Стратегия назначает действие каждому возможному наблюдению, которое может сделать игрок. Если ни один игрок не захочет отклоняться от рекомендованной стратегии (при условии, что другие не отклоняются), распределение называется коррелированным равновесием.

Содержание
  • 1 Формальное определение
  • 2 Пример
  • 3 Изучение коррелированных равновесий
  • 4 Ссылки
    • 4.1 Источники
Формальное определение

An N { \ displaystyle N}N стратегическая игра (N, A i, ui) {\ displaystyle \ displaystyle (N, A_ {i}, u_ {i})}\ displaystyle (N, A_ {i}, u_ {i}) характеризуется набором действий A i {\ displaystyle A_ {i}}A_ {i} и функцией полезности ui {\ displaystyle u_ {i}}u_ {i} для каждого игрока я {\ displaystyle i}i. Когда игрок i {\ displaystyle i}iвыбирает стратегию ai ∈ A i {\ displaystyle a_ {i} \ in A_ {i}}a_i \ in A_i и оставшиеся игроки выберите профиль стратегии, описанный N - 1 {\ displaystyle N-1}N-1 -tuple a - i {\ displaystyle a _ {- i}}a _ {{- i}} , тогда полезность игрока i {\ displaystyle i}i- ui (ai, a - i) {\ displaystyle \ displaystyle u_ {i} (a_ {i}, a _ {- i})}\ displaystyle u_ {i} (a_ {i}, a _ {{- i}}) .

Модификация стратегии для игрока i {\ displaystyle i}i- это функция ϕ i: A i → A i {\ displaystyle \ phi _ {i} \ двоеточие от A_ {i} \ до A_ {i}}{\ displaystyle \ phi _ {i} \ двоеточие A_ {i} \ to A_ {i}} . То есть ϕ i {\ displaystyle \ phi _ {i}}\ phi _ {i} сообщает игроку i {\ displaystyle i}iизменить свое поведение, играя действие ϕ я (ai) {\ displaystyle \ phi _ {i} (a_ {i})}{\ displaystyle \ phi _ {i} (a_ {i})} при указании воспроизведения ai {\ displaystyle a_ {i}}a_ {i} .

Пусть (Ω, π) {\ displaystyle (\ Omega, \ pi)}(\ Omega, \ pi) быть счетным вероятностным пространством. Для каждого игрока i {\ displaystyle i}iпусть P i {\ displaystyle P_ {i}}P_ {i} будет его информационным разделом, qi {\ displaystyle q_ {i}}q_ {i} be i {\ displaystyle i}i's posterior и пусть si: Ω → A i {\ displaystyle s_ {i} \ двоеточие \ Omega \ rightarrow A_ {i}}s_ {i} \ двоеточие \ Omega \ rightarrow A_ {i} , присвоение того же значения состояниям в той же ячейке i {\ displaystyle i}i' информационный раздел. Тогда ((Ω, π), P i, si) {\ displaystyle ((\ Omega, \ pi), P_ {i}, s_ {i})}{\ displaystyle ((\ Omega, \ pi), P_ {i}, s_ {i})} является коррелированным равновесием стратегическая игра (N, A i, ui) {\ displaystyle (N, A_ {i}, u_ {i})}(N, A_ {i}, u_ {i}) if для каждого игрока i {\ displaystyle i}iи для каждой модификации стратегии ϕ i {\ displaystyle \ phi _ {i}}\ phi _ {i} :

∑ ω ∈ Ω qi (ω) ui (si (ω), s - i (ω)) ≥ ∑ ω ∈ Ω qi (ω) ui (ϕ я (си (ω)), s - я (ω)) {\ displaystyle \ sum _ {\ omega \ in \ Omega} q_ {i} (\ omega) u_ {i} (s_ {i} (\ omega), s _ {- i} (\ omega)) \ geq \ sum _ {\ omega \ in \ Omega} q_ {i} (\ omega) u_ {i} \ left (\ phi _ {i} \ left (s_ {i} (\ omega) \ right), s _ {- i} (\ omega) \ right)}{\ displaystyle \ sum _ {\ omega \ in \ Omega} q_ {i} (\ omega) u_ {i} (s_ {i} (\ omega), s _ {- i} (\ omega)) \ geq \ sum _ {\ omega \ in \ Omega } q_ {i} (\ omega) u_ {i} \ left (\ phi _ {i} \ left (s_ {i} (\ omega) \ right), s _ {- i} (\ omega) \ right)}

Другими словами, ((Ω, π), P i) {\ displaystyle ((\ Omega, \ pi), P_ {i})}((\ Omega, \ pi), P_ {i}) является коррелированным равновесием, если ни один игрок не может улучшить свою ожидаемую полезность с помощью модификации стратегии.

Пример
D:Cпрогибаться
D:0, 07, 2
Cпроглотить2, 76, 6
Игра в цыпленка

Рассмотрим игру в цыпленка на картинке. В этой игре два человека бросают вызов друг другу в состязании, в котором каждый может либо осмелиться, либо сдаться. Если один собирается осмелиться, другому лучше струсить. Но если один собирается струсить, другому лучше осмелиться. Это приводит к интересной ситуации, когда каждый хочет осмелиться, но только если другой откажется.

В этой игре есть три равновесия Нэша. Два чистой стратегии равновесия Нэша - это (D, C) и (C, D). Также существует смешанная стратегия равновесие, при котором каждый игрок решается с вероятностью 1/3.

Теперь рассмотрим третье лицо (или какое-то естественное событие), которое вытягивает одну из трех карт, помеченных: (C, C), (D, C) и (C, D), с той же вероятностью, т. Е. вероятность 1/3 для каждой карты. После вытягивания карты третья сторона сообщает игрокам стратегию, назначенную им на карте (но не стратегию, назначенную их оппоненту). Предположим, игроку назначено D, он не хотел бы отклоняться, полагая, что другой игрок применяет назначенную им стратегию, поскольку он получит 7 (максимально возможный выигрыш). Предположим, игроку назначено C. Тогда другой игрок сыграет C с вероятностью 1/2 и D с вероятностью 1/2. ожидаемая полезность от Daring составляет 7 (1/2) + 0 (1/2) = 3,5, а ожидаемая полезность от стеснения составляет 2 (1/2) + 6 (1/2) = 4. Итак, игрок предпочел бы струсить.

Поскольку ни у одного игрока нет стимула отклоняться, это коррелированное равновесие. Ожидаемый выигрыш для этого равновесия составляет 7 (1/3) + 2 (1/3) + 6 (1/3) = 5, что выше, чем ожидаемый выигрыш смешанной стратегии равновесия по Нэшу.

Следующее коррелированное равновесие имеет еще более высокий выигрыш для обоих игроков: рекомендовать (C, C) с вероятностью 1/2 и (D, C) и (C, D) с вероятностью 1/4 каждое. Затем, когда игроку рекомендуют сыграть C, он знает, что другой игрок будет играть D с (условной) вероятностью 1/3 и C с вероятностью 2/3, и получит ожидаемый выигрыш 14/3, который равен (не менее чем) ожидаемый выигрыш, когда она играет D. В этом коррелированном равновесии оба игрока получают ожидаемое значение 5,25. Можно показать, что это коррелированное равновесие с максимальной суммой ожидаемых выплат для двух игроков.

Изучение коррелированных равновесий

Одно из преимуществ коррелированных равновесий состоит в том, что они менее затратны в вычислительном отношении, чем равновесия Нэша. Это может быть зафиксировано тем фактом, что для вычисления коррелированного равновесия требуется только решение линейной программы, в то время как решение равновесия по Нэшу требует полного нахождения его фиксированной точки. Другой способ увидеть это заключается в том, что два игрока могут реагировать на исторические ходы игры друг друга и в конечном итоге сходиться к коррелированному равновесию.

Ссылки

Источники

Последняя правка сделана 2021-05-15 13:08:44
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте