Дешевый разговор

редактировать

В теории игр дешевый разговор - это общение между игроками, которое напрямую не влияет на выигрыши от игры. Предоставление и получение информации бесплатно. Это контрастирует с сигнализацией, при которой отправка определенных сообщений может быть дорогостоящей для отправителя в зависимости от состояния мира.

Один субъект обладает информацией, а другой способен действовать. Информированный игрок может стратегически выбирать, что говорить, а что не говорить. Все становится интересно, когда интересы игроков не совпадают. Классический пример - эксперт (скажем, эколог), пытающийся объяснить состояние мира неосведомленному лицу, принимающему решения (скажем, политик, голосующий по законопроекту о вырубке лесов ). Лицо, принимающее решение, после того, как выслушает отчет эксперта, должно принять решение, которое влияет на выплаты обоих игроков.

Эта базовая настройка, установленная Кроуфордом и Собелом, породила множество вариантов.

Чтобы дать формальное определение, дешевый разговор - это коммуникация, которая:

не требует затрат на передачу и прием
без обязательств (т.е. не ограничивает стратегический выбор любой из сторон)
непроверяемый (то есть не может быть проверен третьей стороной, например судом)

Следовательно, агент, участвующий в дешевых разговорах, может безнаказанно лгать, но может выбрать в равновесии не делать этого.

Содержание

1 Оригинальная статья Кроуфорда и Собела
- 1.1 Настройка
- 1.2 Теорема
2 Приложения
- 2.1 Теория игр
- 2.2 Биологические приложения
3 См. Также
4 Примечания
5 Ссылки

Исходная статья Кроуфорда и Собела

Настройка

В базовой форме игры между двумя игроками общаются: один отправитель S и один получатель R.

Тип. Отправитель S получает информацию о состоянии мира или его "типе" t. Получатель R не знает t; у него есть только предварительные убеждения об этом, и он полагается на сообщение от S, чтобы, возможно, повысить точность своих убеждений.

Сообщение. S решает отправить сообщение m. Сообщение m может раскрывать полную информацию, но оно также может давать ограниченную, размытую информацию: обычно в нем говорится: «Состояние мира находится между t 1 и t 2 ». Он может вообще не давать никакой информации.

Форма сообщения не имеет значения, пока существует взаимопонимание, общее толкование. Это может быть общее заявление председателя центрального банка, политическая речь на любом языке и т. Д. Какой бы ни была форма, в конечном итоге это может означать: «Состояние мира находится между t 1 и t 2 ".

Действие. Получатель R принимает сообщение m. R обновляет свои представления о состоянии мира с учетом новой информации, которую он может получить, используя правило Байеса. R решает принять меры a. Это действие влияет как на его собственную полезность, так и на полезность отправителя.

Полезность. Решение S относительно содержания m основано на максимизации его полезности, учитывая то, что он ожидает от R. Полезность - это способ количественной оценки удовлетворения или желаний. Это может быть финансовая прибыль или нефинансовое удовлетворение, например, степень защиты окружающей среды.

→ Квадратичные полезности:

Соответствующие полезности S и R могут быть указаны следующим образом:

US (a, t) = - (a - t - b) 2 {\ displaystyle U ^ {S} (a, t) = - (atb) ^ {2}}

{\ displaystyle U ^ {S} (a, t) = - (atb) ^ {2}}

UR (a, t) = - (a - t) 2 {\ displaystyle U ^ {R} (a, t) = - (at) ^ {2}}

{\ displaystyle U ^ {R} (a, t) = - (at) ^ {2}}

Теория применима к более общим формам полезности, но квадратичные предпочтения упрощают изложение. Таким образом, S и R имеют разные цели, если b ≠ 0. Параметр b интерпретируется как конфликт интересов между двумя игроками или, альтернативно, как предвзятость.

U максимизируется, когда a = t, что означает, что получатель хочет предпринять действия, которые соответствует состоянию мира, которого он не знает в целом. U максимизируется, когда a = t + b, что означает, что S хочет, чтобы было предпринято немного более сильное действие. Поскольку S не управляет действием, S должен выполнить желаемое действие, выбрав, какую информацию раскрыть. Полезность каждого игрока зависит от состояния мира и решений обоих игроков, которые в конечном итоге приводят к действию a.

равновесие по Нэшу. Мы ищем равновесие, в котором каждый игрок принимает оптимальное решение, предполагая, что другой игрок также принимает решение оптимально. Игроки рациональны, хотя у R лишь ограниченная информация. Ожидания сбываются, и нет стимула отклоняться от этой ситуации.

Теорема

Рисунок 1: Настройка недорогого разговора

Кроуфорд и Собел характеризуют возможные равновесия по Нэшу.

Обычно множественные равновесия, но в конечное число.
Разделение, что означает полное раскрытие информации, не является равновесием по Нэшу.
лепет, что означает отсутствие передачи информации, всегда является равновесным результатом.

Когда интересы согласовано, то информация раскрывается полностью. Когда конфликт интересов очень велик, вся информация скрывается. Это крайние случаи. Модель допускает более тонкий случай, когда интересы близки, но различны и в этих случаях оптимальное поведение приводит к раскрытию некоторой, но не всей информации, что приводит к различным видам тщательно сформулированных предложений, которые мы можем наблюдать.

В более общем смысле:

существует такое N>0, что для всех N с 1 ≤ N ≤ N,
существует, по крайней мере, равновесие, в котором множество индуцированных действий имеет мощность N; и, кроме того,
не существует равновесия, которое вызывает более N действий.

Сообщения. Хотя сообщения могут ex-ante принимать бесконечное число возможных значений µ (t) для бесконечного числа возможных состояний мира t, на самом деле они могут принимать только конечное число значений (m 1, m 2,..., m N).

Таким образом, равновесие может быть охарактеризовано разделением (t 0 (N), t 1 (N)... t N (N)) множества типов [0, 1], где 0 = t 0 (N) < t1 (N) <... < tN(N) = 1. Это разбиение показан в верхнем правом сегменте рисунка 1.

t i (N) - это границы интервалов, в которых сообщения постоянны: для t i-1 (N) < t < ti(N), µ (t) = m i.

Действия. Поскольку действия являются функциями сообщений, действия также постоянны в этих интервалах: для t i-1 (N) < t < ti(N), α (t) = α (m i) = a i.

Функция действия теперь косвенно характеризуется тем, что каждое значение a i оптимизирует отдачу для R, зная, что t находится между t 1 и t 2. Математически (при условии, что t равномерно распределен по [0, 1]),

$ai = a ¯ (ti - 1, ti) = arg max a ∫ ti - 1 ti UR (a, t) dt {\ displaystyle a_ {i} = {\ bar {a}} (t_ {i-1}, t_ {i}) = \ mathrm {arg} \ max _ {a} \ int _ {t_ {i-1}} ^ {t_ {i}} U ^ {R} (a, t) dt}$ ${\ displaystyle a_ {i} = {\ bar {a}} (t_ {i-1}, t_ {i}) = \ mathrm {arg} \ max _ {a} \ int _ {t_ {i-1}} ^ {t_ {i}} U ^ {R} (a, t) dt}$

→ Квадратичные полезности:

При условии, что R знает, что t находится между t i-1 и t i, и в частном случае квадратичной полезности, когда R хочет, чтобы действие a было как можно ближе к t, мы можем показать, что довольно интуитивно оптимальным действием является середина интервала:

ai = ti - 1 + ti 2 {\ displaystyle a_ {i} = {\ frac {t_ {i-1} + t_ {i}} {2}}}

{\ displaystyle a_ {i} = {\ frac {t_ { i-1} + t_ {i}} {2}}}

Условие безразличия. Что происходит при t = t я ? Отправителю должно быть безразлично, отправлено ли сообщение m i-1 или m i. $US (ai, ti) = US (ai + 1, ti) {\ displaystyle U ^ {S} (a_ {i}, t_ {i}) = U ^ {S} (a_ {i + 1}, t_ {i})}$ ${\ displaystyle U ^ {S} (a_ {i}, t_ {i}) = U ^ {S} (a_ {я + 1}, t_ {i})}$ 1 ≤ i≤ N-1

Это дает информация о N и t i.

→ Практически:

Мы рассматриваем разбиение размера N. Можно показать, что

ti = t 1 i + 2 bi (i - 1) t 1 = 1 - 2 b N (N - 1) N {\ displaystyle t_ {i} = t_ {1} i + 2bi (i-1) \ qquad t_ {1} = {\ frac {1-2bN (N-1)} {N}}}

{\ displaystyle t_ {i} = t_ {1} i + 2bi (i-1) \ qquad t_ { 1} = {\ frac {1-2bN (N-1)} {N}}}

N должно быть достаточно маленьким, чтобы числитель был положительным. Это определяет максимально допустимое значение.

N ∗ = ⟨1 2 + 1 2 1 + 2 b⟩ {\ displaystyle N ^ {*} = \ langle {\ frac {1} {2}} + {\ frac {1 } {2}} {\ sqrt {1 + {\ frac {2} {b}}}} \ rangle}

{\ displaystyle N ^ {*} = \ langle {\ frac {1} {2}} + {\ frac {1} {2 }} {\ sqrt {1 + {\ frac {2} {b}}}} \ rangle}

где

⟨Z⟩ {\ displaystyle \ langle Z \ rangle}

{\ displaystyle \ langle Z \ rangle}

- это верхний предел

Z {\ displaystyle Z}

Z

, т.е. наименьшее положительное целое число, большее или равное

Z {\ displaystyle Z}

Z

Пример: мы предполагаем, что b = 1 / 20. Тогда N = 3. Теперь мы опишем все равновесия для N = 1, 2 или 3 (см. Рисунок 2).

Рисунок 2: Сообщение и утилиты для конфликта интересов b = 1/20, для N = 1, 2 и 3

N = 1: Это равновесие лепета. t 0 = 0, t 1 = 1; a 1 = 1/2 = 0,5.

N = 2: t0= 0, t 1 = 2/5 = 0,4, t 2 = 1; a 1 = 1/5 = 0,2, a 2 = 7/10 = 0,7.

N = N = 3: t0= 0, t 1 = 2/15, t 2 = 7/15, t 3 = 1; a 1 = 1/15, a 2 = 3/10 = 0,3, a 3 = 11/15.

При N = 1 мы получить самое грубое сообщение, которое не дает никакой информации. Итак, в верхней левой панели все красное. При N = 3 сообщение более тонкое. Однако оно остается довольно грубым по сравнению с полным откровением, которое было бы линией 45 °, но которое не является равновесием по Нэшу.

При более высоком N и более тонком сообщении синяя область более важна. Это подразумевает более высокую полезность. Раскрытие дополнительной информации приносит пользу обеим сторонам.

Приложения

Теория игр

Дешевый разговор, как правило, может быть добавлен к любой игре и имеет потенциал для улучшения набора возможных результатов равновесия. Например, можно добавить раунд дешевых разговоров в начале Битвы полов. Каждый игрок объявляет, собираются ли они пойти на футбольный матч или в оперу. Поскольку «Битва полов» - это координационная игра, этот начальный раунд общения может позволить игрокам выбирать среди множества равновесий, тем самым достигая более высоких выплат, чем в несогласованном случае. Сообщения и стратегии, которые приводят к такому результату, симметричны для каждого игрока. Это: 1) объявить оперу или футбол с четной вероятностью 2) если человек объявляет оперу (или футбол), то, услышав это сообщение, другой человек также скажет оперу (или футбол) (Фаррелл и Рабин, 1996). Если они оба объявляют разные варианты, то координация не достигается. В случае обмена сообщениями только с одним игроком это также может дать ему преимущество первопроходца.

Однако не гарантируется, что дешевые разговоры повлияют на равновесные выплаты. Другая игра, Дилемма заключенного, - это игра, единственное равновесие которой находится в доминирующих стратегиях. Любые дешевые разговоры перед игрой будут проигнорированы, и игроки будут разыгрывать свои доминирующие стратегии (Дефект, Дефект) независимо от отправленных сообщений.

Биологические приложения

Обычно утверждалось, что дешевые разговоры не повлияют на основную структуру игры. В биологии авторы часто утверждали, что дорогостоящая передача сигналов лучше всего объясняет передачу сигналов между животными (см. Принцип гандикапа, Теория передачи сигналов ). Это общее убеждение сталкивается с некоторыми проблемами (см. Работу Карла Бергстрома и Брайана Скирмса 2002, 2004). В частности, несколько моделей, использующих эволюционную теорию игр, показывают, что дешевые разговоры могут оказывать влияние на эволюционную динамику конкретных игр.

См. Также

Примечания

Ссылки

Кроуфорд, вице-президент; Собель, Дж. (1982). «Стратегическая передача информации». Econometrica. 50(6): 1431–1451. CiteSeerX 10.1.1.461.9770. DOI : 10.2307 / 1913390. JSTOR 1913390.
Фаррелл, Дж.; Рабин М. (1996). "Разговор по пустякам". Журнал экономических перспектив. 10(3): 103–118. DOI : 10.1257 / jep.10.3.103. JSTOR 2138522.
Робсон, А. Дж. (1990). «Эффективность в эволюционных играх: Дарвин, Нэш и секретное рукопожатие» (PDF). Журнал теоретической биологии. 144 (3): 379–396. DOI : 10.1016 / S0022-5193 (05) 80082-7. PMID 2395377.
Скирмс, Б. (2002). «Сигналы, эволюция и объяснительная сила переходной информации» (PDF). Философия науки. 69(3): 407–428. doi : 10.1086 / 342451.
Скирмс, Б. (2004). Охота на оленей и эволюция социальной структуры. Нью-Йорк: Издательство Кембриджского университета. ISBN 0-521-82651-9.