В теории игр дешевый разговор - это общение между игроками, которое напрямую не влияет на выигрыши от игры. Предоставление и получение информации бесплатно. Это контрастирует с сигнализацией, при которой отправка определенных сообщений может быть дорогостоящей для отправителя в зависимости от состояния мира.
Один субъект обладает информацией, а другой способен действовать. Информированный игрок может стратегически выбирать, что говорить, а что не говорить. Все становится интересно, когда интересы игроков не совпадают. Классический пример - эксперт (скажем, эколог), пытающийся объяснить состояние мира неосведомленному лицу, принимающему решения (скажем, политик, голосующий по законопроекту о вырубке лесов ). Лицо, принимающее решение, после того, как выслушает отчет эксперта, должно принять решение, которое влияет на выплаты обоих игроков.
Эта базовая настройка, установленная Кроуфордом и Собелом, породила множество вариантов.
Чтобы дать формальное определение, дешевый разговор - это коммуникация, которая:
Следовательно, агент, участвующий в дешевых разговорах, может безнаказанно лгать, но может выбрать в равновесии не делать этого.
В базовой форме игры между двумя игроками общаются: один отправитель S и один получатель R.
Тип. Отправитель S получает информацию о состоянии мира или его "типе" t. Получатель R не знает t; у него есть только предварительные убеждения об этом, и он полагается на сообщение от S, чтобы, возможно, повысить точность своих убеждений.
Сообщение. S решает отправить сообщение m. Сообщение m может раскрывать полную информацию, но оно также может давать ограниченную, размытую информацию: обычно в нем говорится: «Состояние мира находится между t 1 и t 2 ». Он может вообще не давать никакой информации.
Форма сообщения не имеет значения, пока существует взаимопонимание, общее толкование. Это может быть общее заявление председателя центрального банка, политическая речь на любом языке и т. Д. Какой бы ни была форма, в конечном итоге это может означать: «Состояние мира находится между t 1 и t 2 ".
Действие. Получатель R принимает сообщение m. R обновляет свои представления о состоянии мира с учетом новой информации, которую он может получить, используя правило Байеса. R решает принять меры a. Это действие влияет как на его собственную полезность, так и на полезность отправителя.
Полезность. Решение S относительно содержания m основано на максимизации его полезности, учитывая то, что он ожидает от R. Полезность - это способ количественной оценки удовлетворения или желаний. Это может быть финансовая прибыль или нефинансовое удовлетворение, например, степень защиты окружающей среды.
→ Квадратичные полезности:
Соответствующие полезности S и R могут быть указаны следующим образом:
Теория применима к более общим формам полезности, но квадратичные предпочтения упрощают изложение. Таким образом, S и R имеют разные цели, если b ≠ 0. Параметр b интерпретируется как конфликт интересов между двумя игроками или, альтернативно, как предвзятость.
U максимизируется, когда a = t, что означает, что получатель хочет предпринять действия, которые соответствует состоянию мира, которого он не знает в целом. U максимизируется, когда a = t + b, что означает, что S хочет, чтобы было предпринято немного более сильное действие. Поскольку S не управляет действием, S должен выполнить желаемое действие, выбрав, какую информацию раскрыть. Полезность каждого игрока зависит от состояния мира и решений обоих игроков, которые в конечном итоге приводят к действию a.
равновесие по Нэшу. Мы ищем равновесие, в котором каждый игрок принимает оптимальное решение, предполагая, что другой игрок также принимает решение оптимально. Игроки рациональны, хотя у R лишь ограниченная информация. Ожидания сбываются, и нет стимула отклоняться от этой ситуации.
Кроуфорд и Собел характеризуют возможные равновесия по Нэшу.
Когда интересы согласовано, то информация раскрывается полностью. Когда конфликт интересов очень велик, вся информация скрывается. Это крайние случаи. Модель допускает более тонкий случай, когда интересы близки, но различны и в этих случаях оптимальное поведение приводит к раскрытию некоторой, но не всей информации, что приводит к различным видам тщательно сформулированных предложений, которые мы можем наблюдать.
В более общем смысле:
Сообщения. Хотя сообщения могут ex-ante принимать бесконечное число возможных значений µ (t) для бесконечного числа возможных состояний мира t, на самом деле они могут принимать только конечное число значений (m 1, m 2,..., m N).
Таким образом, равновесие может быть охарактеризовано разделением (t 0 (N), t 1 (N)... t N (N)) множества типов [0, 1], где 0 = t 0 (N) < t1 (N) <... < tN(N) = 1. Это разбиение показан в верхнем правом сегменте рисунка 1.
t i (N) - это границы интервалов, в которых сообщения постоянны: для t i-1 (N) < t < ti(N), µ (t) = m i.
Действия. Поскольку действия являются функциями сообщений, действия также постоянны в этих интервалах: для t i-1 (N) < t < ti(N), α (t) = α (m i) = a i.
Функция действия теперь косвенно характеризуется тем, что каждое значение a i оптимизирует отдачу для R, зная, что t находится между t 1 и t 2. Математически (при условии, что t равномерно распределен по [0, 1]),
→ Квадратичные полезности:
При условии, что R знает, что t находится между t i-1 и t i, и в частном случае квадратичной полезности, когда R хочет, чтобы действие a было как можно ближе к t, мы можем показать, что довольно интуитивно оптимальным действием является середина интервала:
Условие безразличия. Что происходит при t = t я ? Отправителю должно быть безразлично, отправлено ли сообщение m i-1 или m i. 1 ≤ i≤ N-1
Это дает информация о N и t i.
→ Практически:
Мы рассматриваем разбиение размера N. Можно показать, что
N должно быть достаточно маленьким, чтобы числитель был положительным. Это определяет максимально допустимое значение.
где - это верхний предел , т.е. наименьшее положительное целое число, большее или равное .Пример: мы предполагаем, что b = 1 / 20. Тогда N = 3. Теперь мы опишем все равновесия для N = 1, 2 или 3 (см. Рисунок 2).
Рисунок 2: Сообщение и утилиты для конфликта интересов b = 1/20, для N = 1, 2 и 3N = 1: Это равновесие лепета. t 0 = 0, t 1 = 1; a 1 = 1/2 = 0,5.
N = 2: t0= 0, t 1 = 2/5 = 0,4, t 2 = 1; a 1 = 1/5 = 0,2, a 2 = 7/10 = 0,7.
N = N = 3: t0= 0, t 1 = 2/15, t 2 = 7/15, t 3 = 1; a 1 = 1/15, a 2 = 3/10 = 0,3, a 3 = 11/15.
При N = 1 мы получить самое грубое сообщение, которое не дает никакой информации. Итак, в верхней левой панели все красное. При N = 3 сообщение более тонкое. Однако оно остается довольно грубым по сравнению с полным откровением, которое было бы линией 45 °, но которое не является равновесием по Нэшу.
При более высоком N и более тонком сообщении синяя область более важна. Это подразумевает более высокую полезность. Раскрытие дополнительной информации приносит пользу обеим сторонам.
Дешевый разговор, как правило, может быть добавлен к любой игре и имеет потенциал для улучшения набора возможных результатов равновесия. Например, можно добавить раунд дешевых разговоров в начале Битвы полов. Каждый игрок объявляет, собираются ли они пойти на футбольный матч или в оперу. Поскольку «Битва полов» - это координационная игра, этот начальный раунд общения может позволить игрокам выбирать среди множества равновесий, тем самым достигая более высоких выплат, чем в несогласованном случае. Сообщения и стратегии, которые приводят к такому результату, симметричны для каждого игрока. Это: 1) объявить оперу или футбол с четной вероятностью 2) если человек объявляет оперу (или футбол), то, услышав это сообщение, другой человек также скажет оперу (или футбол) (Фаррелл и Рабин, 1996). Если они оба объявляют разные варианты, то координация не достигается. В случае обмена сообщениями только с одним игроком это также может дать ему преимущество первопроходца.
Однако не гарантируется, что дешевые разговоры повлияют на равновесные выплаты. Другая игра, Дилемма заключенного, - это игра, единственное равновесие которой находится в доминирующих стратегиях. Любые дешевые разговоры перед игрой будут проигнорированы, и игроки будут разыгрывать свои доминирующие стратегии (Дефект, Дефект) независимо от отправленных сообщений.
Обычно утверждалось, что дешевые разговоры не повлияют на основную структуру игры. В биологии авторы часто утверждали, что дорогостоящая передача сигналов лучше всего объясняет передачу сигналов между животными (см. Принцип гандикапа, Теория передачи сигналов ). Это общее убеждение сталкивается с некоторыми проблемами (см. Работу Карла Бергстрома и Брайана Скирмса 2002, 2004). В частности, несколько моделей, использующих эволюционную теорию игр, показывают, что дешевые разговоры могут оказывать влияние на эволюционную динамику конкретных игр.