A Непрерывная игра - это математическая концепция, используемая в теории игр, которая обобщает идею обычная игра вроде крестиков-ноликов (крестики-нолики) или шашек (шашки). Другими словами, он расширяет понятие дискретной игры, в которой игроки выбирают из конечного набора чистых стратегий. Концепция непрерывной игры позволяет играм включать в себя более общие наборы чистых стратегий, которые могут быть несчетно бесконечными.
В общем, игра с несчетно бесконечными наборами стратегий не обязательно будет иметь равновесное решение по Нэшу.. Если, однако, требуется, чтобы наборы стратегий были компактными, а функции полезности непрерывными, тогда равновесие по Нэшу будет гарантировано; это сделано в результате обобщения Гликсбергом теоремы Какутани о неподвижной точке. По этой причине класс непрерывных игр обычно определяется и изучается как подмножество более широкого класса бесконечных игр (то есть игр с бесконечными наборами стратегий), в которых наборы стратегий компактны, а функции полезности непрерывны.
Содержание
- 1 Формальное определение
- 2 Примеры
- 2.1 Разделимые игры
- 2.1.1 Полиномиальная игра
- 2.2 Неразделимые игры
- 2.2.1 Функция рациональной выплаты
- 2.2.2 Требование распределения Кантора
- 3 Дополнительная литература
- 4 См. Также
- 5 Ссылки
Формальное определение
Определите непрерывное игра где
- - это набор игроков,
- где каждый представляет собой компактный набор в метрическом пространстве, соответствующий к набор чистых стратегий игрока,
- где - функция полезности игрока
- Мы определяем как набор борелевских вероятностных мер на , что дает нам пространство смешанных стратегий игрока i.
- Определите профиль стратегии где
Пусть быть стратегическим профилем всех игроков, кроме игрока . Как и в случае с дискретными играми, мы можем определить лучший ответ соответствие для игрока , . - отношение из набора всех распределений вероятностей по профилям игроков оппонента к набору игроков Стратегии , такие, что каждый элемент
является лучшим ответом на . Определим
- .
Профиль стратегии является равновесием по Нэшу тогда и только тогда, когда Существование равновесия по Нэшу для любого Непрерывная игра с непрерывными функциями полезности может быть доказана с помощью обобщения теоремы Какутани о неподвижной точке. В общем, решения может не быть, если мы разрешаем пространства стратегий, , которые не являются компактными, или если мы разрешаем прерывистые служебные функции.
Разделимые игры
A разделимая игра - это непрерывная игра, в которой для любого i функция полезности можно выразить в виде суммы произведений:
- , где , , , а функции являются непрерывными.
A полиномиальная игра - это разделяемая игра, в которой каждый представляет собой компактный интервал на и каждая служебная функция может быть записанным как многомерный полином.
В общем, смешанные равновесия по Нэшу для разделяемых игр легче вычислить, чем неразделимые игры, как следует из следующей теоремы:
- Для любой разделяемой игры существует по крайней мере одно равновесие по Нэшу, в котором игрок i смешивает большинство чистых стратегий.
В то время как равновесная стратегия для неотделимой игры может потребовать бесконечно бесконечного support, разделимая игра гарантированно имеет по крайней мере одно равновесие по Нэшу со смешанными стратегиями с конечным носителем.
Примеры
Разделимые игры
Полиномиальная игра
Рассмотрим игру двух игроков с нулевой суммой между игроками X и Y, где . Обозначим элементы и как и соответственно. Определите функции полезности где
- .
Чистые отношения наилучшего ответа стратегии:
и не пересекаются, поэтому существует
нет чистой стратегии равновесия по Нэшу. Однако должно быть смешанное стратегическое равновесие. Чтобы найти его, выразите математическое ожидание, как линейная комбинация первого и второго моментов p распределения надежности X и Y:
(где и аналогично для Y).
Ограничения для и (с аналогичными ограничениями для y,) задаются Хаусдорфом как:
Каждая пара ограничений определяет компактное выпуклое подмножество на плоскости. Поскольку является линейным, любые экстремумы по отношению к первым двум моментам игрока будут лежать на границе этого подмножества. Стратегия равновесия игрока i будет лежать на
Обратите внимание, что первое уравнение допускает только смеси 0 и 1, тогда как второе уравнение допускает только чистые стратегии. Более того, если лучший ответ в определенный момент игроку i лежит на , он будет лежать на всей строке, так что и 0, и 1 являются лучшим ответом. просто дает чистую стратегию , поэтому никогда не даст одновременно 0 и 1. Однако дает и 0, и 1, когда y = 1/2. Равновесие по Нэшу существует, когда:
Это определяет одно уникальное равновесие, в котором Игрок X играет случайную смесь 0 в течение 1/2 времени и 1 в течение другой 1/2 времени. Игрок Y использует чистую стратегию 1/2. Стоимость игры - 1/4.
Неразделимые игры
Рациональная функция выигрыша
Рассмотрим игру двух игроков с нулевой суммой между игроками X и Y, где . Обозначим элементы и как и соответственно. Определите функции полезности где
В этой игре нет чистой стратегии равновесия по Нэшу. Можно показать, что единственная смешанная стратегия равновесия по Нэшу существует со следующей парой функций плотности вероятности :
Ценность игры: .
Требуется кантор распределение
Рассмотрим игру двух игроков с нулевой суммой между игроками X и Y с . Обозначим элементы и как и соответственно. Определите функции полезности где
- .
Эта игра имеет уникальное равновесие смешанной стратегии, в котором каждый игрок играет смешанную стратегию с сингулярной функцией кантора как кумулятивной функцией распределения.
Дополнительная литература
- H. W. Kuhn и A. W. Tucker, ред. (1950). Вклад в теорию игр: Vol. II. Анналы математических исследований 28 . Издательство Принстонского университета. ISBN 0-691-07935-8.
См. Также
Ссылки
- ^I.L. Гликсберг. Дальнейшее обобщение теоремы Какутани о неподвижной точке с применением к точкам равновесия по Нэшу. Труды Американского математического общества, 3 (1): 170–174, февраль 1952 г.
- ^Н. Штейн, А. Оздаглар, П.А. Паррило. «Разделимые и непрерывные игры низкого ранга». International Journal of Game Theory, 37 (4): 475–504, декабрь 2008 г. https://arxiv.org/abs/0707.3462
- ^Гликсберг, И. и Гросс, О. (1950). «Записки об играх над площадью». Кун, Х.В. И Такер, A.W. ред. Вклад в теорию игр: Том II. Анналы математических исследований 28, с.173–183. Издательство Принстонского университета.
- ^Гросс, О. (1952). «Рациональная характеристика выигрыша распределения Кантора». Технический отчет D-1349, Корпорация РЭНД.