Эпсилон-равновесие | |
---|---|
A концепция решения в теория игр | |
Взаимосвязь | |
Надмножество | равновесия Нэша |
Значимость | |
Используется для | стохастических игр |
В теории игр, эпсилон- равновесие, или равновесие, близкое к равновесию по Нэшу, представляет собой профиль стратегии , который приблизительно удовлетворяет условию равновесия по Нэшу. В равновесии по Нэшу ни у одного игрока нет стимула изменить свое поведение. В приближенном равновесии по Нэшу это требование ослаблено, чтобы допустить возможность того, что у игрока может быть небольшой стимул сделать что-то другое. Это все еще может считаться подходящей концепцией решения, если предположить, например, смещение статус-кво. Эта концепция решения может быть предпочтительнее равновесия по Нэшу из-за того, что ее легче вычислить, или, альтернативно, из-за возможности того, что в играх с участием более двух игроков вероятности, участвующие в точном равновесии Нэша, не обязательно должны быть рациональными числами.
Есть еще чем одно альтернативное определение.
Для данной игры и реального неотрицательного параметра , профиль стратегии считается -равновесием, если ни один игрок не может получить больше, чем в ожидали выигрыша, в одностороннем порядке отклонившись от своей стратегии. Каждое равновесие по Нэшу эквивалентно -равновесие, где .
формально, пусть быть игрой с наборами действий для каждого игрока и служебная функция . Пусть обозначает выигрыш для игрока при стратегии profile воспроизводится. Пусть будет пространством распределений вероятностей для . Вектор стратегий представляет собой -равновесие Нэша для , если
Следующее определение налагает более строгое требование, что игрок может присвоить положительную вероятность чистой стратегии , только если выигрыш имеет ожидаемую выплату не более меньше, чем выигрыш за лучший ответ. Пусть будет вероятностью того, что профиль стратегии будет воспроизведен. Для игрока пусть будет стратегическими профилями игроков, кроме ; для и чистой стратегии of пусть будет профилем стратегии, где играет и другие игроки играют в . Пусть будет выигрышем для при профиле стратегии используется. Требование может быть выражено формулой
Существование схемы полиномиального времени (PTAS) для равновесия ε-Нэша эквивалентно вопросу о существовании такой схемы. для приближенных состояний равновесия по Нэшу с ε-хорошей опорой, но существование PTAS остается открытой проблемой. Для постоянных значений ε полиномиальные алгоритмы приближенного равновесия известны для более низких значений ε, чем известные для приближенных равновесий с надежными опорами.. Для игр с выплатами в диапазоне [0,1] и ε = 0,3393, ε-Na sh-равновесия могут быть вычислены за полиномиальное время Для игр с выплатами в диапазоне [0,1] и ε = 2/3, ε-хорошо поддерживаемые равновесия могут быть вычислены за полиномиальное время
Понятие ε-равновесия важно в теории стохастических игр потенциально бесконечной продолжительности. Существуют простые примеры стохастических игр без равновесия по Нэшу, но с ε-равновесием для любого ε, строго превышающего 0.
Возможно, самым простым из таких примеров является следующий вариант Соответствие пенни, предложено Эвереттом. Игрок 1 прячет пенни, а Игрок 2 должен угадать, выпала ли она решка или решка. Если Игрок 2 угадает правильно, он выигрывает пенни у Игрока 1, и игра заканчивается. Если Игрок 2 ошибочно угадает, что выпал один пенни, игра заканчивается с нулевой выплатой для обоих игроков. Если он неправильно угадает, что решка, игра повторяется . Если игра продолжается бесконечно, выигрыш для обоих игроков равен нулю.
Если задан параметр ε>0, любой профиль стратегии, в котором Игрок 2 угадывает один-единственный вариант с вероятностью ε и решает с вероятностью 1 - ε (на каждом этапе игры и независимо от предыдущие этапы) является ε-равновесием для игры. Ожидаемый выигрыш Игрока 2 в таком профиле стратегии составляет не менее 1 - ε. Однако легко увидеть, что не существует стратегии для Игрока 2, которая могла бы гарантировать ожидаемый выигрыш, равный точно 1. Следовательно, в игре нет равновесия по Нэшу.
Другой простой пример - это конечно повторение заключенного. дилемма для T периодов, где выигрыш усредняется за T периодов. Единственное равновесие по Нэшу этой игры - выбирать Дефект в каждом периоде. Теперь рассмотрим две стратегии око за око и мрачный триггер. Хотя ни око за око, ни мрачный триггер не являются равновесиями по Нэшу для игры, они оба являются - равновесия для некоторого положительного . Допустимые значения зависят от выплат составляющей игры и от количества T периодов.
В экономике концепция чистой стратегии эпсилон-равновесие используется, когда подход смешанной стратегии считается нереалистичным. В эпсилон-равновесии чистой стратегии каждый игрок выбирает чистую стратегию, которая находится в пределах эпсилона его лучшей чистой стратегии. Например, в модели Бертрана – Эджворта, где не существует равновесия чистой стратегии, может существовать эпсилон-равновесие чистой стратегии.