Эволюционно устойчивая стратегия

редактировать

Стратегия, которая, если она будет принята населением в данной среде, не может быть нарушена какой-либо альтернативной стратегией, которая изначально редко встречается

Эволюционно устойчивая стратегия
A концепция решения в теории игр
Взаимосвязь
Подмножество	равновесия по Нэшу
Надмножество	Стохастически стабильное равновесие, стабильное Сильное равновесие по Нэшу
пересекается с	Совершенное равновесие в подиграх, Совершенное равновесие дрожащей рукой, Идеальное байесовское равновесие
Значимость
Предложено	Джоном Мейнардом Смит и Джордж Р. Прайс
Используется для	биологического моделирования и эволюционной теории игр
Пример	Ястребиный голубь

эволюционно стабильная стратегия (ESS ) - это стратегия (или набор стратегий), которая, если она принята населением в данной среде, является непостижимой, это означает, что в него не может вторгнуться никакая альтернатива поначалу редкие стратегии (или стратегии). Это актуально в теории игр, поведенческой экологии и эволюционной психологии. ESS - это уточнение равновесия равновесия Нэша. Это равновесие по Нэшу, которое «эволюционно » стабильно : если оно зафиксировано в популяции, естественного отбора достаточно для предотвратить успешное вторжение альтернативных (мутантных ) стратегий. Теория не предназначена для рассмотрения возможности серьезных внешних изменений в окружающей среде, которые приводят к появлению новых селективных сил.

Впервые опубликованный как особый термин в книге Джона Мейнарда Смита 1972 года, ESS широко используется в поведенческой экологии и экономике, а также в антропология, эволюционная психология, философия и политология.

Содержание

1 История
2 Мотивация
3 Равновесие по Нэшу
- 3.1 Примеры различий между равновесиями Нэша и ESSes
4 Vs. эволюционно стабильное состояние
5 Стохастическая ESS
6 Дилемма заключенного
7 Человеческое поведение
8 См. также
9 Ссылки
10 Дополнительная литература
11 Внешние ссылки

История

Эволюционно устойчивые стратегии были определены и представлены Джоном Мейнардом Смитом и Джорджем Р. Прайсом в статье 1973 Nature. На рецензирование статьи для журнала Nature потребовалось столько времени, что этому предшествовало эссе 1972 года Мейнарда Смита в сборнике эссе под названием «Об эволюции». Иногда вместо статьи 1973 года цитируют эссе 1972 года, но в университетских библиотеках гораздо больше шансов иметь экземпляры журнала Nature. Статьи в Nature обычно короткие; в 1974 г. Мейнард Смит опубликовал более длинную статью в Journal of Theoretical Biology. Мейнард Смит объясняет дальше в своей книге 1982 года Эволюция и теория игр. Иногда вместо них цитируют. Фактически, ESS стала настолько важной в теории игр, что часто не цитируется, поскольку предполагается, что читатель знаком с ней.

Мэйнард Смит математически формализовал словесный аргумент Прайса, который он прочитал во время рецензирования статьи Прайса. Когда Мейнард Смит понял, что несколько неорганизованный Прайс не готов редактировать его статью для публикации, он предложил добавить Прайса в качестве соавтора.

Эта концепция была взята из R. Х. Макартур и У. Работа Д. Гамильтона по соотношению полов, выведенная из принципа Фишера, особенно концепции Гамильтона (1967) о непревзойденной стратегии. Мейнард Смит был совместно награжден Премией Крафорда в 1999 г. за разработку концепции эволюционно устойчивых стратегий и применение теории игр к эволюции поведения.

Использование ESS:

ESS был основным элементом, использованным для анализа эволюции в бестселлере Ричарда Докинза 1976 года Эгоистичный ген.
ESS впервые был использован в социальных науках Роберт Аксельрод в своей книге 1984 года Эволюция сотрудничества. С тех пор он широко используется в социальных науках, включая антропологию, экономику, философию и политологию.
. естественных наук, основной интерес представляет не ESS как конец биологической эволюции, а как конечная точка культурной эволюции или индивидуального обучения.
In эволюционная психология, ESS используется в основном как модель для биологической эволюции человека.

Мотивация

Равновесие Нэша - это традиционная концепция решения в теории игр. Это зависит от когнитивных способностей игроков. Предполагается, что игроки осведомлены о структуре игры и сознательно пытаются предсказать ходы своих противников и максимизировать свои собственные. Кроме того, предполагается, что все игроки это знают (см. общие сведения ). Эти предположения затем используются, чтобы объяснить, почему игроки выбирают равновесные стратегии по Нэшу.

Эволюционно устойчивые стратегии мотивируются совершенно иначе. Здесь предполагается, что стратегии игроков закодированы биологически и наследуются. Люди не могут контролировать свою стратегию и не должны знать об игре. Они воспроизводятся и подвергаются силам естественного отбора, причем выигрыши в игре представляют собой репродуктивный успех (биологическая приспособленность ). Предполагается, что альтернативные стратегии игры иногда возникают в результате процесса, подобного мутации. Чтобы быть ESS, стратегия должна быть устойчивой к этим альтернативам.

Учитывая радикально разные мотивирующие предположения, может показаться удивительным, что ESS и равновесия по Нэшу часто совпадают. Фактически, каждая ESS соответствует равновесию по Нэшу, но некоторые равновесия по Нэшу не являются ESS.

Равновесие Нэша

ESS - это уточненная или модифицированная форма равновесия Нэша. (См. Следующий раздел, где приведены примеры, которые противопоставляют эти две стратегии.) В равновесии по Нэшу, если все игроки принимают свои соответствующие части, ни один игрок не может извлечь выгоду, переключившись на любую альтернативную стратегию. В игре на двоих это пара стратегий. Пусть E (S, T) представляет собой выигрыш за игру стратегии S против стратегии T. Пара стратегий (S, S) является равновесием по Нэшу в игре двух игроков тогда и только тогда, когда для обоих игроков для любой стратегии T:

E (S, S) ≥ E (T, S)

В этом определении стратегия T ≠ S может быть нейтральной альтернативой S (набирает одинаково хорошо, но не лучше). Предполагается, что равновесие по Нэшу является стабильным, даже если T имеет одинаковое значение, при условии, что у игроков нет долгосрочного стимула использовать T вместо S. Этот факт представляет собой отправную точку для ESS.

Мэйнард Смит и Прайс определяют два условия для того, чтобы стратегия S была ESS. Для всех T ≠ S либо

E (S, S)>E (T, S), or
E (S, S) = E (T, S) и E (S, T)>E ( T, T)

Первое условие иногда называют строгим равновесием по Нэшу. Второе иногда называют «вторым состоянием Мейнарда Смита». Второе условие означает, что хотя стратегия T нейтральна по отношению к выигрышу против стратегии S, совокупность игроков, продолжающих использовать стратегию S, имеет преимущество при игре против T.

Существует также альтернатива, более сильная. определение ESS, благодаря Томасу. Это делает другой акцент на роли концепции равновесия по Нэшу в концепции ESS. Следуя терминологии, указанной в первом определении выше, это определение требует, чтобы для всех T ≠ S

E (S, S) ≥ E (T, S), и
E (S, T)>E (T, T)

В этой формулировке первое условие определяет, что стратегия является равновесием по Нэшу, а второе определяет, что выполняется второе условие Мейнарда Смита. Обратите внимание, что эти два определения не совсем эквивалентны: например, каждая чистая стратегия в приведенной ниже игре координации является ESS по первому определению, но не по второму.

На словах это определение выглядит так: выигрыш первого игрока, когда оба игрока используют стратегию S, выше (или равен) выигрышу первого игрока, когда он переходит на другую стратегию T и второй игрок сохраняет свою стратегию S, и выигрыш первого игрока, когда только его противник меняет свою стратегию на T, выше, чем его выигрыш в случае, если оба игрока меняют свои стратегии на T.

Эта формулировка более четко подчеркивает роль условия равновесия по Нэшу в ESS. Это также позволяет дать естественное определение связанных понятий, таких как слабый ESS или эволюционно устойчивый набор.

Примеры различий между равновесиями Нэша и ESSes

	Cooperate	Дефект
Сотрудничать	3, 3	1, 4
Дефект	4, 1	2, 2
Дилемма заключенного

	A	B
A	2, 2	1, 2
B	2, 1	2, 2
Вредите своему соседу

В большинстве простых игр ESSes и равновесие Нэша совпадают отлично. Например, в дилемме заключенного существует только одно равновесие по Нэшу, и его стратегия (дефект) также является ESS.

В некоторых играх могут быть равновесия Нэша, не являющиеся ESS. Например, в (чья матрица выплат показана здесь) и (A, A), и (B, B) являются равновесиями по Нэшу, поскольку игроки не могут добиться большего, переключаясь с одного из них. Однако только B - это ESS (и сильный Нэш). A не является ESS, поэтому B может нейтрально вторгнуться в популяцию стратегов A и преобладать, потому что B имеет больше очков против B, чем A против B. Эта динамика отражается во втором условии Мейнарда Смита, поскольку E (A, A) = E (B, A), но это не тот случай, когда E (A, B)>E (B, B).

	C	D
C	2, 2	1, 2
D	2, 1	0, 0
Вредить всем

	Свернуть	Остаться
Свернуть	0,0	−1, + 1
Остаться	+ 1, −1	−20, −20
Курица

Равновесия по Нэшу с равноценными альтернативами могут быть ESS. Например, в игре «Вредите всем» C является ESS, потому что удовлетворяет второму условию Мейнарда Смита. Стратеги D могут временно вторгнуться в группу стратегов C, одинаково хорошо набрав очки против C, но они платят цену, когда начинают играть друг против друга; C лучше против D, чем D. Итак, здесь, хотя E (C, C) = E (D, C), также верно, что E (C, D)>E (D, D). В результате C - это ESS.

Даже если игра имеет чистое стратегическое равновесие по Нэшу, может оказаться, что ни одна из этих чистых стратегий не является ESS. Рассмотрим Дичу курицу. В этой игре есть две чистые стратегии равновесия по Нэшу (Swerve, Stay) и (Stay, Swerve). Однако в отсутствие некоррелированной асимметрии ни Swerve, ни Stay не являются ESS. Существует третье равновесие по Нэшу, смешанная стратегия, которая является ESS для этой игры (см. Игра «Ястреб-голубь» и Лучший ответ для объяснения).

Этот последний пример указывает на важное различие между равновесием Нэша и ESS. Равновесия по Нэшу определяются на наборах стратегий (спецификация стратегии для каждого игрока), в то время как ESS определяются в терминах самих стратегий. Равновесия, определенные ESS, всегда должны быть симметричными и, следовательно, иметь меньше точек равновесия.

Против. эволюционно стабильное состояние

В популяционной биологии две концепции эволюционно стабильной стратегии (ESS) и эволюционно стабильного состояния тесно связаны, но описывают разные ситуации.

В эволюционно стабильной стратегии, если все члены популяции примут ее, никакая мутантная стратегия не сможет вторгнуться. Как только практически все члены населения используют эту стратегию, «рациональной» альтернативы нет. ESS является частью классической теории игр.

В эволюционно стабильном состоянии генетический состав популяции восстанавливается путем отбора после нарушения, если нарушение не слишком велико. Эволюционно стабильное состояние - это динамическое свойство популяции, которая возвращается к использованию стратегии или комбинации стратегий, если она нарушена из этого начального состояния. Это часть популяционной генетики, динамической системы или теории эволюционных игр. Теперь это называется конвергентной устойчивостью.

B. Томас (1984) применяет термин ESS к индивидуальной стратегии, которая может быть смешанной, а эволюционно стабильное состояние популяции - к совокупности чистых стратегий популяций, которые формально могут быть эквивалентны смешанной ESS.

Является ли популяция эволюционно стабильный не связан с его генетическим разнообразием: он может быть генетически мономорфным или полиморфным.

Стохастическим ESS

В классическом определении ESS никакая мутантная стратегия не может вторгнуться. В конечных популяциях любой мутант может в принципе вторгнуться, хотя и с малой вероятностью, что подразумевает, что ESS не может существовать. Вместо этого в бесконечной популяции ESS можно определить как стратегию, которая в случае вторжения новой мутантной стратегии с вероятностью p сможет противостоять вторжению со стороны одного исходящего индивида с вероятностью>p, как показано на примере эволюции bet-hedging.

Дилемма заключенного

	Сотрудничайте	Дефект
Сотрудничайте	3, 3	1, 4
Дефект	4, 1	2, 2
Дилемма заключенного

Распространенной моделью альтруизма и социального сотрудничества является дилемма заключенного. Здесь группе игроков было бы лучше, если бы они могли играть в Cooperate, но, поскольку Defect работает лучше, у каждого отдельного игрока есть стимул играть в Defect. Одно из решений этой проблемы состоит в том, чтобы ввести возможность возмездия, заставляя людей многократно играть в игру против одного и того же игрока. В так называемой итерации дилеммы заключенного одни и те же два человека снова и снова разыгрывают дилемму заключенного. В то время как дилемма заключенного имеет только две стратегии (сотрудничество и отступление), повторяющаяся дилемма заключенного имеет огромное количество возможных стратегий. Поскольку у человека могут быть разные планы действий в чрезвычайных ситуациях для каждой истории, а игра может повторяться неограниченное количество раз, фактически может существовать бесконечное количество таких планов действий в чрезвычайных ситуациях.

Три простых плана действий на случай непредвиденных обстоятельств, которым было уделено значительное внимание: «Всегда отказываться», «Всегда сотрудничать» и Око за око. Первые две стратегии делают одно и то же независимо от действий другого игрока, в то время как последний отвечает в следующем раунде, делая то, что было сделано с ним в предыдущем раунде - он отвечает на сотрудничество с взаимодействием и дефект с дефектом.

Если все население играет «Око за око» и появляется мутант, который играет «Всегда сбегать», то «Око за око» превосходит «Всегда сбегать». Если популяция мутанта станет слишком большой - процент мутанта останется небольшим. Таким образом, «око за око» является ESS, только в отношении этих двух стратегий. С другой стороны, остров игроков Always Defect будет устойчивым к вторжению нескольких игроков «око за око», но не против большого их числа. Если мы введем «Всегда сотрудничать», популяция «око за око» перестанет быть ESS. Поскольку популяция игроков «око за око» всегда сотрудничает, стратегия «Всегда сотрудничать» ведет себя в этой популяции идентично. В результате мутант, который играет «Всегда сотрудничать», не будет удален. Однако, даже если популяция «Всегда сотрудничать» и «око за око» может сосуществовать, если есть небольшой процент населения, которое всегда отступает, давление отбора направлено против «Всегда сотрудничать» и в пользу «око за око». Это происходит из-за меньшего вознаграждения за сотрудничество, чем за отказ от оппонента.

Это демонстрирует трудности применения формального определения ESS к играм с большим пространством стратегий и побудило некоторых рассмотреть альтернативы.

Человеческое поведение

Области социобиологии и эволюционной психологии пытаются объяснить поведение и социальные структуры животных и человека, в основном с точки зрения эволюционной устойчивости. стратегии. Социопатия (хроническое антиобщественное или преступное поведение) может быть результатом комбинации двух таких стратегий.

Эволюционно стабильные стратегии изначально рассматривались для биологической эволюции, но они могут применяться в других контекстах. Фактически, существуют стабильные состояния для большого класса адаптивной динамики. В результате их можно использовать для объяснения поведения человека, лишенного каких-либо генетических влияний.

См. Также

Ссылки

Дополнительная литература

Weibull, Jörgen (1997). Эволюционная теория игр. MIT Нажмите. ISBN 978-0-262-73121-8.Классический справочник.
Hines, W. G. S. (1987). «Эволюционно стабильные стратегии: обзор основ теории». Теоретическая популяционная биология. 31 (2): 195–272. DOI : 10.1016 / 0040-5809 (87) 90029-3. PMID 3296292.
Лейтон-Браун, Кевин; Шохам, Йоав (2008). Основы теории игр: краткое междисциплинарное введение. Сан-Рафаэль, Калифорния: Издательство Morgan Claypool. ISBN 978-1-59829-593-1.. 88-страничное математическое введение; см. раздел 3.8. Бесплатный онлайн во многих университетах.
Паркер, Г.А. (1984) Эволюционно стабильные стратегии. В поведенческой экологии: эволюционный подход (2-е изд.) Кребс, Дж. Р. и Дэвис Н.Б., ред. С. 30–61. Блэквелл, Оксфорд.
Шохам, Йоав; Лейтон-Браун, Кевин (2009). Мультиагентные системы: алгоритмические, теоретико-игровые и логические основы. Нью-Йорк: Cambridge University Press. ISBN 978-0-521-89943-7.. Исчерпывающий справочник с вычислительной точки зрения; см. раздел 7.7. Можно бесплатно скачать онлайн.
Мейнард Смит, Джон. (1982) Эволюция и теория игр. ISBN 0-521-28884-3. Классическая ссылка.

Внешние ссылки

Эволюционно стабильные стратегии в поведении животных: онлайн-учебник Майкла Д. Брида.
Теория игр и эволюционно стабильные стратегии, сайт Кеннета Н. Прествича в колледже Святого Креста.
Эволюционно стабильные стратегии кнол