Эволюционная теория игр

редактировать
Применение теории игр к эволюционирующим популяциям в биологии

Эволюционная теория игр (EGT ) - это приложение теории игр к развивающимся популяциям в биологии. Он определяет соревнований, стратегий и аналитики, которые могут быть смоделировано дарвиновское соревнование. Она возникла в 1973 году с формы формирования соревнований Джона Мейнарда Смита и Джорджа Р. Прайса, анализируемых как стратегии, и математических критериев, объявленных рейтинги результатов конкурирующих стратегий..

Эволюционная теория игр отличается от классической теории игр тем, что уделяет больше внимания динамике стратегии. На это частота конкурирующих стратегий в популяции.

Эволюционная теория игр помогла объяснить основы альтруистического поведения в дарвиновской эволюции. Это, в свою очередь, стало интересовать экономистов, социологов, антропологов и философов.

Содержание

  • 1 История
    • 1.1 Классическая теория игр
    • 1.2 Проблема ритуализированного поведения
    • 1.3 Адаптация теории игр к эволюционным играм
  • 2 Эволюционные игры
    • 2.1 Модели
    • 2.2 Hawk Dove
    • 2.3 Война на истощение
    • 2.4 Асимметрии, позволяющие новые стратегии
    • 2.5 Социальное поведение
  • 3 Конкурсы эгоистичных генов
    • 3.1 Эусоциальность и родственный отбор
    • 3.2Дилемма заключенного
    • 3.3 Пути к альтруизму
    • 3.4 Эволюционно стабильная стратегия
  • 4 Нестабильные игры, циклические модели
    • 4.1 Камень-ножницы-бумага
    • 4.2 Ящерица с пятнами сбоку играет в RPS и другие циклические игры...
  • 5 Сигналы, половой отбор и принцип гандикапа
  • 6 Коэволюция
  • 7 Расширение модели
    • 7.1 Пространственные игры
    • 7.2 Эффекты от обладания информацией
    • 7.3 Конечные популяции
  • 8 См. Также
  • 9 Примечания
  • 10 Ссылки
  • 11Дальнейшее чтение
  • 12 Внешние ссылки

История

Классическая теория игр

Классическая теория некооперативных игр была задумана Джоном фон Нейманом определить оптимальные стратегии в соревнованиях между противниками. В состязании участвуют игроки, каждый из которых может выбрать ход. Игры могут быть однократными или повторяющимися. Подход игрока к своим ходам составляет его стратегию. Правила определяют исходные ходы, принятые игроками, и результатыпроизводят выплаты игрокам; правила и результирующие выплаты могут быть выражены как деревья решений или в матрице выплат. Классическая теория требует от игроков делать рациональный выбор. Каждый игрок должен осуществлять стратегический анализ, который проводит его противники.

Проблема ритуализированного поведения

Математический биолог Джон Мейнард Смит моделировал эволюционные игры.

Эволюционная теория игр началась с проблемы, как объяснитьритуализированное поведение животных в конфликтной ситуации; «Почему животные такие« джентльменские или женственные »в конкурсах за ресурсы?» Ведущие этологи Нико Тинберген и Конрад Лоренц предположили, что такое поведение существует на благо вида. Джон Мейнард Смит считал, что это несовместимо с дарвиновской мыслью, согласно отбору на индивидуальном уровне, поэтому личный интерес вознаграждается, а стремление к общему благу - нет. Мэйнард Смит,математический биолог, обратился к теории игр, как это предлагал Джордж Прайс, хотя попытки Ричарда Левонтина использовать эту теорию не увенчались успехом.

Адаптация теории игр к эволюционным играм

Мейнард Смит понял, что эволюционная версия теории игр не требует от игроков рациональных действий - только наличие у стратегии. Результаты игры показывают, насколько хороша эта стратегия, точно так же, как evolution проверяет альтернативные стратегии наспособность выживать и воспроизводиться. В биологии стратегии - это генетически унаследованные черты, которые контролируют действие человека, аналогично компьютерным программам. Успех стратегии определяет тем, насколько хороша стратегия при наличии конкурирующих стратегий (включая ее саму), и частоты, с этими используемыми стратегиями. Мейнард Смит описал свою работу в своей книге Эволюция и теория игр.

. Участники как больше копий стремятся. Это всегда многопользовательская игра смножеством конкурентов. Правила включают динамику репликатора, другими словами, как более подходящие игроки будут создавать больше копий себя и как менее подходящие отбираться в уравнении репликатора. Динамика репликатора моделирует наследственность, но не мутацию, и для простоты предполагает бесполое размножение. Игры запускаются повторно без каких-либо условий завершения. Результаты включают динамику изменений в популяции, успешность стратегии и любые достижения состояния равновесия.В отличие от классической теории игр, игроки не выбирают свою стратегию и не могут ее изменить: они рождаются со стратегией, и их потомки наследуют ту же стратегию.

Эволюционные игры

Модели

Эволюционные Теория игр анализирует дарвиновские механизмы с помощью модели системы с тремя компонентами - популяцией, игрой и динамикой репликатора. Системный процесс состоит из четырех фаз:.. 1) Модель (как сама эволюция) имеет дело с популяцией (Pn). Популяция будетдемонстрировать вариацию среди конкурирующих особей. В модели это соревнование представлено Игрой... 2) Игра проверяет стратегии людей в соответствии с «ограничениями». Эти правила производят разные выплаты - в единицах Пригодность (скорость производства потомства). Конкурирующие особи встречаются в парных состязаниях с другими, обычно в очень смешанном распределении популяции. Сочетание стратегий в популяции влияет на результаты выигрыша, изменяя шансы того, что любойчеловек может встретиться в различных стратегиях. Индивидуальные покидают парное соревнование игры с окончательной пригодностью, определяемой результатом, представленной в Матрице выплат... 3) На основании этой итоговой приспособления каждый член подвергания подвергается репликации или отбраковке, определяемой точным математика процесса динамики репликатора. Затем этот общий процесс дает новое поколение P (n + 1). У каждого выжившего индивидуума теперь новый уровень физической подготовки,определяемый результатом игры... 4) Новое поколение затем занимает место предыдущее, и цикл повторяется. Состав населения может сходиться к эволюционно стабильному состоянию, которое не может вторгнуться никакая мутантная стратегия.

Эволюционная теория охватывает дарвиновскую эволюцию, включая конкуренцию (игру), естественный отбор (динамика репликатора) и наследственность. Эволюционная теория игр внесла свой вклад в понимание группового отбора, полового отбора,альтруизма, родительской заботы, совместной эволюции и экологическая динамика. Многие противоречащие интуиции ситуации в этих областях были поставлены на прочную математическую основу благодаря использованию этих моделей.

Обычный способ изучения эволюционной динамики в играх - это уравнения репликатора. Они показывают скорость роста клеток, используя эту скорость передачи данных между ними. Уравнения непрерывного репликаторапредполагают бесконечное популяции, непрерывное время, полное смешивание и что стратегии порождают истинное. аттракторы (устойчивые точки) эквивалентны эволюционно устойчивым состояниям. Стратегия, способная пережить все «мутантные» стратегии, считается эволюционно стабильной. В контексте поведения животных это обычно означает, что такие стратегии запрограммированы и находятся под сильным регионом генетики, чтоделает стратегию любого игрока или через данные биологическими факторами.

Эволюционные игры - это математические объекты. с разными правилами, выплатами и математическим поведением. «Игра» представляет различные проблемы, с помощью которых используются системы, которые используются, и достижения, которые используются для достижения целей для создания и воспроизводства. Эволюционным играм часто дают красочные названия и прикрытия, которые описывают общую ситуацию в конкретной игре.Типичные игры включают ястреб-голубь, войну на истощение, охоту на оленя, продюсер-мошенник, трагедию общества и дилемма заключенного. Стратегии для этих игр, включая Hawk, Dove, Bourgeois, Prober, Defector, Assessor и Retaliator. Различные стратегии соревнуются по правилам игры, а математика используется для определения результатов и поведения.

Hawk Dove

Решение игры Hawk Dove для V = 2, C = 10 и стартовойбазы пригодности B = 4. Приспособленность Ястреба к разным смесям населения черной линией, а Голубь - красный. ESS (стационарная точка) будет существовать, когда пригодность Ястреба и Голубя одинакова: Ястребы составляют 20% населения, а Голуби - 80% населения.

Первая игра, которую проанализировал Мейнард Смит, - это игра классическая игра Hawk Dove. Он был задуман для анализа проблемы Лоренца и Тинбергена - состязания за общий ресурс. Участниками могут быть Ястребили Голубь. Это два подтипа или морфа одного вида с разными стратегиями. Ястреб сначала проявит агрессию, затем переходит в драку, пока не выиграет, либо не получит травму (проиграет). Голубь сначала проявляет агрессию, но, столкнувшись с серьезной эскалацией, бежит в целях безопасности. Если не столкнуться с такой эскалацией, Голубь попытается поделиться ресурсом.

Матрица выплат для игры Hawk Dove
встречает Hawkвстречает Dove
, если HawkV / 2 - C / 2V
если Голубь0V / 2

Учитывая, что ресурсу присвоено значение V, урон от проигрыша в бою оценивается стоимостью C:

  • Если Ястреб встречает Голубя, он получает полный ресурс V на сам
  • Если Ястреб встречает Ястреба - в случаях он выигрывает, в половину случаев он проигрывает... так что его средний результат равен V / 2 минус C / 2
  • Если Голубь встречает Ястреба, он отступает и ничего не получает - 0
  • Если Голубь встречает Голубя, одновременно делит ресурс и получает V /2

Однако фактическая выплата зависит от вероятности встречи с Ястребом или Голубем., что, в свою очередь, представляет собой процентное соотношение ястребов и голубей в популяции на момент конкретного соревнования. Это, в свою очередь, определяет результаты всех предыдущих конкурсов. Если цена проигрыша превышает ценность выигрыша V (нормальная ситуация в мире), математика завершается эволюционно устойчивой стратегией (ESS), смесью двух стратегий, в которой популяция Ястребов V /C. Популяция возвращается к точке равновесия, если какие какие -либо новые ястребы или голуби производят временное возмущение в популяции. Решение игры «Ястреб-голубьаний» объясняет, почему большинство соревнований с животными включает в себя только ритуальные боевые действия в соревнованиях, а не прямые сражения. Результат вовсе не зависит от хорошего поведения вида, как предполагает Лоренц, от действий так называемых эгоистичных генов.

Война на истощение

В игре«является Голубь-ястреб» ресурс общим, что дает выигрыши обоим Голубям, которые встречаются в парном соревновании. Если ресурс не подлежит совместному использованию, но может быть доступен альтернативный ресурс, если отступить и попробовать в другом месте, чистые стратегии Ястреба или Голубя менее эффективны. Если нераспределенный ресурс сочетается с высокой стоимостью проигрыша в состязании (травма или возможная смерть), выплаты Ястреба и Голубя еще больше уменьшаются. Тогда становитсяжизнеспособной более безопасная стратегия с более низкими затратами, блефом и ожиданием победы - стратегия блефа. Тогда игра становится одной из накапливаемых затрат, либо затрат на демонстрацию, либо затрат на длительное неразрешенное взаимодействие. По сути, это аукцион; Победитель - участник, проглотит большую цену, а проигравший получит ту же цену, но не получит ресурсов. Полученная в результате математическая теория эволюционной теории игр приводит к оптимальной стратегии синхронного блефа.

Война на истощение для различных значений ресурсов. Обратите внимание на время, необходимое для того, чтобы собрать 50% участников, чтобы выйти из соревнования, в сравнении с Ценностью (V) ресурса, за который идет борьба.

Это потому, что в войне на истощение любая стратегия, которая является непоколебимой и предсказуемой нестабильной, в итоге вытеснена мутантной стратегией, основанной на том факте, что она может превзойти предсказуемую стратегию, вложив дополнительную небольшуюдельту ресурса ожидания, чтобы устойчивость ее победы. Следовательно, только случайная и непредсказуемая стратегия может поддерживать себя в популяции блеферов. По сути, участники выбирают приемлемые затраты, которые будут понесены в зависимости от ценностей искомого ресурса, фактически случайную ставку как часть смешанной стратегии (стратегии, в которой участник имеет несколько или даже много стратегий действий в своей.). Это реализует ставки для ресурса с определенным размером V, где ставкадля конкретного конкурса выбирается случайным образом из этого распределения. Распределение (ESS) можно вычислить с помощью теоремы Бишопа-Каннингса, которая верна для любой ESS со смешанной стратегией. Функция распределения в этих соревнованиях была определена Паркером и Компсоном как:

p (x) = e - x / V V. {\ displaystyle p (x) = {\ frac {e ^ {- x / V}} {V }}.}{\ displaystyle p (x) = {\ frac {e ^ {- x / V}} {V}}.}

В совокупной совокупности бросивших курить для любых характеристик m в этой "смешанной стратегии" решение:

p (m) = 1 - e- m / V, {\ displaystyle p (m) = 1- e ^ {- m / V},}{\ displaystyle p (m) = 1-e ^ {- m / V},}

, как показано на соседнем графике. Подтверждено интуитивное ощущение, что более высокие значения искомых ресурсов приводят к увеличению времени ожидания. Это наблюдается в природе, например, у самцов навозных мух, соревнующихся за места для спаривания, где время разъединения предсказывается математической эволюционной теорией.

Асимметрии, которые позволяют новые стратегии

Навозная муха (Scatophaga stercoraria)) - игрокВойнына истощение Креветка-богомол, охраняющая свой дом с помощью Буржуазной стратегии Примеры стратегии животных: исследуя поведение Система может быть проверен

Вне на истощение не должно быть ничего, что сигнализировало о размере ставок оппоненту, иначе противник может использовать сигнал в эффективной контр-стратегии. Однако существует стратегия мутантов, которая может лучше блефовать в игре Война истощения, если существует подходящая асимметрия, стратегия Буржуа.Буржуаиспользует своего рода асимметрию, чтобы выйти из тупика. В природе одна из таких асимметрий - обладание ресурсом. Стратегия состоит в том, чтобы сыграть Ястребом, если он владеет ресурсом, но показать его, а затем отступить, если он не владеет. Это требует более высоких когнитивных способов, чем Ястреб, но Буржуазия, обычные во многих соревнованиях животных, например, в соревнованиях среди креветок-богомолов и пятнистых древесных бабочек.

Социальное поведение

Альтернативыдля теоретических игр социальное взаимодействие

Такие игры, как Hawk Dove и War of Attrition, представляют собой чистое соревнование между людьми и не имеют сопутствующих социальных элементов. В случае социального взаимодействия у конкурентов есть четыре альтернативы стратегическому взаимодействию. Это показано на рисунке рядом, где знак плюс представляет выгоду, а знак минус - стоимость.

  • В Кооперативных или взаимных отношений и «донор», и «получатель» почтинеотличимы,поскольку оба получают выгоду в игре, сотрудничая, т.е. пара находится в игровой ситуации, когда оба варианта действуют как функции, варианты, оба как из-за некоторых ограничений, которые фактически используют «в одной ситуации».
  • В альтруистических отношений донор, за счет собственных средств обеспечить получателю. В общем случае получатель будет иметь родственные отношения с дарителем, и пожертвование будет односторонним. Такой «альтруизм» возникает из«эгоистичных» стратегий
  • Злоба по сути «обратным» »« Форма альтруизма, при которой союзнику дает нанести его конкурентам.
  • Эгоизм является основным критерием любого стратегического выбора с точки зрения теории игр - стратегии, не вызывает самовыражение и самовоспроизведение, недолговечны для любой игры. важно, что на эту ситуацию влияет тот факт, что конкуренция имеет место на нескольких уровнях - то есть на генетическом, инд. ивидуальном и групповом уровне.

Конкуренцияэгоистичных генов

Самка суслики Белдинга рисковать своей, жизнью громко кричать тревогу, защищая близкородственных членов колонии женского пола; самцы младших родственников и не зовут.

На первый взгляд может показаться, что участвуют в различных играх участвующие люди, участвующие в каждой игре. Люди живут в одном игровом цикле, и вместо этого на протяжении этих игр многих поколений на самом деле конкурируют друг с другом с другом. Таким образом, в конечном итоге именно геныразыгрывают полнуюконкуренцию - эгоистичные гены стратегии. Конкурирующие гены присутствуют в человеке и в степени во всех его родственников. Иногда это может серьезно повлиять на то, какие стратегии выживают, особенно в сотрудничестве и отступничества. Уильям Гамильтон, известный теорией родственного отбора, исследовал многие из этих случаев, используя теоретико-игровые модели. Отношение родственников к игровым состязания помогает объяснить многие аспекты поведения социальных насекомых, альтруистическое поведение при взаимодействии родителей и потомков, поведение взаимной защиты и совместную заботу о потомстве. Для таких игр Гамильтон определил расширенную форму приспособления - инклюзивную приспособленность, которая включает в себя потомство человека, а также любые эквиваленты потомства, найденные в семье.

Математика отбора родственников
Концепция отбора родственников заключается в том, что:
совокупнаяприспособленность = собственнаявклад в приспособленность + вклад всех родственников.

Пригодность измеряется относительно средней совокупности; например, приспособленность = 1 означает рост со средней скоростью для популяции.

Инклюзивная пригодность индивидуума wi- это сумма его конкретной приспособленности самого себя aiплюс удельная приспособленность каждого и каждого родственника, взвешенная по степени родства, что соответствует суммированию из всех rj*bj.......где rj- родство определенногородственника, а bj- приспособленность этого конкретного родственника, что дает:

wi = ai + ∑ jrjbj. {\ displaystyle w_ {i} = a_ {i} + \ sum _ {j} r_ {j} b_ {j}.}w_ {i} = a_ {i} + \ sum _ {{j}} r_ {j} b_ {j}.

Теперь, если человек a i жертвует своей "собственной средней эквивалентной пригодностью 1 ", приняв стоимость пригодности C, а затем, чтобы" вернуть потерю ", w i все равно должно быть 1 (или больше 1)... и если мы используем R * B для представления суммирования,которое мы получаем:

1< (1-C)+RB....или перестановка..... R>C / B .

Гамильтон пошел дальше родственных связей, чтобы работать с Роберт Аксельрод, анализируя игры сотрудничества в условиях, не связанных с родственниками, где реципрокный альтруизм вступает в игру.

Эусоциальность и родственный отбор

Мясной муравей рабочие (всегда женского пола) связаны с родителем в 0,5 раза, сестрой в 0,75, ребенком в 0,5 и братом в 0,25 раза. Следовательно, гораздовыгоднее помочь произвести насвет сестру (0,75), чем иметь ребенка (0,5).

Эусоциальные насекомые-рабочие теряют репродуктивные права своей королевы. Было высказано предположение, что родственный отбор, основанный на генетическом составе этих рабочих, может предрасполагать их к альтруистическому поведению. Большинство эусоциальных сообществ насекомых имеют гаплодиплоид сексуальную детерминацию, что означает необычайно близкое родство рабочих.

Однако это объяснениеэусоциальности насекомых былооспорено несколькими весьма известными теоретиками эволюционных игр (новак и Уилсон), который опубликовал спорное альтернативные игры теоретического объяснения, основанное на последовательном развитие и выбор групп эффектов, предлагаемые для этих видов насекомых.

дилеммы заключенного

трудность теории эволюции, признанные Сам Дарвин был проблемой альтруизма. Если основа для отбора находится на индивидуальном уровне, вообще не имеетсмысла. Но универсальный отбор науровне группы (на благо вида, а не отдельного человека) проходит проверку математикой теории игр и, конечно, не является общим случаем в природе. Тем не менее, у многих социальных животных существует альтруистическое поведение. Решение этой парадокса может быть найдено в применении эволюционной теории игр к игре дилемма заключенного - игре, которая проверяет выгоды сотрудничества или отказа от сотрудничества. Это, безусловно, самая изученная игра вовсей теории игр.

Анализдилеммы заключенного представляет собой повторяющуюся игру. Это дает участникам возможность отомстить за дезертирство в предыдущих раундах игры. Многие стратегии были протестированы; лучшие конкурентные стратегии - это общее сотрудничество с сдержанной ответной реакцией. Самый известный и один из самых успешных из них - это око за око с общим алгоритмом.

def tit_for_tat (last_move_by_opponent): if last_move_by_opponent == defect: defect () else:cooperate ()

Выплата за любойотдельный раунд игры определяется матрицей выплат для одиночной игры (показано на гистограмме 1 ниже). В игрех с использованием конкретных раунде можно сделать различные варианты - «Сотрудничать» или «Дефект», что приведет к выплате определенного раунда. Однако именно возможные накопленные выигрыши за несколько раундов учитываются при формировании общих выигрышей для различных многоэтапных стратегий, как «око за око».

Выплаты в двух разновидностях игрыдилма заключенного.. Дилемма заключенного: сотрудничать или отступать?. Выплата (Искушение в отказе от сотрудничества)>Выплата (Взаимное сотрудничество)>Выплата (Совместное отступление)>Выплата (Присоска сотрудничает, но противник отступает)

Пример 1: Простая игра с дилеммой заключенного в один раунд. Классическая игра «дилемма заключенного» дает игроку максимальную выгоду, если он отступает, а его партнер сотрудничает (этот выбор известенкак искушение). Однако, если игроксотрудничает, а его партнер отказывается от него, он получает наихудший из возможных результатов (выплата бездельника). В этих условиях выигрыша лучший выбор (равновесие Нэша ) - отказаться.

Пример 2: повторяющаяся дилемма заключенного. Используемая стратегия - это око за око, которое изменяет поведение в зависимости от действий, предпринятых партнером в предыдущем раунде, то есть поощрять сотрудничество и наказывать отступничество. Эффектот этой стратегии в накопленнойвыплате за многие раунды состоит в том, чтобы обеспечить более высокий выигрыш за сотрудничество обоих игроков и меньший выигрыш за отступничество. Это устраняет искушение отступить. Выплата лохов также становится меньше, хотя «вторжение» в результате чистой стратегии отступничества не устраняется полностью.

Пути к альтруизму

Альтруизм имеет место, когда один индивид ценой С для себя применяет стратегию, которая приносит пользу В другомучеловеку. Цена может состоять из потериспособности или ресурса, который помогает в борьбе за выживание и воспроизводство, или дополнительного риска для собственного выживания. Стратегии альтруизма могут возникнуть через:

ТипПрименимо к:СитуацияМатематический эффект
Выбор родства - (включая пригодность связанных участников)Родственники - генетически связанные лицаУчастники эволюционной игры - гены стратегии. Лучшеевознаграждение для человека не обязательно являетсялучшим вознаграждением для гена. В любом поколении ген игрока не только у одного человека, он находится в родственной группе. Самый высокий результат в фитнесе для Kin Group выбирается естественным отбором. Следовательно, стратегии, включающие самопожертвование со стороны отдельных лиц, часто оказываются в выигрыше - это эволюционно стабильная стратегия. Животные должны жить в родственной группе во время части игры, чтобы когда-либо имеламесто возможность для этого альтруистическогожертвоприношения.Игры должны учитывать инклюзивный фитнес. Функция приспособленности - это совокупная приспособленность группы связанных участников, каждый из которых взвешен по степени родства, относительно общей генетической популяции. Математический анализ этого геноцентрического взгляда на игру приводит к правилу Гамильтона, согласно которому родство альтруистического донора должно превышать соотношение затрат и выгод самогоальтруистического акта:
R>c / b R - родство,c стоимость, b выгода
Прямая взаимностьУчастники, которые торгуют услугами в парных отношенияхТеоретическое воплощение игры «Я почешу вам спину, если вы поцарапаете мою». Пара людей обменивается услугами в игре, состоящей из нескольких раундов. Люди узнаваемы друг для друга как партнеры. Термин «прямой» применяется, потому что ответная услуга возвращается только партнеру в паре.Характеристики игры снесколькими раундами создают опасность отказа и потенциальноменьшие выгоды от сотрудничества в каждом раунде, но любое такое отступничество может привести к наказанию в следующем раунде - превращение игры в повторную дилемму заключенного. Таким образом, на первый план выходит семейство стратегий «око за око».
Косвенная взаимностьСвязанные или не связанные участники обмениваются услугами, но без партнерства. Ответная услуга «подразумевается», но без конкретного идентифицированногоисточника, кто ее должен оказать.Такое поведениесродни «Я почешу вам спину, вы почешите кому-то спину, другой кто-то другой поцарапает мою. (наверное)". Ответная услуга не исходит от какого-либо конкретного установленного партнера. Потенциал косвенной взаимности существует для конкретного организма, если он живет в группе людей, которые могут взаимодействовать в течение длительного периода времени.

Утверждалось, что человеческое поведение при установлении моральной системы, атакже расходование значительной энергии в человеческомобществе на отслеживание личной репутации является прямым следствием зависимости общества от стратегий непрямого взаимного реагирования.

Игра очень уязвима. к дезертирству, так как прямое возмездие невозможно. Следовательно, косвенная взаимность не сработает без учета социального рейтинга - меры прошлого сотрудничества. Математика приводит к модифицированной версии правила Гамильтона, где:
q>c / b, где q (вероятность знаниясоциальной оценки) должна быть больше, чем соотношениезатрат и выгод

Организмы, использующие социальную оценку называются Дискриминаторами и требуют б олее высокого уровня познания, чем стратегии простой прямой взаимности. Как сказал биолог-эволюционист Дэвид Хейг: «Для прямой взаимности нужно лицо; для косвенной взаимности нужно имя».

Эволюционно устойчивая стратегия

Матрица выплат для игры «Ястреб-голубь» с добавлением Стратегии оценщика. Он «изучает своего противника», ведясебя как Ястреб, когда сравнивается с противником, оноценивает «слабее», как Голубь, когда противник кажется больше и сильнее. Assessor - это ESS, поскольку он может вторгаться в популяции как Hawk, так и Dove, и может противостоять вторжению мутантов Hawk или Dove.

эволюционно стабильная стратегия (ESS) сродни равновесию по Нэшу. в классической теории игр, но с математически расширенными критериями. Равновесие Нэша - это игровое равновесие, при котором ни один игрок неможет отклоняться от своей нынешней стратегии приусловии, что другие придерживаются своих стратегий. ESS - это состояние игровой динамики, при котором в очень большой популяции конкурентов другая мутантная стратегия не может успешно войти в популяцию, чтобы нарушить существующую динамику (которая сама зависит от состава популяции). Следовательно, успешная стратегия (с ESS) должна быть как эффективной против конкурентов, когда это редко - войти в предыдущую конкурирующую популяцию, так иуспешной, когда позже будет большая доля в популяции -для защиты. Это, в свою очередь, означает, что стратегия должна быть успешной, когда она соперничает с другими, точно такими же, как она сама.

ESS не является:

  • оптимальной стратегией: которая максимизирует Фитнес, а многие состояния ESS намного ниже максимальная физическая форма, достижимая в сфере фитнеса. (в качестве примера см. график Ястреба Голубя выше)
  • Особое решение: часто в конкурентной ситуации можетсуществовать несколько условий ESS. Конкретное соревнованиеможет стабилизироваться в любой из этих возможностей, но позже серьезное возмущение условий может переместить решение в одно из альтернативных состояний ESS.
  • Всегда присутствует: возможно, что ESS не будет. Эволюционная игра без ESS - это Rock-Scissors-Paper, которая встречается у таких видов, как ящерица с боковыми пятнами (Uta stansburiana ).
  • Непревзойденная стратегия: ESS - это всего лишь непреодолимая стратегия.
Женская воронка пауки (Agelenopsis aperta) соревнуютсядруг с другом за обладание своей паутиной в пустыне, используя стратегию Assessor.

Состояние ESS можно решить, исследуя либо динамику изменения популяции для определения ESS, либо решая уравнения для стабильных стационарных точечных условий, которые определяют ESS. Например, в игре «Ястреб-голубь» мы можем проверить, существует ли статическое состояние смешанного популяции, при котором приспособленность Голубей будет точно такойже, как приспособленность Ястребов (следовательно, оба имеют WDove= V / 2 · (1-p)

Приравнивание двух приспособлений, Hawk и Dove

V · (1-p) + ( V / 2-C / 2) · p= V / 2 · (1-p)

... и решение для p

p= V / C

, поэтому для этого "static точка », где процент популяции является ESS, принимает значение ESS (процент Hawk) = V / C

Аналогично, используя неравенства, можно показать, что дополнительный мутант Hawk или Dove, входящий в это состояние ESS в конечном итоге приводит к меньшей пригодности для их вида – both a true Nash and an ESS equilibrium. This example showsthat when the risks of contest injury or death (the Cost C) is significantly greater than the potential reward (the benefit value V), the stable population will be mixed between aggressors and doves, and the proportion of doves will exceed that of the aggressors. This explains behaviours observed in nature.

Unstable games, cyclic patterns

Rock paper scissors

Rock Paper Scissors Mutant Invasion for Rock PaperМатрица выплат «ножницы» - бесконечный цикл Компьютерное моделирование игры «Каменные ножницы». Отображается связанная матрица выигрыша в игре RPS. Начиная с произвольной популяции, процентное соотношение трех морфов выстраивается в непрерывно меняющуюся модель.

Каменные ножницы, используемые в эволюционной игре, использовались для моделирования естественных процессов при изучении экологии. Используя методы экспериментальной экономики, ученые использовали игру RPS t o тестировать динамическое социальное эволюционное поведение человека в лаборатории. Социальное циклическое поведение, предсказанное эволюционной теорией игр, наблюдалось в различных лабораторных экспериментах.

Ящерица с боковыми пятнами играет в RPS и другие циклические игры...

Первый пример RPS в природе было замечено в поведении и окраске горла маленькой ящерицы из западной части Северной Америки. ящерица с пятнами сбоку (Uta stansburiana) полиморфна с тремя морфами цвета горла. каждый из них преследует свою стратегию спаривания

ящерица с боковыми пятнами эффективно использует стратегию спаривания камень-ножницы-бумага.
1) Оранжевое горло очень агрессивно и действует на большой территории - попытка спаривания с многочисленными самками на этой большей территории
2) Неагрессивное желтое горло имитирует отметины и поведение самок ящериц и «украдкой» проскальзывает на территорию оранжевого горла, чтобы спариваться с находящимися там самками (тем самым захват населения ion), and
3) The blue throat mates with and carefullyguards one female – making it impossible чтобы кроссовки преуспели и, следовательно, заняли свое место в популяции…

Однако синие горла не могут преодолеть более агрессивные оранжевые горла. Более поздние исследования показали, что синие мужчины альтруистичны по отношению к другим синим мужчинам с тремя ключевыми чертами: 1) они сигнализируют синим цветом, 2) они узнают и поселяются рядом с другими (неродственными) синимимужчинами, и 3) они даже будут защищать свои партнер противоранжевого, до смерти. Это отличительная черта другой игры сотрудничества, которая включает эффект зеленой бороды.

Самки одной популяции имеют одинаковый цвет горла, и это влияет на то, сколько потомков они производят, и на размер потомства, которое генерирует циклы плотности, еще одна игра - игра rK. Здесь r - мальтузианский параметр, определяющий экспоненциальный рост, а K - емкость популяции. Самки оранжевого окраса имеютбольшие кладки и меньшее потомство и хорошо себя чувствуют принизкой плотности. Желтые самки (и синие) имеют меньшие кладки и более крупное потомство и чувствуют себя лучше, когда популяция превышает вместимость, а популяция сокращается до низкой плотности. Оранжевый затем вступает во владение, и это порождает вечные циклы оранжевого и желтого, тесно связанные с плотностью населения. Идея циклов из-за регуляции плотности двух стратегий возникла у Денниса Читти, которые работали надгрызунами, поэтому такие игры приводят к «Читти Циклс». Естьигры внутри игр внутри игр, встроенных в естественные популяции. Они управляют циклами RPS у мужчин с периодичностью 4 года и циклами r-K у женщин с периодичностью 2 года.

Общая ситуация соответствует игре «Камень, ножницы, бумага», создающей четырехлетний цикл популяции. Игра RPS с самцами ящериц с боковыми пятнами не имеет ESS, но имеет равновесие по Нэшу (NE) с бесконечными орбитами вокруг аттрактора NE. С тоговремени у ящериц было обнаружено много других трехполиморфизмов стратегий, и некоторые из них имеют динамику RPS, объединяющую игру самцов и игру регуляции плотности у одного пола (самцов). RPS у самцов и игру r-K у самок, с полиморфизмом цвета шерсти и поведением, определяющим циклы. Эта игра также связана с эволюцией ухода за самцами грызунов и моногамии, а также с развитием видообразования. Деннис Читти был прав, существуют игры-стратегии, связанные с циклами популяции грызунов (ициклами ящериц).

Когда он прочитал, чтоэти ящерицы, по сути, были вовлечены в со структурой «камень-ножницы-бумага», Джон Мейнард Смит, как говорят, воскликнул: «Они прочитали мою книгу!».

Сигнализация, половой отбор и принципы инвалидности

Павлиний хвост может быть примером принципа инвалидности в действии.

Помимо сложности объяснения того, как существует альтруизм в развитые организмы, Дарвина также беспокоила вторая загадка - почему у значительного числавидов есть фенотипические признаки, явно которыеневыгодны им с точки зрения их выживания - и должны быть отобраны путем естественного разделения - например, массивная неудобная структура перьев в хвосте павлина? По этому поводу Дарвин написал своему коллеге: «Когда я смотрю на перо в хвосте павлина, меня тошнит». Это не только объяснение существования альтруизма, но и объясняет совершенно нелогичное существование павлиньего хвоста и других биологических препятствий.

С точки зрениязрения анализа, проблемы биологической жизни ничемне отличаются от проблем, которые определяют экономику - поедание (сродни приобретение ресурсов и управление ими), выживанию (конкурентная стратегия) и воспроизводству (инвестиции, риск и доход). Теория игр изначально задумывалась как математический анализ экономических процессов, поэтому она оказалась столь полезной для объяснения многих видов биологического поведения. Еще одно важное усовершенствование модели эволюционной теории игр, основанона анализе затрат. Простая модель костюмапредполагает, что все участники несут одинаковый штраф, связанный с затратами на игру, но это не так. Более успешные игроки будут наделены или накоплен более высокий «резерв» или «доступность», чем менее успешные игроки. Этот эффект богатства в эволюционной теории игр представлен математически как «потенциал удержания ресурсов (RHP)» и показывает, что эффективные затраты для конкурента с более высоким RHP не так велики, как для конкурента сболее низким RHP. Система RHP должна бытьпредоставлена ​​таким образом, чтобы система RHP могла сигнализировать о конкурирующих соперниках, и того, чтобы это сработало, эта сигнализация должна быть сделана. честно. Амоц Захави развил это мышление в так называемом принципе гандикапа, когда превосходящие конкуренты демонстрируют свое превосходство дорогостоящей демонстрацией. Эта сигнализация по своей сути является честной и воспринимается приемником сигнала как таковая.Нигде в природе это лучше непроиллюстрировано, чем великолепное и дорогое оперение павлина. Математическое доказательство принципа гандикапа было разработано Аланом Графеном с использованием эволюционного теоретико-игрового моделирования.

Коэволюция

До сих пор в этой статье обсуждаются два типа динамики:

  • Эволюционные игры, которые приводят к стабильной ситуации или точке застоя для конкурирующих стратегий, которые приводят к эволюционно стабильнойстратегии
  • Эволюционныеигры, демонстрирующие циклическое поведение (как в игре с RPS), где пропорции конкурирующих стратегий постоянно меняются во времени в пределах всей популяции
Конкурентная кооперация - грубокожий тритон (Tarricha granulosa) очень токсичен из-за эволюционной гонки вооружений с хищником, обыкновенная подвязочная змея (Thamnophis sirtalis), которая, в свою очередь, очень терпима к яду. Эти двое вовлечены в гонку вооружений Красная Королева. Мутуалистическая коэволюция - орхидея Дарвина (Angraecum sesquipedale) и мотылек сфинкс Моргана (Xanthopan morgani) имеют взаимные отношения, когда бабочка получает пыльцу, а цветок опыляется.

Третья, коэволюционная динамика сочетает внутривидовую и межвидовую конкуренцию. Примеры включают конкуренцию хищник-жертва и коэволюцию паразита-хозяина, а также мутуализм. Созданы эволюционные игровые модели для парных и многовидовыхкоэволюционных систем. Общаядинамика различается между конкурентными системами и мутуалистическими системами.

В конкурентной (не мутуалистической) межвидовой коэционной системе видов вовлеченности в гонку вооружений - при которой адаптируются, которые лучше конкурируют с другими видами, как правило, сохраняются. Это отражают как игровые выплаты, так и динамика репликатора. Это приводит к динамике Красной Королевы, где главные герои «бежать так быстро, как они могутоставаться на одном месте».

Был разработан ряд эволюционной теории теории охвата, охватывающих коэволюционные ситуации. Ключевым фактором, применимым в этих коэволюционных системах, является постоянная адаптация стратегии в такой гонке вооружений. Поэтому коэволюционное моделирование часто включает генетические алгоритмы для отражения мутационных эффектов, в то время как компьютеры моделируют динамику общей коэволюционной игры. Полученная динамика изучается при измененииразличных параметров. Используетсяодновременно несколько вариантов, решений становится прерогативой многопараметрической оптимизации. Математическими критериями стабильных точек являются эффективность Парето и преобладание Парето, мера пиков оптимальности решения в многомерных системах.

Карл Бергстром и Майкл Лахманн применяют эволюционную теорию игр к разделению выгод в мутуалистических взаимодействиях между организмми. Дарвиновские предположения оприспособленности смоделированы с использованиемдинамики репликатора, чтобы показать, что стимулируется более медленным темпами в мутуалистических отношениях, получается непропорционально высокая доля выгод и выгод.

Расширение модели

A математическая модель Изначально анализ поведения системы должен быть как можно более простым, чтобы помочь в разработке базового понимания основ или «эффекты первого порядка», относящихся к тому, что изучается. Имея это понимание, уместнопосмотреть, более тонкие параметры (эффекты второгопорядка) на первичное поведение или формируются ли оно дополнительное поведение в системе. После основополагающей работы Мейнарда Смита в области эволюционной теории игр у этого предмета был ряд очень важных расширений, которые пролили больше света на понимание эволюционной динамики, особенно в области альтруистического поведения. Вот некоторые из этих ключевых расширений эволюционной теории игр:

Пространственная игра . Впространственной эволюционной игре участники встречаются всоревнованиях в фиксированных позициях сетки и взаимодействуют только с ближайшими соседями. Здесь метод соревнования Ястребиного Голубя, показаны участники Ястреба и Голубя, а также стратегии, происходящие в различных ячейках

Пространственные игры

Географические факторы эволюции включают поток генов и горизонтальный перенос генов. Пространственные игровые модели представляют геометрию, помещаяучастников в решетку ячеек: соревнования только с непосредственнымисоседями. Стратегии выигрыша захватывают эти непосредственные окрестности, а взаимодействуют с соседними районами. Эта модель полезна для демонстрации того, как группы кооператоров могут вторгаться и внедрять альтруизм в «Дилемма заключенных», где «Око за око» (TFT) - это равновесие по Нэшу, но НЕ также и ESS. Пространственная структура иногда абстрагируется до общей сети взаимодействий. Это основа теории эволюционныхграфов.

Эффекты обладания информацией

В эволюционной теорииигр, как и в традиционной теории игр, эффект сигнализации (получение информации) выражается критически важны, как в «Косвенной взаимности в дилемме заключенных» (где соревнования между ОДИНАКОВЫМИ парными людьми НЕ повторяются). Это моделирует распространение различных нормальных социальных взаимодействий, не связанных с родственниками. Если в «Дилемме заключенного» не возможна вероятностная мера репутации,возможна только прямая взаимность. Эта информация также поддерживает косвеннуювзаимность.

В качестве альтернативы, агенты могут иметь доступ к произвольному сигналу, изначально не коррелированному со стратегией, но коррелированному из-зационной динамики. Это эффект зеленой бороды (см. Ящерицы с боковыми пятнами выше) или эволюция этноцентризма у людей. В зависимости от игры, это может вызвать эволюцию либо сотрудничество, либо иррациональной враждебности.

Отмолекулярного до многоклеточного уровня, модель сигнальной игры может бытьподходящей, с асимметричной информацией между отправителем и получателем, например, привлечение партнера или эволюция механизма трансляции из строк РНК.

Конечные популяции

Многие эволюционные игры были смоделированы на конечных популяциях, чтобы увидеть, какой эффект это может иметь, например, в успехе смешанных стратегий.

См. Также

Примечания

Ссылки

Дополнительная литература

  • Дэвис, Мортон,; «Теория игр - нетехническое введение», Dover Books, ISBN 0-486-29672-5
  • Докинз, Ричард ; «Эгоистичный ген», Oxford University Press, ISBN 0-19-929114-4
  • Дугаткин и Рив; «Теория игр и поведение животных», Oxford University Press, ISBN 0-19-513790-6
  • Хофбауэр и Зигмунд; «Эволюционные игры и динамика населения», Cam bridge University Press, ISBN 0-521-62570-X
  • Кон, Марек; «Причина всего», Faber and Faber, ISBN 0-571-22393-1
  • Сандхольм, Уильям Х.; «Популяционные игры и эволюционная динамика», MIT Press, ISBN 0262195879
  • Сегерстрале, Уллика; «Оракул природы - жизнь и творчество У. Д. Гамильтона », Oxford University Press, 2013, ISBN 978-0-19-860727-4
  • Зигмунд, Карл ; "Игры жизни", издательство Penguin Books, такжеOxford University Press, 1993, ISBN 0198547838
  • Винсент и Браун; «Эволюционная теория игр, естественный отбор и дарвиновская динамика», Cambridge University Press, ISBN 0-521-84170-4

Внешние ссылки

Викицитатник содержит цитаты, связанные с : Эволюционная теория игр
Последняя правка сделана 2021-05-19 09:16:57
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте