Парадокс Паррондо

редактировать

Парадокс паррондо, парадокс в теории игр, был описан как: Комбинация проигрышных стратегий становится выигрышной стратегией. Он назван в честь его создателя Хуана Паррондо, который обнаружил парадокс в 1996 году. Более подробное описание:

Существуют пары игр, каждая с большей вероятностью проигрыша, чем выигрыша, для которых можно построить выигрышную стратегию, играя в игры поочередно.

Паррондо придумал парадокс в связи с его анализом броуновского храповика, мысленного эксперимента с машиной, которая якобы может извлекать энергию из случайных тепловых движений, популяризированных физиком Ричардом Фейнманом. Однако при тщательном анализе парадокс исчезает. Стратегии выигрыша, состоящие из различных комбинаций стратегий проигрыша, изучались в биологии до того, как был опубликован парадокс Паррондо. Совсем недавно проблемы эволюционной биологии и экологии были смоделированы и объяснены в терминах парадокса.

СОДЕРЖАНИЕ

  • 1 Наглядные примеры
    • 1.1 Пример пилы
    • 1.2 Пример подбрасывания монеты
      • 1.2.1 Разрешение парадокса
    • 1.3 Упрощенный пример
  • 2 Приложения
  • 3 Имя
  • 4 См. Также
  • 5 ссылки
  • 6 Дальнейшее чтение
  • 7 Внешние ссылки

Наглядные примеры

Пример с пилой

Рисунок 1

Рассмотрим пример, в котором есть две точки A и B, имеющие одинаковую высоту, как показано на рисунке 1. В первом случае у нас есть плоский профиль, соединяющий их. Здесь, если мы оставим в середине несколько круглых шариков, которые перемещаются назад и вперед случайным образом, они будут катиться случайным образом, но в оба конца с равной вероятностью. Теперь рассмотрим второй случай, когда между ними есть зубчатая область. Здесь также шарики будут катиться к обоим концам с равной вероятностью (если бы существовала тенденция к перемещению в одном направлении, шарики в кольце такой формы имели бы тенденцию самопроизвольно выделять тепловую энергию для вращения, нарушая второй закон термодинамики). Теперь, если мы наклонить весь профиль в направлении вправо, как показано на рисунке 2, то вполне очевидно, что оба эти дела станут смещена в сторону B.

Теперь рассмотрим игру, в которой мы чередуем два профиля, разумно выбирая время между переходом от одного профиля к другому.

фигура 2

Когда мы уезжаем несколько шариков на первый профиль в точке Е, они распределяются на плоскости, показывая преимущественные движения в направлении точки B. Однако, если мы применим второй профиль, когда некоторые из шариков пересекли точку C, но ни один не пересек точку D, у нас будет больше всего шариков в точке E (откуда мы начали изначально), но некоторые также в долине. по направлению к точке А, если у шариков достаточно времени, чтобы катиться в долину. Затем мы снова применяем первый профиль и повторяем шаги (точки C, D и E теперь сдвинуты на один шаг, чтобы обозначить последнюю долину, ближайшую к A). Если ни один шарик не пересечет точку C до того, как первый шарик пересечет точку D, мы должны применить второй профиль незадолго до того, как первый шарик пересечет точку D, чтобы начать заново.

Отсюда легко следует, что в конечном итоге мы будем иметь шарики в точке А, но ни в точке B. Следовательно, если мы определяем наличие шариков в точке A как победу и наличие шариков в точке B как проигрыш, мы однозначно выигрываем, чередуя (в правильно выбранное время) между двумя проигрышными играми.

Пример подбрасывания монеты

Второй пример парадокса Паррондо взят из области азартных игр. Рассмотрите возможность сыграть в две игры, игру A и игру B, по следующим правилам. Для удобства определим, что это наша столица в момент времени t, непосредственно перед игрой. C т {\ displaystyle C_ {t}}

  1. Победа в игре приносит нам 1 доллар, а проигрыш требует от нас отдать 1 доллар. Отсюда следует, что если мы выиграем на шаге t и проиграем на шаге t. C т + 1 знак равно C т + 1 {\ Displaystyle C_ {t + 1} = C_ {t} +1} C т + 1 знак равно C т - 1 {\ displaystyle C_ {t + 1} = C_ {t} -1}
  2. В игре A мы подбрасываем монету с ошибкой, Coin 1, с вероятностью выигрыша. Если это явно проигрышная игра в долгосрочной перспективе. п 1 знак равно ( 1 / 2 ) - ϵ {\ Displaystyle P_ {1} = (1/2) - \ epsilon} ϵ gt; 0 {\ displaystyle \ epsilongt; 0}
  3. В игре B мы сначала определяем, кратна ли наша столица некоторому целому числу. Если это так, мы подбрасываем предвзятую монету, Coin 2, с вероятностью выигрыша. Если это не так, мы подбрасываем другую предвзятую монету, Coin 3, с вероятностью выигрыша. Роль модуля обеспечивает периодичность, как в храповых зубах. M {\ displaystyle M} п 2 знак равно ( 1 / 10 ) - ϵ {\ Displaystyle P_ {2} = (1/10) - \ epsilon} п 3 знак равно ( 3 / 4 ) - ϵ {\ Displaystyle P_ {3} = (3/4) - \ epsilon} M {\ displaystyle M}

Понятно, что, играя в игру А, мы почти наверняка проиграем в долгосрочной перспективе. Хармер и Эбботт демонстрируют с помощью моделирования, что если и игра B - тоже почти наверняка проигрышная игра. Фактически, игра B - это цепь Маркова, и анализ ее матрицы перехода состояний (опять же с M = 3) показывает, что вероятность устойчивого состояния использования монеты 2 составляет 0,3836, а вероятность использования монеты 3 - 0,6164. Поскольку монета 2 выбирается почти в 40% случаев, она оказывает непропорционально большое влияние на выигрыш в игре B и приводит к тому, что игра является проигрышной. M знак равно 3 {\ displaystyle M = 3} ϵ знак равно 0,005 , {\ displaystyle \ epsilon = 0,005,}

Однако, когда эти две проигрышные игры разыгрываются в некоторой чередующейся последовательности - например, две игры из A, за которыми следуют две игры из B (AABBAABB...), комбинация этих двух игр, как это ни парадоксально, является выигрышной игрой. Не все чередующиеся последовательности A и B приводят к выигрышным играм. Например, одна игра в A, за которой следует одна игра в B (ABABAB...), является проигрышной, а одна игра в A, за которой следуют две игры в B (ABBABB...), является выигрышной. Этот пример с подбрасыванием монеты стал канонической иллюстрацией парадокса Паррондо - две игры, каждая из которых проигрывает, когда играют индивидуально, становятся выигрышной игрой, когда играют в определенной чередующейся последовательности.

Разрешение парадокса

Кажущийся парадокс был объяснен с использованием ряда сложных подходов, включая цепи Маркова, трещотки, моделирование отжига и теорию информации. Один из способов объяснить очевидный парадокс состоит в следующем:

  • Хотя игра B является проигрышной игрой согласно распределению вероятностей, которое получается по модулю, когда в нее играют индивидуально ( по модулю - это остаток при делении на), она может быть выигрышной игрой при других распределениях, поскольку есть по крайней мере одно состояние, в котором его ожидание положительное. C т {\ displaystyle C_ {t}} M {\ displaystyle M} C т {\ displaystyle C_ {t}} M {\ displaystyle M} C т {\ displaystyle C_ {t}} M {\ displaystyle M}
  • Поскольку распределение результатов игры B зависит от капитала игрока, две игры не могут быть независимыми. Если бы это было так, то игра с ними в любой последовательности тоже проиграла бы.

Роль сейчас становится в центре внимания. Он служит исключительно для того, чтобы вызвать зависимость между играми A и B, так что игрок с большей вероятностью войдет в состояния, в которых игра B имеет положительное ожидание, позволяя ему преодолеть потери от игры A. При таком понимании парадокс разрешается сам собой.: Отдельные игры проигрывают только при распределении, которое отличается от того, которое фактически встречается при игре в составную игру. Таким образом, парадокс Паррондо является примером того, как зависимость может нанести ущерб вероятностным вычислениям, сделанным при наивном предположении о независимости. Более подробное изложение этого момента вместе с несколькими связанными примерами можно найти у Филипса и Фельдмана. M {\ displaystyle M}

Упрощенный пример

Для более простого примера того, как и почему работает парадокс, снова рассмотрим две игры Game A и Game B, на этот раз со следующими правилами:

  1. В игре A вы просто теряете 1 доллар каждый раз, когда играете.
  2. В игре B вы подсчитываете, сколько денег у вас осталось ⁠ ⁠ - если это четное число, вы выигрываете 3 доллара, в противном случае вы теряете 5 долларов.

Допустим, вы начинаете со 100 долларами в кармане. Если вы начнете играть исключительно в Игру А, вы, очевидно, потеряете все свои деньги за 100 раундов. Точно так же, если вы решите играть исключительно в Игру Б, вы также потеряете все свои деньги за 100 раундов.

Однако рассмотрите возможность альтернативной игры, начиная с игры B, затем с игры A, затем игры B и так далее (БАБАБА...). Должно быть легко увидеть, что вы будете стабильно зарабатывать в общей сложности 2 доллара за каждые две игры.

Таким образом, даже несмотря на то, что каждая игра является проигрышной, если играть в одиночку, поскольку на результаты игры B влияет игра A, последовательность, в которой проводятся игры, может влиять на то, как часто игра B приносит вам деньги, и, следовательно, результат будет другим. от случая, когда любая игра ведется сама по себе.

Приложения

Парадокс Паррондо широко используется в теории игр, и его применение к инженерным наукам, динамике населения, финансовым рискам и т. Д. Является областью активных исследований. Игры Паррондо имеют мало практического применения, например, для инвестирования в фондовые рынки, поскольку исходные игры требуют, чтобы выплата по крайней мере в одной из взаимодействующих игр зависела от капитала игрока. Однако нет необходимости ограничивать игры их первоначальной формой, и работа над обобщением этого явления продолжается. Было указано на сходство с накачкой волатильности и проблемой двух конвертов. Простые модели доходности ценных бумаг из учебников по финансам использовались для доказательства того, что отдельные инвестиции с отрицательной средней долгосрочной доходностью можно легко объединить в диверсифицированные портфели с положительной медианной долгосрочной доходностью. Точно так же модель, которая часто используется для иллюстрации оптимальных правил ставок, использовалась для доказательства того, что разделение ставок между несколькими играми может превратить отрицательную медианную долгосрочную прибыль в положительную. В эволюционной биологии как случайные фазовые вариации бактерий, так и эволюция менее точных датчиков были смоделированы и объяснены в терминах парадокса. В экологии периодическое чередование определенных организмов между кочевым и колониальным поведением было предложено как проявление парадокса. Как следствие парадокса, было обнаружено интересное приложение в моделировании выживания многоклеточных организмов, и некоторые интересные дискуссии о его осуществимости. Приложения парадокса Паррондо также можно найти в теории надежности. Заинтересованные читатели могут обратиться к трем обзорным статьям, опубликованным за эти годы, в последней из которых рассматривается эффект Паррондо в биологии.

Имя

В ранней литературе о парадоксе Паррондо обсуждалось, является ли слово «парадокс» подходящим описанием, учитывая, что эффект Паррондо можно понять в математических терминах. «Парадоксальный» эффект можно математически объяснить в терминах выпуклой линейной комбинации.

Однако Дерек Эбботт, ведущий исследователь в этой области, дает следующий ответ относительно использования слова «парадокс» в этом контексте:

Действительно ли парадокс Паррондо «парадокс»? Этот вопрос иногда задают математики, тогда как физиков такие вещи обычно не волнуют. Первое, на что следует обратить внимание, это то, что «парадокс Паррондо» - это просто название, точно так же, как « парадокс Брэсса » или « парадокс Симпсона». Во-вторых, как и в случае с большинством названных парадоксов, все они действительно кажущиеся парадоксами. В этих случаях люди опускают слово «очевидный», потому что оно звучит нелепо, и в любом случае оно очевидно. Так что никто не утверждает, что это парадоксы в строгом смысле слова. В широком смысле парадокс - это просто нечто противоречащее интуиции. Игры Паррондо, безусловно, противоречат здравому смыслу - по крайней мере, до тех пор, пока вы не изучите их внимательно в течение нескольких месяцев. По правде говоря, мы все еще продолжаем находить новые удивительные вещи, которые радуют нас, исследуя эти игры. У меня был один математик, который жаловался, что игры всегда были ему очевидны, и поэтому нам не следует использовать слово «парадокс». Он либо гений, либо вообще никогда этого не понимал. В любом случае с такими людьми спорить не стоит.

Смотрите также

использованная литература

дальнейшее чтение

внешние ссылки

Последняя правка сделана 2023-04-05 07:17:19
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте