Цена анархии (PoA ) - это концепция в экономика и теория игр, которая измеряет, как эффективность системы ухудшается из-за эгоистичного поведения ее агентов. Это общее понятие, которое может быть распространено на различные системы и понятия эффективности. Например, рассмотрим систему передвижения по городу и множество агентов, пытающихся перейти из некоторого исходного места в пункт назначения. Под эффективностью в данном случае будем понимать среднее время, за которое агент достигает пункта назначения. В «централизованном» решении центральный орган может указывать каждому агенту, какой путь выбрать, чтобы минимизировать среднее время в пути. В «децентрализованной» версии каждый агент выбирает свой собственный путь. Цена анархии измеряет соотношение между средним временем в пути в двух случаях.
Обычно система моделируется как игра, а эффективность является некоторой функцией результатов (например, максимальная задержка в сети, перегрузка в транспортной системе, социальное обеспечение на аукционе,...). Для моделирования эгоистичного поведения агентов могут использоваться различные концепции равновесия, среди которых наиболее распространенным является равновесие по Нэшу. Различные разновидности равновесия по Нэшу приводят к вариациям понятия цены анархии как чистой цены анархии (для детерминированных равновесий), смешанной цены анархии (для рандомизированных равновесий) и Цена анархии Байеса – Нэша (для игр с неполной информацией). Концепции решения, отличные от равновесия по Нэшу, приводят к таким вариациям, как Цена гибели .
Термин Цена анархии впервые был использован Элиасом Кутсупиасом и Христосом Пападимитриу, но идея измерения неэффективности равновесия старше. Концепция в ее нынешней форме была разработана как аналог «коэффициента приближения» в алгоритме аппроксимации или «коэффициента конкуренции» в онлайн-алгоритме. Это в контексте современной тенденции анализа игр с использованием алгоритмических линз (алгоритмическая теория игр ).
Рассмотрим игру , определяемый набором игроков , наборы стратегий для каждого плеер и утилиты (где также называется набором результатов). Мы можем определить меру эффективности каждого результата, которую мы называем функцией благосостояния . Естественные кандидаты включают в себя сумму полезностей игроков (утилитарная цель) минимальная полезность (справедливость или эгалитарная цель) ... или любая функция, которая имеет значение для конкретной анализируемой игры и желательно максимизировать.
Мы можем определить подмножество как набор стратегий в равновесии (например, набор из Равновесие по Нэшу ). Затем цена анархии определяется как соотношение между «наихудшим равновесием» и оптимальным «централизованным» решением:
Если вместо 'благосостояния', которое мы хотим «максимизировать», функция измерения эффективности - это «функция затрат» , которую мы хотим «минимизировать» (например, задержку в сети) мы используем (следуя соглашению в алгоритмах аппроксимации):
Связанное с этим понятие - понятие Цена стабильности (PoS ), который измеряет соотношение между «наилучшим равновесием» и оптимальным «централизованным» решением:
или в случае функций стоимости:
Мы знаем, что по определению. Ожидается, что потеря эффективности из-за ограничений теории игр находится где-то между PoS и PoA.
И PoS, и PoA были рассчитаны для различных типов игр. Некоторые примеры представлены ниже.
Рассмотрим игру 2x2 под названием дилемма заключенного, представленная следующей матрицей затрат:
Сотрудничать | Дефект | |
---|---|---|
Сотрудничать | 1, 1 | 7, 0 |
Дефект | 0, 7 | 5, 5 |
и пусть функция стоимости будет Итак, минимальная стоимость будет, когда оба игрока сотрудничают, и итоговая стоимость будет . Однако единственное равновесие по Нэшу возникает, когда оба дефектны, и в этом случае стоимость составляет . Таким образом, PoA этой игры будет .
Поскольку игра имеет уникальное равновесие по Нэшу, PoS равно PoA и тоже 5.
Более естественный пример - планирование заданий . Есть игроков, и у каждого из них есть задание, которое нужно выполнить. Они могут выбрать одну из машин для выполнения задания. Цена анархии сравнивает ситуацию, когда выбор машин осуществляется централизованно, с ситуацией, когда каждый игрок выбирает машину, которая будет выполнять свою работу быстрее всего.
Каждая машина имеет скорость Каждое задание имеет вес Игрок выбирает машину, чтобы запустить его или ее работа продолжается. Итак, стратегии каждого игрока Определите нагрузку на машину как :
Стоимость для игрока равно т. Е. Загрузка машины, которую они выбрали. Мы рассматриваем эгалитарную функцию затрат , здесь это называется периодом производства.
. Мы рассматриваем две концепции равновесия: чистый Нэш и смешанный Нэш. Должно быть ясно, что смешанный PoA ≥ чистый PoA, потому что любое чистое равновесие по Нэшу также является смешанным равновесием по Нэшу (это неравенство может быть строгим: например, когда , , и , смешанные стратегии достичь средней продолжительности выполнения 1,5, в то время как любая PoA чистой стратегии в этой настройке составляет ). Сначала нам нужно доказать, что существуют чистые равновесия по Нэшу.
Претензия . Для каждой игры с планированием заданий существует по крайней мере одно равновесие по Нэшу в чистой стратегии.
Доказательство . Мы хотели бы выбрать социально оптимальный профиль действий . Это будет означать просто профиль действия с минимальным временем создания. Однако этого будет недостаточно. Таких профилей действия может быть несколько, что приводит к множеству различных распределений нагрузок (все имеют одинаковую максимальную нагрузку). Среди них мы также ограничимся тем, у которого минимальная вторая по величине нагрузка. Опять же, это приводит к набору возможных распределений нагрузки, и мы повторяем до th-наибольшей (то есть наименьшей) нагрузки, где может быть только одно распределение нагрузки (уникальные до перестановки). Это также будет называться лексикографическим наименьшим отсортированным вектором нагрузки.
Мы утверждаем, что это равновесие по Нэшу в чистой стратегии. Рассуждая от противного, предположим, что какой-то игрок может строго улучшить, перейдя с машины на машину . Это означает, что увеличенная нагрузка на машину после перемещения все еще меньше, чем нагрузка на машину до Движение. Поскольку нагрузка на машину должна уменьшиться в результате перемещения, и никакая другая машина не пострадает, это означает, что новая конфигурация гарантированно уменьшит -й наибольший (или более высокий рейтинг) нагрузка в распределении. Это, однако, нарушает предполагаемую лексикографическую минимальность . Q.E.D.
Претензия . Для каждой игры с планированием заданий чистая PoA не превышает .
Proof . Легко оценить сверху благосостояние, полученное при любом равновесии по Нэшу со смешанной стратегией на
Рассмотрим, для ясность изложения, любой профиль действия чистой стратегии : очевидно
Поскольку вышесказанное справедливо и для социального оптимума, сравнение соотношений и подтверждает утверждение. Q.E.D
Рассмотрим дорожную сеть, в которой фиксированное количество водителей должно переехать из общего источника в общий пункт назначения; Предположим, что каждый водитель выбирает свой маршрут эгоистично, и что время на пересечение дороги линейно зависит от количества водителей, выбравших эту дорогу.
Мы можем формализовать эту настройку как задачу маршрутизации в ориентированном связном графе , в который мы хотим отправить одну единицу потока из исходного узла в целевой узел (представьте, что поток состоит из решений о перемещении различных водителей). В частности, пусть поток является функцией , присваивающей каждому ребру неотрицательное действительное число, и рассмотрим набор линейные функции , которые сопоставляют поток, пересекающий каждый край, с задержкой для прохождения края. Давайте также определим социальное благополучие потока как
Рассмотрим пример на рисунке: если пунктирная дорога недоступна, равновесие Нэша смешанной стратегии происходит, когда каждый игрок выбирает верхний и нижний маршруты с одинаковой вероятностью: это равновесие имеет социальные издержки 1,5, и каждому водителю требуется 1,5 единицы времени, чтобы перейти от - . Надеясь улучшить производительность сети, законодатель мог бы решить сделать пунктирную границу с низкой задержкой доступной для водителей: в этом случае единственное равновесие по Нэшу произойдет, когда каждый водитель будет использовать новую дорогу, поэтому социальная стоимость увеличится до 2, и теперь каждому игроку потребуется 2 единицы времени, чтобы перейти с на .
Следовательно, необычный результат отказа централизованного управления доступом к самой быстрой дороге в некоторых случаях приносит пользу населению.
Проблема маршрутизации, представленная в парадоксе Браесса, может быть обобщена на множество различных потоков, пересекающих один и тот же граф в одно и то же время.
Определение (Обобщенный поток) . Пусть , и будет таким, как определено выше, и предположим, что мы хотим направить величины через каждую отдельную пару узлов в . Поток определяется как присвоение действительного неотрицательного числа для каждого пути , идущего от к с ограничением, что
Переход потока Создание определенного края определяется как
Для краткости мы пишем , когда ясны из контекста.
Определение (равновесный поток по Нэшу) . Поток является потоком равновесия по Нэшу тогда и только тогда, когда и из to
Это определение тесно связано с тем, что мы говорили о поддержке равновесия Нэша смешанной стратегии в играх нормальной формы.
Определение (Условное благополучие потока) . Пусть и быть двумя потоками в , связанными с одними и теми же наборами и . В дальнейшем мы опустим нижний индекс, чтобы обозначение было более понятным. Предположим, что исправлены задержки, вызванные на графике : условное благосостояние по отношению к определяется как
Факт 1 . Для данного потока равновесия по Нэшу и любого другого потока , .
Доказательство (от противного) . Предположим, что
Поскольку и связаны с теми же наборами , мы знаем, что
Следовательно, должна быть пара и два пути от до такой, что ,
Другими словами, поток может достичь более низкого благосостояния, чем , только если есть два пути от до с разными затратами, и если перенаправляет некоторый поток от пути с более высокой стоимостью к пути с меньшей стоимостью. Эта ситуация явно несовместима с предположением, что является потоком, равновесным по Нэшу. Q.E.D.
Обратите внимание, что Факт 1 не предполагает какой-либо конкретной структуры на множестве .
Факт 2 . Даны любые два действительных числа и , .
Доказательство . Это еще один способ выразить истинное неравенство . Q.E.D.
Теорема . Чистая PoA любой обобщенной задачи маршрутизации с линейными задержками .
Доказательство . Обратите внимание, что эта теорема эквивалентна утверждению, что для каждого потока равновесия по Нэшу , , где - любой другой поток. По определению
Используя факт 2, получаем, что
, поскольку
Мы можем заключить, что , и докажите тезис, используя Факт 1. QED
Обратите внимание, что в доказательстве мы широко использовали предположение, что функции в являются линейными. На самом деле имеет место более общий факт.
Теорема . Учитывая обобщенную задачу маршрутизации с графом и полиномиальными функциями задержки степени с неотрицательными коэффициентами, чистый PoA равно .
Обратите внимание, что PoA может расти с . Рассмотрим пример, показанный на следующем рисунке, где мы предполагаем единичный поток: потоки равновесия по Нэшу имеют социальное благосостояние 1; однако наилучшее благополучие достигается, когда , в этом случае
Эта величина стремится к нулю, когда стремится к бесконечности.