Цена анархии

редактировать

Цена анархии (PoA ) - это концепция в экономика и теория игр, которая измеряет, как эффективность системы ухудшается из-за эгоистичного поведения ее агентов. Это общее понятие, которое может быть распространено на различные системы и понятия эффективности. Например, рассмотрим систему передвижения по городу и множество агентов, пытающихся перейти из некоторого исходного места в пункт назначения. Под эффективностью в данном случае будем понимать среднее время, за которое агент достигает пункта назначения. В «централизованном» решении центральный орган может указывать каждому агенту, какой путь выбрать, чтобы минимизировать среднее время в пути. В «децентрализованной» версии каждый агент выбирает свой собственный путь. Цена анархии измеряет соотношение между средним временем в пути в двух случаях.

Обычно система моделируется как игра, а эффективность является некоторой функцией результатов (например, максимальная задержка в сети, перегрузка в транспортной системе, социальное обеспечение на аукционе,...). Для моделирования эгоистичного поведения агентов могут использоваться различные концепции равновесия, среди которых наиболее распространенным является равновесие по Нэшу. Различные разновидности равновесия по Нэшу приводят к вариациям понятия цены анархии как чистой цены анархии (для детерминированных равновесий), смешанной цены анархии (для рандомизированных равновесий) и Цена анархии Байеса – Нэша (для игр с неполной информацией). Концепции решения, отличные от равновесия по Нэшу, приводят к таким вариациям, как Цена гибели .

Термин Цена анархии впервые был использован Элиасом Кутсупиасом и Христосом Пападимитриу, но идея измерения неэффективности равновесия старше. Концепция в ее нынешней форме была разработана как аналог «коэффициента приближения» в алгоритме аппроксимации или «коэффициента конкуренции» в онлайн-алгоритме. Это в контексте современной тенденции анализа игр с использованием алгоритмических линз (алгоритмическая теория игр ).

Содержание
  • 1 Математическое определение
  • 2 Дилемма заключенного
  • 3 Составление расписания
  • 4 Эгоистичная маршрутизация
    • 4.1 Парадокс Брэсса
    • 4.2 Общая проблема маршрутизации
  • 5 См. Также
  • 6 Ссылки
  • 7 Дополнительная литература
Математическое определение

Рассмотрим игру G = (N, S, u) {\ displaystyle G = (N, S, u)}G = (N, S, u) , определяемый набором игроков N {\ displaystyle N}N , наборы стратегий S i {\ displaystyle S_ {i}}S_ {i} для каждого плеер и утилиты ui: S → R {\ displaystyle u_ {i}: S \ rightarrow \ mathbb {R}}u_ {i}: S \ rightarrow {\ mathbb {R}} (где S = S 1 ×... × S n {\ displaystyle S = S_ {1} \ times... \ times S_ {n}}S = S_ {1} \ times... \ t imes S_ {n} также называется набором результатов). Мы можем определить меру эффективности каждого результата, которую мы называем функцией благосостояния W e l f: S → R {\ displaystyle Welf: S \ rightarrow \ mathbb {R}}{\ displaystyle Welf: S \ rightarrow \ mathbb {R}} . Естественные кандидаты включают в себя сумму полезностей игроков (утилитарная цель) W elf (s) = ∑ i ∈ N ui (s), {\ displaystyle Welf (s) = \ sum _ {i \ in N} u_ {i } (s),}{\ displaystyle Welf (s) = \ sum _ {i \ in N} u_ {i} (s),} минимальная полезность (справедливость или эгалитарная цель) W elf (s) = min i ∈ N ui (s), {\ displaystyle Welf (s) = \ min _ { i \ in N} u_ {i} (s),}{\ displaystyle Welf (s) = \ min _ {i \ in N} u_ {i} (s),} ... или любая функция, которая имеет значение для конкретной анализируемой игры и желательно максимизировать.

Мы можем определить подмножество E quil ⊆ S {\ displaystyle Equil \ substeq S}{\ displaystyle Equil \ substeq S} как набор стратегий в равновесии (например, набор из Равновесие по Нэшу ). Затем цена анархии определяется как соотношение между «наихудшим равновесием» и оптимальным «централизованным» решением:

P o A = min s ∈ SW elf (s) min s ∈ E quil W elf (s) { \ displaystyle PoA = {\ frac {\ min {s \ in S} Welf (s)} {\ min _ {s \ in Equil} Welf (s)}}}{\ displaystyle PoA = {\ frac { \ min {s \ in S} Welf (s)} {\ min _ {s \ in Equil} Welf (s)}}}

Если вместо 'благосостояния', которое мы хотим «максимизировать», функция измерения эффективности - это «функция затрат» C ost: S → R {\ displaystyle Cost: S \ rightarrow \ mathbb {R}}{\ displaystyle Стоимость: S \ rightarrow \ mathbb {R}} , которую мы хотим «минимизировать» (например, задержку в сети) мы используем (следуя соглашению в алгоритмах аппроксимации):

P o A = max s ∈ E quil C ost (s) min s ∈ SC ost (s) {\ displaystyle PoA = {\ frac {\ max _ {s \ in Equil} Cost (s)} {\ min _ {s \ in S} Cost (s)}}}{\ displaystyle PoA = {\ frac {\ max _ {s \ in Equil} Cost (s)} {\ min _ {s \ in S} Cost (s)}}}

Связанное с этим понятие - понятие Цена стабильности (PoS ), который измеряет соотношение между «наилучшим равновесием» и оптимальным «централизованным» решением:

P o S = max s ∈ SW elf (s) max s ∈ E квил W эльф (ы) {\ Displaystyle PoS = {\ гидроразрыва {\ м ax _ {s \ in S} Welf (s)} {\ max _ {s \ in Equil} Welf (s)}}}{\ displaystyle PoS = {\ frac {\ max _ {s \ in S} Welf (s)} {\ max _ {s \ in Equil} Вт elf (s)}}}

или в случае функций стоимости:

P o S = min s ∈ E quil C ost (s) min s ∈ SC ost (s) {\ displaystyle PoS = {\ frac {\ min _ {s \ in Equil} Cost (s)} {\ min _ {s \ in S} Cost (s)}}}{\ displaystyle PoS = {\ frac {\ min _ {s \ in Equil } Стоимость (ы)} {\ min _ {s \ in S} Стоимость (s)}}}

Мы знаем, что 1 ≤ P o S ≤ P o A {\ displaystyle 1 \ leq PoS \ leq PoA}1 \ leq PoS \ leq PoA по определению. Ожидается, что потеря эффективности из-за ограничений теории игр находится где-то между PoS и PoA.

И PoS, и PoA были рассчитаны для различных типов игр. Некоторые примеры представлены ниже.

Дилемма заключенного

Рассмотрим игру 2x2 под названием дилемма заключенного, представленная следующей матрицей затрат:

СотрудничатьДефект
Сотрудничать1, 17, 0
Дефект0, 75, 5

и пусть функция стоимости будет C (s 1, s 2) = u 1 (s 1, s 2) + u 2 (s 1, s 2). {\ displaystyle C (s_ {1}, s_ {2}) = u_ {1} (s_ {1}, s_ {2}) + u_ {2} (s_ {1}, s_ {2}).}C (s_ {1}, s_ {2}) = u_ {1} (s_ {1}, s_ {2}) + u_ {2} (s_ {1}, s_ {2}). Итак, минимальная стоимость будет, когда оба игрока сотрудничают, и итоговая стоимость будет 1 + 1 = 2 {\ displaystyle 1 + 1 = 2}1+1=2. Однако единственное равновесие по Нэшу возникает, когда оба дефектны, и в этом случае стоимость составляет 5 + 5 = 10 {\ displaystyle 5 + 5 = 10}{\ displaystyle 5 + 5 = 10} . Таким образом, PoA этой игры будет 10/2 = 5 {\ displaystyle 10/2 = 5}10/2 = 5 .

Поскольку игра имеет уникальное равновесие по Нэшу, PoS равно PoA и тоже 5.

Планирование заданий

Более естественный пример - планирование заданий . Есть N {\ displaystyle N}N игроков, и у каждого из них есть задание, которое нужно выполнить. Они могут выбрать одну из машин M {\ displaystyle M}M для выполнения задания. Цена анархии сравнивает ситуацию, когда выбор машин осуществляется централизованно, с ситуацией, когда каждый игрок выбирает машину, которая будет выполнять свою работу быстрее всего.

Каждая машина имеет скорость с 1,…, с M>0. {\ displaystyle s_ {1}, \ ldots, s_ {M}>0.}s_{1},\ldots,s_{M}>0. Каждое задание имеет вес w 1,…, w N>0. {\ displaystyle w_ {1}, \ Ndots, w_ { }>0.}w_{1},\ldots,w_{N}>0. Игрок выбирает машину, чтобы запустить его или ее работа продолжается. Итак, стратегии каждого игрока A i = {1, 2,…, M}. {\ displaystyle A_ {i} = \ {1,2, \ ldots, M \}.}A_ {i} = \ {1,2, \ ldots, M \}. Определите нагрузку на машину j {\ displaystyle j}j как :

L j (a) = ∑ i: ai = jwisj. {\ displaystyle L_ {j} (a) = {\ frac {\ sum _ {i: a_ {i} = j} w_ {i}} {s_ {j}}}.}L_ {j} (a) = {\ frac {\ sum _ {{i: a_ {i} = j}} w_ {i}} {s_ {j}}}.

Стоимость для игрока я {\ displaystyle i}i равно ci (a) = L ai (a), {\ displaystyle c_ {i} (a) = L_ {a_ {i}} (a),}c_ {i} (a) = L _ {{a_ { i}}} (а), т. Е. Загрузка машины, которую они выбрали. Мы рассматриваем эгалитарную функцию затрат MS (a) = max j L j (a) {\ displaystyle {\ t_dv {MS}} (a) = \ max _ {j} L_ {j} (a)}{\ t_dv {MS}} (a) = \ max _ {j} L_ {j} (a) , здесь это называется периодом производства.

. Мы рассматриваем две концепции равновесия: чистый Нэш и смешанный Нэш. Должно быть ясно, что смешанный PoA ≥ чистый PoA, потому что любое чистое равновесие по Нэшу также является смешанным равновесием по Нэшу (это неравенство может быть строгим: например, когда N = 2 {\ displaystyle N = 2}N=2, w 1 = вес 2 = 1 {\ displaystyle w_ {1} = w_ {2} = 1}w_ {1} = w_ {2} = 1 , M = 2 {\ displaystyle M = 2}M = 2 и s 1 = s 2 = 1 {\ Displaystyle s_ {1} = s_ {2} = 1}s_ {1} = s_ {2} = 1 , смешанные стратегии σ 1 = σ 2 = (1/2, 1/2) {\ displaystyle \ sigma _ { 1} = \ sigma _ {2} = (1 / 2,1 / 2)}\ sigma _ {1} = \ sigma _ {2} = (1 / 2,1 / 2) достичь средней продолжительности выполнения 1,5, в то время как любая PoA чистой стратегии в этой настройке составляет ≤ 4/3 {\ displaystyle \ leq 4/3}\ leq 4/3 ). Сначала нам нужно доказать, что существуют чистые равновесия по Нэшу.

Претензия . Для каждой игры с планированием заданий существует по крайней мере одно равновесие по Нэшу в чистой стратегии.

Доказательство . Мы хотели бы выбрать социально оптимальный профиль действий a ∗ {\ displaystyle a ^ {*}}a ^ {*} . Это будет означать просто профиль действия с минимальным временем создания. Однако этого будет недостаточно. Таких профилей действия может быть несколько, что приводит к множеству различных распределений нагрузок (все имеют одинаковую максимальную нагрузку). Среди них мы также ограничимся тем, у которого минимальная вторая по величине нагрузка. Опять же, это приводит к набору возможных распределений нагрузки, и мы повторяем до M {\ displaystyle M}M th-наибольшей (то есть наименьшей) нагрузки, где может быть только одно распределение нагрузки (уникальные до перестановки). Это также будет называться лексикографическим наименьшим отсортированным вектором нагрузки.

Мы утверждаем, что это равновесие по Нэшу в чистой стратегии. Рассуждая от противного, предположим, что какой-то игрок i {\ displaystyle i}i может строго улучшить, перейдя с машины j {\ displaystyle j}j на машину к {\ Displaystyle к}k . Это означает, что увеличенная нагрузка на машину k {\ displaystyle k}k после перемещения все еще меньше, чем нагрузка на машину j {\ displaystyle j}j до Движение. Поскольку нагрузка на машину j {\ displaystyle j}j должна уменьшиться в результате перемещения, и никакая другая машина не пострадает, это означает, что новая конфигурация гарантированно уменьшит j {\ displaystyle j}j -й наибольший (или более высокий рейтинг) нагрузка в распределении. Это, однако, нарушает предполагаемую лексикографическую минимальность a {\ displaystyle a}a . Q.E.D.

Претензия . Для каждой игры с планированием заданий чистая PoA не превышает M {\ displaystyle M}M .

Proof . Легко оценить сверху благосостояние, полученное при любом равновесии по Нэшу со смешанной стратегией σ {\ displaystyle \ sigma}\ sigma на

w (σ) ≤ ∑ i w i max j s j. {\ displaystyle w (\ sigma) \ leq {\ frac {\ sum _ {i} {w_ {i}}} {\ max _ {j} {s_ {j}}}}.}w (\ sigma) \ leq {\ гидроразрыв {\ sum _ {i} {w_ {i}}} {\ max _ {j} {s_ {j}}}}.

Рассмотрим, для ясность изложения, любой профиль действия чистой стратегии a {\ displaystyle a}a : очевидно

w (a) ≥ ∑ iwi ∑ jsj ≥ ∑ iwi M ⋅ max jsj. {\ displaystyle w (a) \ geq {\ frac {\ sum _ {i} {w_ {i}}} {\ sum _ {j} {s_ {j}}}} \ geq {\ frac {\ sum _ {i} {w_ {i}}} {M \ cdot \ max _ {j} {s_ {j}}}}.}w (a) \ geq {\ frac {\ sum _ {i} {w_ {i}}} {\ sum _ {j} {s_ {j}}}} \ geq { \ frac {\ sum _ {i} {w_ {i}}} {M \ cdot \ max _ {j} {s_ {j}}}}.

Поскольку вышесказанное справедливо и для социального оптимума, сравнение соотношений w (σ) {\ displaystyle w (\ sigma)}w (\ sigma) и w (a) {\ displaystyle w (a)}w (a) подтверждает утверждение. Q.E.D

Эгоистичный маршрут

Парадокс Брэсса

Рассмотрим дорожную сеть, в которой фиксированное количество водителей должно переехать из общего источника в общий пункт назначения; Предположим, что каждый водитель выбирает свой маршрут эгоистично, и что время на пересечение дороги линейно зависит от количества водителей, выбравших эту дорогу.

Мы можем формализовать эту настройку как задачу маршрутизации в ориентированном связном графе G = (V, E) {\ displaystyle G = (V, E)}G = (V, E) , в который мы хотим отправить одну единицу потока из исходного узла s ∈ V {\ displaystyle s \ in V}s \ в V в целевой узел t ∈ V {\ displaystyle t \ in V }t \ in V (представьте, что поток состоит из решений о перемещении различных водителей). В частности, пусть поток является функцией f: E ↦ ℜ {\ displaystyle f: E \ mapsto \ Re}f: E \ mapsto \ Re , присваивающей каждому ребру неотрицательное действительное число, и рассмотрим набор линейные функции L = {le (fe) = a ⋅ fe + b | е ∈ E, a ≥ 0, b ≥ 0} {\ displaystyle L = \ {l_ {e} (f_ {e}) = a \ cdot f_ {e} + b \; | \; e \ in E, \ ; a \ geq 0, \; b \ geq 0 \}}L = \ {l_ {e} (f_ {e}) = a \ cdot f_ {e} + b \; | \; e \ in E, \; a \ geq 0, \; b \ geq 0 \} , которые сопоставляют поток, пересекающий каждый край, с задержкой для прохождения края. Давайте также определим социальное благополучие потока f {\ displaystyle f}f как w (f) = ∑ efe ⋅ le (fe) {\ displaystyle w (f) = \ sum _ {e} {f_ {e} \ cdot l_ {e} (f_ {e})}}w (f) = \ sum _ {e} {f_ {e } \ cdot l_ {e} (f_ {e})}

Braess Paradox Road example.svg

Рассмотрим пример на рисунке: если пунктирная дорога недоступна, равновесие Нэша смешанной стратегии происходит, когда каждый игрок выбирает верхний и нижний маршруты с одинаковой вероятностью: это равновесие имеет социальные издержки 1,5, и каждому водителю требуется 1,5 единицы времени, чтобы перейти от s {\ displaystyle s}s- t {\ displaystyle t}t. Надеясь улучшить производительность сети, законодатель мог бы решить сделать пунктирную границу с низкой задержкой доступной для водителей: в этом случае единственное равновесие по Нэшу произойдет, когда каждый водитель будет использовать новую дорогу, поэтому социальная стоимость увеличится до 2, и теперь каждому игроку потребуется 2 единицы времени, чтобы перейти с s {\ displaystyle s}sна t {\ displaystyle t}t.

Следовательно, необычный результат отказа централизованного управления доступом к самой быстрой дороге в некоторых случаях приносит пользу населению.

Обобщенная проблема маршрутизации

Проблема маршрутизации, представленная в парадоксе Браесса, может быть обобщена на множество различных потоков, пересекающих один и тот же граф в одно и то же время.

Определение (Обобщенный поток) . Пусть G = (V, E) {\ displaystyle G = (V, E)}G = (V, E) , L {\ displaystyle L}L и w {\ displaystyle w}w будет таким, как определено выше, и предположим, что мы хотим направить величины R = {r 1, r 2,…, rk, | ри>0} {\ displaystyle R = \ {r_ {1}, r_ {2}, \ dots, r_ {k}, \; | \; r_ {i}>0 \}}R=\{r_{1},r_{2},\dots,r_{k},\;|\;r_{i}>0 \} через каждую отдельную пару узлов в Γ = {(s 1, t 1), (s 2, t 2),…, (sk, tk)} ⊆ (V × V) {\ displaystyle \ Gamma = \ {(s_ {1}, t_ {1}), (s_ {2}, t_ {2}), \ dots, (s_ {k}, t_ {k}) \} \ substeq (V \ times V)}\ Gamma = \ {(s_ {1}, t_ {1}), (s_ {2}, t_ {2}), \ dots, (s_ {k}, t_ {k}) \} \ substeq (V \ times V) . Поток f Γ, R {\ displaystyle f _ {\ Gamma, R}}f _ {{\ Gamma, R}} определяется как присвоение p ↦ ℜ {\ displaystyle p \ mapsto \ Re}p \ mapsto \ Re действительного неотрицательного числа для каждого пути p {\ displaystyle p}p , идущего от si {\ displaystyle s_ {i}}s_ {i} к ti {\ displaystyle t_ {i}}t_ {i} ∈ Γ {\ displaystyle \ in \ Gamma}\ in \ Gamma с ограничением, что

∑ p: si → tifp = ri ∀ (si, ti) ∈ Γ. {\ Displaystyle \ sum _ {p: \, s_ {i} \ rightarrow t_ {i}} {f_ {p}} = r_ {i} \; \; \ forall (s_ {i}, t_ { i}) \ in \ Gamma.}\ sum _ {{p: \, s_ {i} \ rightarrow t_ {i}}} {f_ {p}} = r_ {i} \; \; \ forall (s_ {i}, t_ {i}) \ in \ Gamma.

Переход потока Создание определенного края G {\ displaystyle G}G определяется как

f e, Γ, R = ∑ p: e ∈ p f p. {\ displaystyle f_ {e, \ Gamma, R} = \ sum _ {p: \, e \ in p} {f_ {p}}.}f _ {{e, \ Gamma, R} } = \ sum _ {{p: \, e \ in p}} {f_ {p}}.

Для краткости мы пишем fe {\ displaystyle f_ {e}}f_e , когда Γ, R {\ displaystyle \ Gamma, R}\ Gamma, R ясны из контекста.

Определение (равновесный поток по Нэшу) . Поток f Γ, R {\ displaystyle f _ {\ Gamma, R}}f _ {{\ Gamma, R}} является потоком равновесия по Нэшу тогда и только тогда, когда ∀ (si, ti) ∈ Γ {\ displaystyle \ forall ( s_ {i}, t_ {i}) \ in \ Gamma}\ forall (s_ {i}, t_ {i}) \ in \ Gamma и ∀ p, q {\ displaystyle \ forall p, q}\ forall p, q из si { \ displaystyle s_ {i}}s_ {i} to ti {\ displaystyle t_ {i}}t_ {i}

fp>0 ⇒ ∑ e ∈ ple (fe) ≤ ∑ e ∈ qle (fe). {\ displaystyle f_ {p}>0 \ Rightarrow \ sum _ {e \ in p} {l_ {e} (f_ {e})} \ leq \ sum _ {e \ in q} {l_ {e} (f_ {e})}.}f_{{p}}>0 \ Rightarrow \ sum _ {{e \ in p}} {l_ {e} (f_ {e})} \ leq \ sum _ {{e \ in q }} {l_ {e} (f_ {e})}.

Это определение тесно связано с тем, что мы говорили о поддержке равновесия Нэша смешанной стратегии в играх нормальной формы.

Определение (Условное благополучие потока) . Пусть е Γ, R {\ displaystyle f _ {\ Gamma, R}}f _ {{\ Gamma, R}} и f Γ, R ∗ {\ displaystyle f _ {\ Gamma, R} ^ {*}}f _ {{\ Gamma, R}} ^ {{*}} быть двумя потоками в G {\ displaystyle G}G , связанными с одними и теми же наборами Γ {\ displaystyle \ Gamma}\ Gamma и R {\ displaystyle R}R . В дальнейшем мы опустим нижний индекс, чтобы обозначение было более понятным. Предположим, что исправлены задержки, вызванные f {\ displaystyle f}f на графике : условное благосостояние f ∗ {\ d isplaystyle f ^ {*}}f ^ {*} по отношению к f {\ displaystyle f}f определяется как

wf (f ∗) = ∑ e ∈ E fe ∗ ⋅ ле (е) {\ Displaystyle ш ^ {е} (е ^ {*}) = \ сумма _ {е \ в Е} {е_ {е} ^ {*} \ cdot l_ {е} (е_ {е}) }}w ^ {{f}} ( f ^ {{*}}) = \ sum _ {{e \ in E}} {f_ {e} ^ {{*}} \ cdot l _ {{e}} (f _ {{e}})}

Факт 1 . Для данного потока равновесия по Нэшу f {\ displaystyle f}f и любого другого потока f ∗ {\ displaystyle f ^ {*}}f ^ {*} , w (f) = wf (f) ≤ wf (f *) {\ displaystyle w (f) = w ^ {f} (f) \ leq w ^ {f} (f ^ {*})}w (f) = w ^ {{f}} (f) \ leq w ^ {{f}} (f ^ {{*}}) .

Доказательство (от противного) . Предположим, что w f (f ∗) < w f ( f) {\displaystyle w^{f}(f^{*})w ^ {{f}} (f ^ {{*}}) <w ^ {{f}} (f) . По определению

∑ i = 1 k ∑ p: si → tifp ∗ ⋅ ∑ e ∈ ple (fe) < ∑ i = 1 k ∑ p : s i → t i f p ⋅ ∑ e ∈ p l e ( f e) {\displaystyle \sum _{i=1}^{k}\sum _{p:s_{i}\rightarrow t_{i}}f_{p}^{*}\cdot \sum _{e\in p}l_{e}(f_{e})<\sum _{i=1}^{k}\sum _{p:s_{i}\rightarrow t_{i}}f_{p}\cdot \sum _{e\in p}l_{e}(f_{e})}\ sum _ {{i = 1}} ^ {{k}} \ sum _ {{p: s_ {i} \ rightarrow t_ {i}}} f_ {p} ^ {{*}} \ cdot \ sum _ {{e \ in p}} l_ {e} (f_ {e}) <\ sum _ {{i = 1}} ^ {{k}} \ sum _ {{p: s_ {i} \ rightarrow t_ {i}} } f_ {p} \ cdot \ sum _ {{e \ in p}} l_ {e} (f_ {e}) .

Поскольку f {\ displaystyle f}f и f ∗ {\ displaystyle f ^ {*}}f ^ {*} связаны с теми же наборами Γ, R {\ displaystyle \ Gamma, R}\ Gamma, R , мы знаем, что

∑ p: si → tifp = ∑ p: si → tifp ∗ = ri ∀ i. {\ displaystyle \ sum _ {p: s_ {i} \ rightarrow t_ {i}} f_ {p} = \ sum _ {p: s_ {i} \ rightarrow t_ {i}} f_ {p} ^ {*} = r_ {i} \; \; \ forall i.}\ sum _ {{p: s_ {i } \ rightarrow t_ {i}}} f_ {p} = \ sum _ {{p: s_ {i} \ rightarrow t_ {i}}} f_ {p} ^ {{*}} = r_ {i} \; \; \ forall i.

Следовательно, должна быть пара (si, ti) {\ displaystyle (s_ {i}, t_ {i})}(s_ {i}, t_ {i}) и два пути p, q {\ displaystyle p, q}p, q от si {\ displaystyle s_ {i}}s_ {i} до ti { \ displaystyle t_ {i}}t_ {i} такой, что fp ∗>fp {\ displaystyle f_ {p} ^ {*}>f_ {p}}f_{p}^{{*}}>f_ {p} , fq ∗ < f q {\displaystyle f_{q}^{*}f_ {q} ^ {{*}} <f_ {q} , и

∑ e ∈ ple (fe) < ∑ e ∈ q l e ( f e). {\displaystyle \sum _{e\in p}l_{e}(f_{e})<\sum _{e\in q}l_{e}(f_{e}).}\ sum _ {{е \ in p}} l_ {e} (f_ {e}) <\ sum _ {{e \ in q}} l_ {e} (f_ {e}).

Другими словами, поток f ∗ {\ displaystyle f ^ {*}}f ^ {*} может достичь более низкого благосостояния, чем f {\ displaystyle f}f , только если есть два пути от si {\ displaystyle s_ {i}}s_ {i} до ti {\ displaystyle t_ {i}}t_ {i} с разными затратами, и если f ∗ {\ displaystyle f ^ {*}}f ^ {*} перенаправляет некоторый поток f {\ displaystyle f}f от пути с более высокой стоимостью к пути с меньшей стоимостью. Эта ситуация явно несовместима с предположением, что f {\ displaystyle f}f является потоком, равновесным по Нэшу. Q.E.D.

Обратите внимание, что Факт 1 не предполагает какой-либо конкретной структуры на множестве L {\ displaystyle L}L .

Факт 2 . Даны любые два действительных числа x {\ displaystyle x}x и y {\ displaystyle y}y , x ⋅ y ≤ x 2 + y 2/4 {\ displaystyle x \ cdot y \ leq x ^ {2} + y ^ {2} / 4}x \ cdot y \ leq x ^ {2} + y ^ {{2}} / 4 .

Доказательство . Это еще один способ выразить истинное неравенство (x - y / 2) 2 ≥ 0 {\ displaystyle (x-y / 2) ^ {2} \ geq 0}(xy / 2) ^ {2} \ geq 0 . Q.E.D.

Теорема . Чистая PoA любой обобщенной задачи маршрутизации (G, L) {\ displaystyle (G, L)}(G, L) с линейными задержками ≤ 4/3 {\ displaystyle \ leq 4/3 }\ leq 4/3 .

Доказательство . Обратите внимание, что эта теорема эквивалентна утверждению, что для каждого потока равновесия по Нэшу f {\ displaystyle f}f , w (f) ≤ (4/3) ⋅ min f ∗ {w (f ∗)} {\ displaystyle w (f) \ leq (4/3) \ cdot \ min _ {f ^ {*}} \ {w (f ^ {*}) \}}w (f) \ leq (4/3) \ cdot \ min _ {{f ^ {{*}}}} \ {w (f ^ {{*}}) \} , где f ∗ {\ displaystyle f ^ {*}}f ^ {*} - любой другой поток. По определению

wf (f ∗) = ∑ e ∈ E fe ∗ (ae ⋅ fe + be) {\ displaystyle w ^ {f} (f ^ {*}) = \ sum _ {e \ in E} f_ {e} ^ {*} (a_ {e} \ cdot f_ {e} + b_ {e})}w ^ {{f}} (f ^ {{*}}) = \ sum _ {{e \ in E}} f_ {e} ^ {{* }} (a_ {e} \ cdot f_ {e} + b_ {e})
= ∑ e (aefefe ∗) + e ∈ E fe ∗ be. {\ displaystyle = \ sum _ {e} (a_ {e} f_ {e} f_ {e} ^ {*}) + \ sum _ {e \ in E} f_ {e} ^ {*} b_ {e}.}= \ sum _ {{e}} (a _ {{e}} f _ {{e}} f _ {{e}} ^ {{*}}) + \ sum _ {{e \ in E}} f_ { e} ^ {{*}} b_ {e}.

Используя факт 2, получаем, что

wf (f ∗) ≤ ∑ e ∈ E (ae ⋅ ((fe ∗) 2 + (fe) 2/4)) + ∑ e ∈ E fe * ⋅ быть {\ displaystyle w ^ {f} (f ^ {*}) \ leq \ sum _ {e \ in E} \ left (a_ {e} \ cdot \ left ((f_ {e} ^ {*}) ^ {2} + (f_ {e}) ^ {2} / 4 \ right) \ right) + \ sum _ {e \ in E} f_ {e} ^ {*} \ cdot b_ {e}}w ^ {{f}} (f ^ {{*}}) \ leq \ sum _ {{e \ в E}} \ left (a_ {e} \ cdot \ left ((f_ {e} ^ {{*}}) ^ {2} + (f_ {e}) ^ {{2}} / 4 \ right) \ right) + \ sum _ {{e \ in E}} f_ {e} ^ {{*}} \ cdot b_ {e}
= (∑ e ∈ E ae (fe ∗) 2 + fe ∗ be) + ∑ e ∈ E ae (fe) 2/4 {\ displaystyle = \ left (\ sum _ {e \ in E} a_ {e } (f_ {e} ^ {*}) ^ {2} + f_ {e} ^ {*} b_ {e} \ right) + \ sum _ {e \ in E} a_ {e} (f_ {e}) ^ {2} / 4}= \ left (\ sum _ {{e \ in E}} a_ {e} (f_ {e} ^ {{*}}) ^ {2} + f_ {e} ^ {{*}} b_ {e } \ right) + \ sum _ {{e \ in E}} a ​​_ {{e}} (f_ {e}) ^ {{2}} / 4
≤ вес (е *) + вес (е) 4, {\ displaystyle \ leq w (f ^ {*}) + {\ frac {w (f)} {4} },}\ leq w (f ^ {{*}}) + {\ frac {w (f)} {4}},

, поскольку

(1/4) ⋅ w (f) = (1/4) ⋅ ∑ e ∈ E fe (aefe + be) {\ displaystyle (1/4) \ cdot w (f) = (1/4) \ cdot \ sum _ {e \ in E} f_ {e} (a_ {e} f_ {e} + b_ {e})}(1/4) \ cdot w (f) = (1/4) \ cdot \ sum _ {{e \ in E}} f_ {e} (a ​​_ {{ e}} f _ {{e}} + b _ {{e}})
= (1/4) ⋅ ∑ e ∈ E (fe) 2 + (1/4) ⋅ ∑ e ∈ E febe ⏟ ≥ 0. {\ displaystyle = (1/4) \ cdot \ sum _ {e \ in E} (f_ {e}) ^ {2} + \ underbrace {(1/4) \ cdot \ sum _ {e \ in E} f_ {e} b_ {e}} _ {\ geq 0}.}= (1/4) \ cdot \ sum _ {{e \ in E}} (f _ {{e}}) ^ {2} + \ underbrace {(1/4) \ cdot \ sum _ {{ е \ in E}} f _ {{e}} b _ {{e}}} _ {{\ geq 0}}.

Мы можем заключить, что wf (f ∗) ≤ w (f ∗) + w (f) / 4 {\ displaystyle w ^ {f} (f ^ {*}) \ leq w (f ^ {*}) + w (f) / 4}w ^ {{f}} (f ^ {{*}}) \ leq w (f ^ {{*}}) + w (f) / 4 , и докажите тезис, используя Факт 1. QED

Обратите внимание, что в доказательстве мы широко использовали предположение, что функции в L {\ displaystyle L}L являются линейными. На самом деле имеет место более общий факт.

Теорема . Учитывая обобщенную задачу маршрутизации с графом G {\ displaystyle G}G и полиномиальными функциями задержки степени d {\ displaystyle d}d с неотрицательными коэффициентами, чистый PoA равно ≤ d + 1 {\ displaystyle \ leq d + 1}\ leq d + 1 .

Обратите внимание, что PoA может расти с d {\ displaystyle d}d . Рассмотрим пример, показанный на следующем рисунке, где мы предполагаем единичный поток: потоки равновесия по Нэшу имеют социальное благосостояние 1; однако наилучшее благополучие достигается, когда x = 1 - 1 / d + 1 {\ displaystyle x = 1-1 / {\ sqrt {d + 1}}}x = 1-1 / {{\ sqrt {d + 1}}} , в этом случае

вес = (1 - 1 d + 1) d ⋅ (1 - 1 d + 1) + 1 ⋅ 1 d + 1 {\ displaystyle w = \ left (1 - {\ frac {1} {\ sqrt {d +1}}} \ right) ^ {d} \ cdot \ left (1 - {\ frac {1} {\ sqrt {d + 1}}} \ right) +1 \ cdot {\ frac {1} {\ sqrt {d + 1}}}}w = \ left (1- {\ frac {1} {{\ sqrt {d + 1}}}} \ right) ^ {d} \ cdot \ left (1 - {\ frac {1} {{\ sqrt {d + 1}}}}} \ right) +1 \ cdot {\ frac {1} {{\ sqrt {d + 1}}}}
= ((1 - 1 d + 1) d + 1) d + 1 + 1 d + 1 {\ displaystyle = \ left (\ left (1 - {\ frac { 1} {\ sqrt {d + 1}}} \ right) ^ {\ sqrt {d + 1}} \ right) ^ {\ sqrt {d + 1}} + {\ frac {1} {\ sqrt {d +1}}}}= \ left (\ left (1 - {\ frac {1} {{\ sqrt {d + 1}}) }} \ right) ^ {{{\ sqrt {d + 1}}}} \ right) ^ {{\ sqrt {d + 1}}} + {\ frac {1} {{\ sqrt {d + 1} }}}
≤ e - d + 1 + 1 d + 1. {\ displaystyle \ leq e ^ {- {\ sqrt {d + 1}}} + {\ frac {1} {\ sqrt {d + 1}}}.}\ leq e ^ {{- {\ sqrt {d + 1}}}} + {\ frac {1} {{\ sqrt {d + 1}}}}.

Эта величина стремится к нулю, когда d {\ displaystyle d}d стремится к бесконечности.

См. Также
Ссылки
Дополнительная литература
  • Fabio Cunial, Price анархии
Последняя правка сделана 2021-06-02 05:37:49
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте