Конструкция механизма

редактировать
Диаграмма Стэнли Райтера выше иллюстрирует игру в дизайн механизмов. Верхнее левое пространство изображает пространство типов, а верхнее правое пространство X - пространство результатов. Социальный выбор функция отображает профиль типа к результату. В играх с конструкцией механизмов агенты отправляют сообщения в игровой среде. Равновесие в игре может быть разработано, чтобы реализовать какую - либо социальную функцию выбора. Θ {\ Displaystyle \ Theta} ж ( θ ) {\ Displaystyle е (\ тета)} M {\ displaystyle M} грамм {\ displaystyle g} ξ ( M , грамм , θ ) {\ Displaystyle \ хи (М, г, \ тета)} ж ( θ ) {\ Displaystyle е (\ тета)}

Проектирование механизмов - это область экономики и теории игр, в которой используется подход, ориентированный на цели, для разработки экономических механизмов или стимулов для достижения желаемых целей в стратегических условиях, когда игроки действуют рационально. Поскольку она начинается в конце игры, а затем идет в обратном направлении, ее также называют теорией обратной игры. Он имеет широкое применение, начиная от экономики и политики в таких областях, как дизайн рынка, теории аукционов и теории общественного выбора к сетевым-системам (интернет междоменной маршрутизации, авторы поиска аукционов).

При проектировании механизмов изучаются концепции решений для класса приватно-информационных игр. Леонид Гурвич объясняет, что «в задаче проектирования целевая функция является главной« данностью », а механизм - неизвестным. Таким образом, проблема проектирования является «обратной» традиционной экономической теории, которая обычно посвящена анализу работы данного механизма ». Итак, две отличительные особенности этих игр:

  • что "дизайнер" игры выбирает структуру игры, а не наследует ее
  • что дизайнер заинтересован в исходе игры

Нобелевская мемориальная премия по экономическим наукам 2007 года была присуждена Леониду Гурвицу, Эрику Маскину и Роджеру Майерсону «за то, что они заложили основы теории конструкции механизмов».

СОДЕРЖАНИЕ

  • 1 Интуиция
  • 2 Фундамента
    • 2.1 Механизм
    • 2.2 Принцип откровения
    • 2.3 Реализуемость
      • 2.3.1 Необходимость
      • 2.3.2 Достаточность
  • 3 Выделенные результаты
    • 3.1 Теорема об эквивалентности доходов
    • 3.2. Механизмы Викри – Кларка – Гровса.
    • 3.3 Теорема Гиббарда – Саттертуэйта
    • 3.4 Теорема Майерсона – Саттертуэйта
  • 4 Примеры
    • 4.1 Ценовая дискриминация
    • 4.2 Глажение по Майерсону
      • 4.2.1 Доказательство
  • 5 См. Также
  • 6 Примечания
  • 7 ссылки
  • 8 Дальнейшее чтение
  • 9 Внешние ссылки

Интуиция

В интересном классе байесовских игр один игрок, называемый «принципалом», хотел бы обусловить свое поведение информацией, которая в частном порядке известна другим игрокам. Например, директор хочет знать истинное качество подержанной машины, которую продает продавец. Он ничего не может узнать, просто спросив продавца, потому что в его интересах исказить истину. Однако в разработке механизмов у принципала есть одно преимущество: он может разработать игру, правила которой могут повлиять на других, чтобы они действовали так, как он хотел.

Без теории конструкции механизмов проблему директора было бы трудно решить. Ему придется рассмотреть все возможные игры и выбрать ту, которая лучше всего влияет на тактику других игроков. Кроме того, доверитель должен будет делать выводы от агентов, которые могут ему лгать. Благодаря конструкции механизма и, в частности, принципу раскрытия информации, принципал должен учитывать только те игры, в которых агенты правдиво сообщают свою личную информацию.

Фонды

Механизм

Игра в разработку механизмов - это игра с частной информацией, в которой один из агентов, называемый принципалом, выбирает структуру выплаты. Следуя Харшаньи  ( 1967), агенты получают секретные «сообщения» от природы, содержащие информацию, относящуюся к выплатам. Например, сообщение может содержать информацию об их предпочтениях или качестве товара для продажи. Мы называем эту информацию «типом» агента (обычно отмечается и соответственно пространство типов). Затем агенты сообщают директору о типе (обычно отмеченном шляпой), который может быть стратегической ложью. После отчета принципалу и агентам выплачиваются выплаты в соответствии со структурой выплат, выбранной принципалом. θ {\ displaystyle \ theta} Θ {\ Displaystyle \ Theta} θ ^ {\ displaystyle {\ hat {\ theta}}}

Время игры:

  1. Принципал подчиняется механизму, который предоставляет результат как функцию сообщаемого типа. у ( ) {\ displaystyle y ()} у {\ displaystyle y}
  2. Агенты сообщают, возможно, нечестно, типовой профиль θ ^ {\ displaystyle {\ hat {\ theta}}}
  3. Механизм выполнен (агенты получают результат) у ( θ ^ ) {\ Displaystyle у ({\ шляпа {\ theta}})}

Чтобы понять, кто что получает, принято делить результат на распределение товаров и денежный перевод, где означает распределение товаров, предоставленных или полученных, в зависимости от типа, и означает денежный перевод как функцию тип. у {\ displaystyle y} у ( θ ) знак равно { Икс ( θ ) , т ( θ ) } ,   Икс Икс , т Т {\ Displaystyle у (\ тета) = \ {х (\ тета), т (\ тета) \}, \ х \ в Х, т \ в Т} Икс {\ displaystyle x} т {\ displaystyle t}

В качестве эталона дизайнер часто определяет, что произойдет, если будет полная информация. Определить функция социального выбора, отображающая (истинный) типовой профиль непосредственно на распределение полученных или предоставленных товаров, ж ( θ ) {\ Displaystyle е (\ тета)}

ж ( θ ) : Θ Икс {\ displaystyle f (\ theta): \ Theta \ rightarrow X}

Напротив, механизм сопоставляет отчетный профиль типа с результатом (опять же, как распределение товаров, так и денежный перевод). Икс {\ displaystyle x} т {\ displaystyle t}

у ( θ ^ ) : Θ Y {\ displaystyle y ({\ hat {\ theta}}): \ Theta \ rightarrow Y}

Принцип откровения

Основная статья: Принцип откровения

Предлагаемый механизм представляет собой байесовскую игру (игру частной информации), и при правильном ее ведении игра имеет байесовское равновесие по Нэшу. В состоянии равновесия агенты выбирают свои отчеты стратегически в зависимости от типа

θ ^ ( θ ) {\ Displaystyle {\ шляпа {\ theta}} (\ theta)}

В такой обстановке трудно найти байесовское равновесие, потому что оно включает в себя поиск стратегий наилучшего реагирования агентов и наилучший вывод из возможной стратегической лжи. Благодаря широкому результату, называемому принципом откровения, независимо от механизма, дизайнер может ограничить внимание равновесием, в котором агенты правдиво сообщают о типе. Принцип откровения гласит: «Каждому байесовскому равновесию по Нэшу соответствует байесовская игра с таким же исходом равновесия, но в которой игроки правдиво сообщают о типе».

Это очень полезно. Этот принцип позволяет найти байесовское равновесие, предполагая, что все игроки правдиво сообщают тип (с учетом ограничения совместимости стимулов ). Одним ударом он избавляет от необходимости рассматривать либо стратегическое поведение, либо ложь.

Его доказательство вполне прямое. Предположим байесовскую игру, в которой стратегия и выигрыш агента являются функциями его типа и того, что делают другие. По определению, стратегия равновесия агента i - это ожидаемая полезность Нэша: ты я ( s я ( θ я ) , s - я ( θ - я ) , θ я ) {\ displaystyle u_ {i} \ left (s_ {i} (\ theta _ {i}), s _ {- i} (\ theta _ {- i}), \ theta _ {i} \ right)} s ( θ я ) {\ Displaystyle s (\ theta _ {я})}

s я ( θ я ) аргумент Максимум s я S я θ - я   п ( θ - я θ я )   ты я ( s я , s - я ( θ - я ) , θ я ) {\ displaystyle s_ {i} (\ theta _ {i}) \ in \ arg \ max _ {s '_ {i} \ in S_ {i}} \ sum _ {\ theta _ {- i}} \ p (\ theta _ {- i} \ mid \ theta _ {i}) \ u_ {i} \ left (s '_ {i}, s _ {- i} (\ theta _ {- i}), \ theta _ {Я прав)}

Просто определите механизм, который побудит агентов выбрать одно и то же равновесие. Проще всего определить механизм, обязывающий играть за них равновесные стратегии агентов.

у ( θ ^ ) : Θ S ( Θ ) Y {\ displaystyle y ({\ hat {\ theta}}): \ Theta \ rightarrow S (\ Theta) \ rightarrow Y}

При таком механизме агенты, конечно, считают оптимальным выявление типа, поскольку механизм в любом случае использует стратегии, которые они сочли оптимальными. Формально выбираем такой, что у ( θ ) {\ Displaystyle у (\ тета)}

θ я аргумент Максимум θ я Θ θ - я   п ( θ - я θ я )   ты я ( у ( θ я , θ - я ) , θ я ) знак равно θ - я   п ( θ - я θ я )   ты я ( s я ( θ ) , s - я ( θ - я ) , θ я ) {\ displaystyle {\ begin {align} \ theta _ {i} \ in {} amp; \ arg \ max _ {\ theta '_ {i} \ in \ Theta} \ sum _ {\ theta _ {- i}} \ p (\ theta _ {- i} \ mid \ theta _ {i}) \ u_ {i} \ left (y (\ theta '_ {i}, \ theta _ {- i}), \ theta _ { i} \ right) \\ [5pt] amp; = \ sum _ {\ theta _ {- i}} \ p (\ theta _ {- i} \ mid \ theta _ {i}) \ u_ {i} \ left (s_ {i} (\ theta), s _ {- i} (\ theta _ {- i}), \ theta _ {i} \ right) \ end {align}}}

Реализуемость

Разработчик механизма обычно надеется либо

  • разработать механизм, который "реализует" функцию социального выбора у ( ) {\ displaystyle y ()}
  • найти механизм, который максимизирует некоторый критерий ценности (например, прибыль) у ( ) {\ displaystyle y ()}

Для реализации функции социального выбора, чтобы найти некоторую передаточную функцию, которая мотивирует агент, чтобы выбрать. Формально, если профиль стратегии равновесия в рамках механизма соответствует тому же распределению товаров, что и функция общественного выбора, ж ( θ ) {\ Displaystyle е (\ тета)} т ( θ ) {\ Displaystyle т (\ тета)} ж ( θ ) {\ Displaystyle е (\ тета)}

ж ( θ ) знак равно Икс ( θ ^ ( θ ) ) {\ Displaystyle е (\ тета) = х \ влево ({\ шляпа {\ тета}} (\ тета) \ вправо)}

мы говорим, что механизм реализует функцию социального выбора.

Благодаря принципу откровения разработчик обычно может найти передаточную функцию для реализации социального выбора, решив связанную с ним игру, рассказывающую правду. Если агенты сочтут оптимальным сообщать о типе правдивых сведений, т ( θ ) {\ Displaystyle т (\ тета)}

θ ^ ( θ ) знак равно θ {\ Displaystyle {\ шляпа {\ theta}} (\ theta) = \ theta}

мы говорим, что такой механизм действительно реализуем (или просто «реализуем»). Затем задача состоит в том, чтобы найти правдиво реализуемую и приписать эту передаточную функцию исходной игре. Распределение действительно реализуемо, если существует передаточная функция такая, что т ( θ ) {\ Displaystyle т (\ тета)} Икс ( θ ) {\ Displaystyle х (\ тета)} т ( θ ) {\ Displaystyle т (\ тета)}

ты ( Икс ( θ ) , т ( θ ) , θ ) ты ( Икс ( θ ^ ) , т ( θ ^ ) , θ )   θ , θ ^ Θ {\ Displaystyle и (Икс (\ тета), т (\ тета), \ тета) \ geq и (х ({\ шляпа {\ тета}}), т ({\ шляпа {\ тета}}), \ тета) \ \ forall \ theta, {\ hat {\ theta}} \ in \ Theta}

которое также называется ограничением совместимости стимулов (IC).

В приложениях условие IC является ключом к описанию формы любым полезным способом. При определенных условиях он может даже аналитически выделить передаточную функцию. Кроме того, иногда добавляется ограничение на участие ( индивидуальная рациональность ), если агенты имеют возможность не играть. т ( θ ) {\ Displaystyle т (\ тета)}

Необходимость

Рассмотрим ситуацию, в которой у всех агентов есть функция полезности, зависящая от типа. Рассмотрим также распределение товаров с векторной оценкой и размером (которое допускает количество товаров) и предположим, что оно является кусочно-непрерывным по отношению к своим аргументам. ты ( Икс , т , θ ) {\ Displaystyle и (х, т, \ тета)} Икс ( θ ) {\ Displaystyle х (\ тета)} k {\ displaystyle k} k {\ displaystyle k}

Функция реализуема, только если Икс ( θ ) {\ Displaystyle х (\ тета)}

k знак равно 1 п θ ( ты / Икс k | ты / т | ) Икс θ 0 {\ displaystyle \ sum _ {k = 1} ^ {n} {\ frac {\ partial} {\ partial \ theta}} \ left ({\ frac {\ partial u / \ partial x_ {k}} {\ left | \ partial u / \ partial t \ right |}} \ right) {\ frac {\ partial x} {\ partial \ theta}} \ geq 0}

всякий раз, когда и и x непрерывны в точке. Это необходимое условие, которое выводится из условий первого и второго порядка задачи оптимизации агента в предположении правдивости. Икс знак равно Икс ( θ ) {\ Displaystyle х = х (\ тета)} т знак равно т ( θ ) {\ Displaystyle т = т (\ тета)} θ {\ displaystyle \ theta}

Его значение можно понять из двух частей. Первая часть говорит о том, что предельная скорость замещения агента (MRS) увеличивается в зависимости от типа,

θ ( ты / Икс k | ты / т | ) знак равно θ M р S Икс , т {\ Displaystyle {\ frac {\ partial} {\ partial \ theta}} \ left ({\ frac {\ partial u / \ partial x_ {k}} {\ left | \ partial u / \ partial t \ right |} } \ right) = {\ frac {\ partial} {\ partial \ theta}} \ mathrm {MRS} _ {x, t}}

Короче говоря, агенты не скажут правду, если механизм не предлагает более выгодные условия для агентов более высокого уровня. В противном случае более высокие типы, столкнувшись с любым механизмом, который наказывает высокие типы за сообщение, будут лгать и объявлять, что они являются низшими типами, нарушая ограничение IC правдивости. Вторая часть - это условие монотонности, ожидающее своего появления,

Икс θ {\ displaystyle {\ frac {\ partial x} {\ partial \ theta}}}

что, если быть положительным, означает, что более высоким типам нужно давать больше добра.

У этих двух частей есть потенциал для взаимодействия. Если для некоторого диапазона типов контракт предлагал меньшее количество для более высоких типов, возможно, механизм мог бы компенсировать, предоставляя более высокие типы скидки. Но такой договор уже существует для низкотипных агентов, поэтому это решение патологическое. Такое решение иногда возникает в процессе поиска механизма. В этих случаях его необходимо « погладить ». В среде с нескольких исправными также возможно для дизайнера наградить агент с более одного товаром для замены меньше других (например, масло для маргарина ). Множественные хорошие механизмы - постоянная проблема в теории проектирования механизмов. Икс / θ lt; 0 {\ Displaystyle \ частичный х / \ частичный \ тета lt;0}

Достаточность

Документы по разработке механизмов обычно делают два допущения для обеспечения возможности реализации:

  1. θ ты / Икс k | ты / т | gt; 0   k {\ displaystyle {\ frac {\ partial} {\ partial \ theta}} {\ frac {\ partial u / \ partial x_ {k}} {\ left | \ partial u / \ partial t \ right |}}gt; 0 \ \ forall k}

Это известно под несколькими названиями: условие однократного пересечения, условие сортировки и условие Спенса – Миррлиза. Это означает, что функция полезности имеет такую ​​форму, что тип MRS агента увеличивается.

  1. K 0 , K 1  такой, что  | ты / Икс k ты / т | K 0 + K 1 | т | {\ displaystyle \ существует K_ {0}, K_ {1} {\ text {такой, что}} \ left | {\ frac {\ partial u / \ partial x_ {k}} {\ partial u / \ partial t}} \ right | \ leq K_ {0} + K_ {1} | t |}

Это техническое условие, ограничивающее темпы роста MRS.

Этих допущений достаточно, чтобы гарантировать, что любая монотонность реализуема ( существует, который может ее реализовать). Кроме того, в настройке «один-хороший» условие однократного пересечения является достаточным, чтобы обеспечить возможность реализации только монотонного, поэтому разработчик может ограничить свой поиск монотонным. Икс ( θ ) {\ Displaystyle х (\ тета)} т ( θ ) {\ Displaystyle т (\ тета)} Икс ( θ ) {\ Displaystyle х (\ тета)} Икс ( θ ) {\ Displaystyle х (\ тета)}

Выделенные результаты

Теорема об эквивалентности доходов

Основная статья: Эквивалент доходов

Викри  ( 1961) дает знаменитый результат, заключающийся в том, что любой участник большого класса аукционов гарантирует продавцу такой же ожидаемый доход и что ожидаемый доход - лучшее, что может сделать продавец. Это так, если

  1. Покупатели имеют идентичные оценочные функции (которые могут зависеть от типа).
  2. Типы покупателей распределяются независимо
  3. Типы покупателей выбираются из непрерывного распределения
  4. Распределение типов имеет свойство монотонной степени опасности.
  5. Механизм продает товар покупателю с наивысшей оценкой.

Последнее условие является ключевым для теоремы. Подразумевается, что для того, чтобы продавец получил более высокий доход, он должен рискнуть и передать товар агенту с более низкой оценкой. Обычно это означает, что он должен рискнуть вообще не продавать предмет.

Механизмы Викри – Кларка – Гровса

Основная статья: механизм Викри-Кларка-Гроувса

Модель аукциона Викри (1961) была позже расширена Кларком  ( 1971) и Гроувсом для решения проблемы общественного выбора, в которой расходы на общественный проект несут все агенты, например, строить ли муниципальный мост. Получающийся в результате механизм «Викри-Кларка-Гроувса» может мотивировать агентов выбирать социально эффективное распределение общественного блага, даже если агенты имеют частно известные оценки. Другими словами, он может разрешить « трагедию общин » - при определенных условиях, в частности, при квазилинейной полезности или если не требуется баланс бюджета.

Рассмотрим ситуацию, в которой количество агентов имеет квазилинейную полезность с частными оценками, где валюта оценивается линейно. Дизайнер VCG разрабатывает механизм, совместимый со стимулами (следовательно, правдиво реализуемый), для получения истинного профиля типа, из которого разработчик реализует социально оптимальное распределение. я {\ displaystyle I} v ( Икс , т , θ ) {\ Displaystyle v (х, т, \ тета)} т {\ displaystyle t}

Икс я * ( θ ) argmax Икс Икс я я v ( Икс , θ я ) {\ displaystyle x_ {I} ^ {*} (\ theta) \ in {\ underset {x \ in X} {\ operatorname {argmax}}} \ sum _ {i \ in I} v (x, \ theta _ {я})}

Умный механизм VCG - это то, как он мотивирует правдивое откровение. Это устраняет стимулы к искажению информации, наказывая любого агента ценой искажения, которое он вызывает. Среди отчетов, которые может сделать агент, механизм VCG допускает «нулевой» отчет, в котором говорится, что он безразличен к общественному благу и заботится только о переводе денег. Это эффективно удаляет агента из игры. Если агент выбирает тип сообщения, механизм VCG взимает с агента плату, если его отчет является ключевым, то есть если его отчет изменяет оптимальное распределение x, чтобы нанести вред другим агентам. Оплата рассчитывается

т я ( θ ^ ) знак равно j я - я v j ( Икс я - я * ( θ я - я ) , θ j ) - j я - я v j ( Икс я * ( θ ^ я , θ я ) , θ j ) {\ displaystyle t_ {i} ({\ hat {\ theta}}) = \ sum _ {j \ in Ii} v_ {j} (x_ {Ii} ^ {*} (\ theta _ {Ii}), \ theta _ {j}) - \ sum _ {j \ in Ii} v_ {j} (x_ {I} ^ {*} ({\ hat {\ theta}} _ {i}, \ theta _ {I}), \ theta _ {j})}

который суммирует искажения полезности других агентов (а не его собственные), вызванные отчетом одного агента.

Теорема Гиббарда – Саттертуэйта.

Основная статья: теорема Гиббарда – Саттертуэйта

Гиббард  ( 1973) и Саттертуэйт  ( 1975) приводят результат о невозможности, аналогичный по духу теореме о невозможности Эрроу. Для очень общего класса игр могут быть реализованы только «диктаторские» функции социального выбора.

Функция общественного выбора f () является диктаторской, если один агент всегда получает наиболее предпочтительное распределение благ,

для  ж ( Θ ) я я  такой, что  ты я ( Икс , θ я ) ты я ( Икс , θ я )   Икс Икс {\ displaystyle {\ text {for}} е (\ Theta) {\ text {,}} \ существует i \ in I {\ text {такое, что}} u_ {i} (x, \ theta _ {i}) \ geq u_ {i} (x ', \ theta _ {i}) \ \ forall x' \ in X}

Теорема утверждает, что в общих условиях любая реально реализуемая функция общественного выбора должна быть диктаторской, если:

  1. X конечно и содержит не менее трех элементов
  2. Предпочтения рациональны
  3. ж ( Θ ) знак равно Икс {\ Displaystyle F (\ Theta) = X}

Теорема Майерсона – Саттертуэйта

Основная статья: теорема Майерсона – Саттертуэйта

Майерсон и Саттертуэйт ( 1983) показывают, что для двух сторон не существует эффективного способа торговать товаром, если каждая из них имеет секретные и вероятностно разные оценки, без риска вынудить одну сторону торговать в убыток. Это один из самых замечательных отрицательных результатов в экономике - своего рода отрицательное зеркало фундаментальных теорем экономики благосостояния.

Примеры

Ценовая дискриминация

Миррлис  ( 1971) вводит настройку, в которой передаточную функцию t () легко найти. Из-за своей актуальности и управляемости это обычное дело в литературе. Рассмотрим настройку с одним хорошим и одним агентом, в которой агент имеет квазилинейную утилиту с параметром неизвестного типа. θ {\ displaystyle \ theta}

ты ( Икс , т , θ ) знак равно V ( Икс , θ ) - т {\ Displaystyle и (х, т, \ тета) = В (х, \ тета) -t}

и в котором принципал имеет более раннюю CDF по сравнению с типом агента. Принципал может производить товары с выпуклой предельной стоимостью c ( x) и хочет максимизировать ожидаемую прибыль от сделки. п ( θ ) {\ Displaystyle Р (\ тета)}

Максимум Икс ( θ ) , т ( θ ) E θ [ т ( θ ) - c ( Икс ( θ ) ) ] {\ Displaystyle \ макс _ {Икс (\ тета), т (\ тета)} \ mathbb {E} _ {\ тета} \ влево [т (\ тета) -с \ влево (х (\ тета) \ вправо) \верно]}

в соответствии с условиями IC и IR

ты ( Икс ( θ ) , т ( θ ) , θ ) ты ( Икс ( θ ) , т ( θ ) , θ )   θ , θ {\ Displaystyle и (Икс (\ тета), т (\ тета), \ тета) \ GEQ и (х (\ тета '), т (\ тета'), \ тета) \ \ forall \ тета, \ тета ' }
ты ( Икс ( θ ) , т ( θ ) , θ ) ты _ ( θ )   θ {\ Displaystyle и (Икс (\ тета), т (\ тета), \ тета) \ geq {\ underline {u}} (\ тета) \ \ forall \ theta}

Принципал здесь - монополист, пытающийся установить максимальную прибыль ценовую схему, в которой он не может определить тип клиента. Типичный пример - это авиакомпания, устанавливающая тарифы для деловых людей, туристов и студентов. Из-за условия IR он должен давать каждому типу достаточно хорошую сделку, чтобы побудить к участию. Из-за условия IC он должен давать каждому типу достаточно хорошую сделку, чтобы этот тип предпочел эту сделку сделке любого другого.

Уловка, предложенная Миррлисом (1971), состоит в том, чтобы использовать теорему об огибающей, чтобы исключить передаточную функцию из ожидания максимизации,

позволять  U ( θ ) знак равно Максимум θ ты ( Икс ( θ ) , т ( θ ) , θ ) {\ displaystyle {\ text {let}} U (\ theta) = \ max _ {\ theta '} и \ left (x (\ theta'), t (\ theta '), \ theta \ right)}
d U d θ знак равно ты θ знак равно V θ {\ displaystyle {\ frac {dU} {d \ theta}} = {\ frac {\ partial u} {\ partial \ theta}} = {\ frac {\ partial V} {\ partial \ theta}}}

Интеграция,

U ( θ ) знак равно ты _ ( θ 0 ) + θ 0 θ V θ ~ d θ ~ {\ Displaystyle U (\ theta) = {\ underline {u}} (\ theta _ {0}) + \ int _ {\ theta _ {0}} ^ {\ theta} {\ frac {\ partial V} { \ partial {\ tilde {\ theta}}}} d {\ tilde {\ theta}}}

где - некоторый тип индекса. Заменив совместимость со стимулом на максиму, θ 0 {\ displaystyle \ theta _ {0}} т ( θ ) знак равно V ( Икс ( θ ) , θ ) - U ( θ ) {\ Displaystyle Т (\ тета) = В (Икс (\ тета), \ тета) -U (\ тета)}

E θ [ V ( Икс ( θ ) , θ ) - ты _ ( θ 0 ) - θ 0 θ V θ ~ d θ ~ - c ( Икс ( θ ) ) ] знак равно E θ [ V ( Икс ( θ ) , θ ) - ты _ ( θ 0 ) - 1 - п ( θ ) п ( θ ) V θ - c ( Икс ( θ ) ) ] {\ displaystyle {\ begin {align} amp; \ mathbb {E} _ {\ theta} \ left [V (x (\ theta), \ theta) - {\ underline {u}} (\ theta _ {0}) - \ int _ {\ theta _ {0}} ^ {\ theta} {\ frac {\ partial V} {\ partial {\ tilde {\ theta}}}} d {\ tilde {\ theta}} - c \ left (x (\ theta) \ right) \ right] \\ amp; {} = \ mathbb {E} _ {\ theta} \ left [V (x (\ theta), \ theta) - {\ underline {u} } (\ theta _ {0}) - {\ frac {1-P (\ theta)} {p (\ theta)}} {\ frac {\ partial V} {\ partial \ theta}} - c \ left ( х (\ тета) \ право) \ право] \ конец {выровнено}}}

после интеграции по частям. Эта функция может быть максимизирована поточечно.

Поскольку он уже совместим со стимулами, разработчик может отказаться от ограничения IC. Если функция полезности удовлетворяет условию Спенса – Миррлиса, то существует монотонная функция. Ограничение IR можно проверить в состоянии равновесия и соответственно увеличить или уменьшить график сборов. Кроме того, обратите внимание на наличие в выражении степени опасности. Если распределение типов обладает свойством монотонного отношения рисков, FOC достаточно для решения для t (). Если нет, то необходимо проверить, выполняется ли ограничение монотонности (см. Выше достаточность ) повсюду в графиках распределения и сборов. Если нет, то дизайнер должен использовать глажку Майерсона. U ( θ ) {\ Displaystyle U (\ theta)} Икс ( θ ) {\ Displaystyle х (\ тета)}

Майерсон гладильная

Можно найти товар или график цен, который удовлетворяет условиям первого порядка, но не является монотонным. В таком случае необходимо «утюжить» график, выбрав какое-то значение, при котором функция будет сглажена.

В некоторых приложениях разработчик может решить условия первого порядка для графиков цен и распределения, но обнаружит, что они не являются монотонными. Например, в квазилинейной настройке это часто происходит, когда отношение рисков само по себе не является монотонным. Согласно условию Спенса-Миррлиса оптимальные графики цен и распределения должны быть монотонными, поэтому разработчик должен исключить любой интервал, в течение которого график меняет направление, сглаживая его.

Наглядно, что происходит это дизайнер считает оптимальным сгусток определенных типов вместе и дают им один и тот же контракт. Обычно дизайнер мотивирует более высокие типы выделиться, предлагая им более выгодную сделку. Если количество более высоких типов на марже недостаточно, разработчик не считает целесообразным предоставлять более низким типам уступку (так называемую информационную ренту ), чтобы взимать более высокие типы по контракту, зависящему от типа.

Рассмотрим принципала монополиста, продающего агентам с квазилинейной полезностью, как в приведенном выше примере. Предположим, что график распределения, удовлетворяющий условиям первого порядка, имеет один внутренний пик в точке и одну внутреннюю впадину в точке, показанной справа. Икс ( θ ) {\ Displaystyle х (\ тета)} θ 1 {\ displaystyle \ theta _ {1}} θ 2 gt; θ 1 {\ displaystyle \ theta _ {2}gt; \ theta _ {1}}

  • Следуя Майерсону (1981), сгладьте его, выбрав удовлетворительный Икс {\ displaystyle x} ϕ 2 ( Икс ) ϕ 1 ( Икс ) ( V Икс ( Икс , θ ) - 1 - п ( θ ) п ( θ ) 2 V θ Икс ( Икс , θ ) - c Икс ( Икс ) ) d θ знак равно 0 {\ displaystyle \ int _ {\ phi _ {2} (x)} ^ {\ phi _ {1} (x)} \ left ({\ frac {\ partial V} {\ partial x}} (x, \ theta) - {\ frac {1-P (\ theta)} {p (\ theta)}} {\ frac {\ partial ^ {2} V} {\ partial \ theta \, \ partial x}} (x, \ theta) - {\ frac {\ partial c} {\ partial x}} (x) \ right) d \ theta = 0} где - функция, обратная к отображению x, и - функция, обратная к отображению x в. То есть возвращает a до внутреннего пика и возвращает a после внутренней впадины. ϕ 1 ( Икс ) {\ Displaystyle \ phi _ {1} (х)} θ θ 1 {\ displaystyle \ theta \ leq \ theta _ {1}} ϕ 2 ( Икс ) {\ Displaystyle \ phi _ {2} (х)} θ θ 2 {\ displaystyle \ theta \ geq \ theta _ {2}} ϕ 1 {\ displaystyle \ phi _ {1}} θ {\ displaystyle \ theta} ϕ 2 {\ displaystyle \ phi _ {2}} θ {\ displaystyle \ theta}
  • Если немонотонная область граничит с границей пространства типов, просто установите соответствующую функцию (или обе) для типа границы. Если есть несколько регионов, см. Учебник для итеративной процедуры; может случиться так, что нужно гладить более одной кормушки вместе. Икс ( θ ) {\ Displaystyle х (\ тета)} ϕ ( Икс ) {\ Displaystyle \ фи (х)}

Доказательство

Доказательство использует теорию оптимального управления. Он рассматривает набор интервалов в немонотонной области, по которым он может сгладить график. Затем он пишет гамильтониан, чтобы получить необходимые условия для a в пределах интервалов [ θ _ , θ ¯ ] {\ displaystyle \ left [{\ underline {\ theta}}, {\ overline {\ theta}} \ right]} Икс ( θ ) {\ Displaystyle х (\ тета)} Икс ( θ ) {\ Displaystyle х (\ тета)}

  1. что удовлетворяет монотонность
  2. для которых ограничение монотонности не связывает границы интервала

Условие два гарантирует, что выполнение задачи оптимального управления повторно соединится с расписанием в исходной задаче на границах интервала (без скачков). Любой объект, удовлетворяющий необходимым условиям, должен быть плоским, потому что он должен быть монотонным и все же повторно соединяться на границах. Икс ( θ ) {\ Displaystyle х (\ тета)} Икс ( θ ) {\ Displaystyle х (\ тета)}

Как и прежде, максимизировать ожидаемый выигрыш от принципала, но на этот раз с учетом ограничения монотонности

Икс θ 0 {\ displaystyle {\ frac {\ partial x} {\ partial \ theta}} \ geq 0}

и использовать для этого гамильтониан с теневой ценой ν ( θ ) {\ Displaystyle \ ню (\ тета)}

ЧАС знак равно ( V ( Икс , θ ) - ты _ ( θ 0 ) - 1 - п ( θ ) п ( θ ) V θ ( Икс , θ ) - c ( Икс ) ) п ( θ ) + ν ( θ ) Икс θ {\ displaystyle H = \ left (V (x, \ theta) - {\ underline {u}} (\ theta _ {0}) - {\ frac {1-P (\ theta)} {p (\ theta)) }} {\ frac {\ partial V} {\ partial \ theta}} (x, \ theta) -c (x) \ right) p (\ theta) + \ nu (\ theta) {\ frac {\ partial x } {\ partial \ theta}}}

где - переменная состояния и элемент управления. Как обычно при оптимальном управлении, уравнение эволюции затрат должно удовлетворять Икс {\ displaystyle x} Икс / θ {\ Displaystyle \ частичный х / \ частичный \ тета}

ν θ знак равно - ЧАС Икс знак равно - ( V Икс ( Икс , θ ) - 1 - п ( θ ) п ( θ ) 2 V θ Икс ( Икс , θ ) - c Икс ( Икс ) ) п ( θ ) {\ displaystyle {\ frac {\ partial \ nu} {\ partial \ theta}} = - {\ frac {\ partial H} {\ partial x}} = - \ left ({\ frac {\ partial V} {\ частичный x}} (x, \ theta) - {\ frac {1-P (\ theta)} {p (\ theta)}} {\ frac {\ partial ^ {2} V} {\ partial \ theta \, \ partial x}} (x, \ theta) - {\ frac {\ partial c} {\ partial x}} (x) \ right) p (\ theta)}

Воспользовавшись условием 2, обратите внимание, что ограничение монотонности не является обязательным на границах интервала, θ {\ displaystyle \ theta}

ν ( θ _ ) знак равно ν ( θ ¯ ) знак равно 0 {\ displaystyle \ nu ({\ underline {\ theta}}) = \ nu ({\ overline {\ theta}}) = 0}

означает, что условие переменной стоимости может быть интегрировано и также равно 0

θ _ θ ¯ ( V Икс ( Икс , θ ) - 1 - п ( θ ) п ( θ ) 2 V θ Икс ( Икс , θ ) - c Икс ( Икс ) ) п ( θ ) d θ знак равно 0 {\ displaystyle \ int _ {\ underline {\ theta}} ^ {\ overline {\ theta}} \ left ({\ frac {\ partial V} {\ partial x}} (x, \ theta) - {\ frac {1-P (\ theta)} {p (\ theta)}} {\ frac {\ partial ^ {2} V} {\ partial \ theta \, \ partial x}} (x, \ theta) - {\ frac {\ partial c} {\ partial x}} (x) \ right) p (\ theta) \, d \ theta = 0}

Среднее искажение излишка основного долга должно быть 0. Чтобы сгладить график, найдите такое, чтобы его обратное изображение отображалось в интервал, удовлетворяющий вышеуказанному условию. Икс {\ displaystyle x} θ {\ displaystyle \ theta}

Смотрите также

Заметки

Рекомендации

дальнейшее чтение

Внешние ссылки

  • Эрик Маскин " Лекция о присуждении Нобелевской премии ", прочитанная 8 декабря 2007 г. в Аула Магна, Стокгольмский университет.
Последняя правка сделана 2024-01-02 04:18:26
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте