В теории принятия решений, теорема фон Неймана-Моргенштерна (или VNM ) теорема полезности показывает, что при определенных аксиомах рационального поведение, лицо, принимающее решения, столкнувшееся с рискованными (вероятными) исходами различных вариантов выбора, будет вести себя так, как если бы он или она максимизировали ожидаемое значение некоторой функции, определенной над потенциалом результаты в определенный момент в будущем. Эта функция известна как функция полезности фон Неймана – Моргенштерна. Эта теорема лежит в основе теории ожидаемой полезности.
В 1947 году Джон фон Нейман и Оскар Моргенштерн доказали, что любой человек, предпочтения удовлетворяют четыре аксиома имеет функцию полезности ; предпочтения такого человека могут быть представлены на шкале интервалов, и этот человек всегда будет отдавать предпочтение действиям, которые максимизируют ожидаемую полезность. То есть они доказали, что агент является (VNM-) рациональным тогда и только тогда, когда существует действительная функция u, определяемая возможными исходами, такая, что каждое предпочтение агента характеризуется максимизацией ожидаемого значения u, которое затем может быть определенным как VNM-утилита агента (уникальна с точностью до добавления константы и умножения на положительный скаляр). Не утверждается, что агент имеет «сознательное желание» максимизировать u, только то, что u существует.
Гипотеза ожидаемой полезности заключается в том, что рациональность может быть смоделирована как максимизация ожидаемого значения, которое с учетом теоремы можно резюмировать как «рациональность - это VNM-рациональность». Однако сами аксиомы подвергались критике по разным причинам, в результате чего аксиомы получили дополнительное обоснование.
VNM-полезность - это полезность принятия решений, поскольку она используется для описания предпочтений в принятии решений. Это связано, но не эквивалентно так называемым E-утилитам (утилитам опыта), понятиям полезности, предназначенным для измерения счастья, таким как Бентам Принцип величайшего счастья.
В теореме отдельный агент сталкивается с опциями, называемыми лотереями. Учитывая некоторые взаимоисключающие исходы, лотерея - это сценарий, в котором каждый исход будет происходить с заданной вероятностью, причем все вероятности в сумме равны единице. Например, для двух исходов A и B
обозначает сценарий, в котором P (A) = 25% - это вероятность A встречающихся и P (B) = 75% (и произойдет ровно одно из них). В более общем смысле, для лотереи со многими возможными исходами A i мы пишем:
с суммой s, равной 1.
Результаты лотереи сами могут быть лотереями между другими исходами, и расширенное выражение считается эквивалентной лотереей: 0,5 (0,5A + 0,5B) + 0,5C = 0,25A + 0,25B + 0,50C.
Если лотерея M предпочтительнее лотереи L, мы пишем или, что эквивалентно, . Если агент безразличен между L и M, запишем отношение безразличия Если M предпочтительнее или рассматривается безразлично по отношению к L, мы пишем
Таким образом, четыре аксиомы VNM-рациональности - это полнота, транзитивность, непрерывность и независимость.
Полнота предполагает, что у человека есть четко определенные предпочтения:
(либо предпочтительнее M, либо L, либо индивидууму безразлично.
Транзитивность предполагает, что предпочтения одинаковы для любых трех вариантов:
Непрерывность предполагает, что существует «переломный момент» между тем, чтобы быть лучше или хуже, чем данный средний вариант:
где обозначение в левой части относится к ситуации, в которой L получено с вероятностью p, а N получено с вероятностью (1 – p).
Вместо непрерывности можно предположить альтернативную аксиому, которая не предполагает точного равенства, называемого свойством Архимеда. В нем говорится, что любое разделение предпочтений может поддерживаться при достаточно малом отклонении вероятностей:
Только одно из (3) или (3 ′) необходимо принять, а другое следует из теоремы.
Независимость нерелевантных альтернатив предполагает, что предпочтение сохраняется независимо от возможности другого результата:
Из аксиомы независимости следует аксиома редукции соединения лотереи:
Чтобы увидеть, как из аксиомы 4 следует аксиома 4 ', набор в t Выражение в аксиоме 4 и расширение.
Для любого VNM-рационального агента (т. Е. Удовлетворяющего аксиомам 1–4) существует функция u, которая присваивает каждому исходу A действительное число u (A) такое, что для любые две лотереи,
где E (u (L)), или, короче, Eu (L) задается как
Таким образом, u может быть однозначно определено (вплоть до добавления константы и умножения на положительный скаляр) предпочтениями между простыми лотереями, то есть лотереями формы pA + (1 - p) B, имеющими только два исхода. И наоборот, любой агент, действующий, чтобы максимизировать математическое ожидание функции u, будет подчиняться аксиомам 1–4. Такая функция называется функцией агента фон Неймана – Моргенштерна (VNM) .
Доказательство конструктивно: оно показывает, как искомая функция можно построить. Здесь мы очерчиваем процесс построения для случая, когда количество надежных исходов конечно.
Предположим, есть n верных исходов, . Обратите внимание, что каждый гарантированный исход можно рассматривать как лотерею: это вырожденная лотерея, в которой исход выбирается с вероятностью 1. Следовательно, согласно аксиомам полноты и транзитивности можно упорядочить исходы от худшего к лучшему:
Мы предполагаем, что хотя бы одно из неравенств является строгим ( в противном случае функция полезности тривиальна - постоянна). Итак, . Мы используем эти два крайних результата - худший и лучший - в качестве единицы масштабирования нашей функции полезности и определяем:
для любой вероятности , определите лотерею, которая выбирает лучший результат с вероятностью и худший результат в противном случае:
Обратите внимание, что и .
По аксиоме непрерывности для каждого гарантированного результата существует вероятность такие, что:
и
для каждого , функция полезности для результата определяется как
, поэтому полезность каждой лотереи - это ожидание u:
Чтобы понять, почему эта функция полезности имеет смысл, рассмотрим лотерею , который выбирает результат с вероятностью . Но, по нашему предположению, лицо, принимающее решение, безразлично между надежным исходом и лотереей . Таким образом, по аксиоме редукции, ему безразлична лотерея и следующая лотерея:
лотерея , по сути, лотерея, в которой лучший результат выигрывается с вероятностью , и худший исход в противном случае.
Следовательно, если , человек, принимающий рациональные решения, предпочел бы лотерею вместо лотереи , потому что это дает ему больше шансов выиграть лучший результат.
Следовательно:
Фон Нейман и Моргенштерн ожидали удивление силой их вывода. Но, по их мнению, их функция полезности работает именно потому, что она построена именно для того, чтобы исполнять роль чего-то, чьи ожидания максимальны:
«Многие экономисты почувствуют, что мы слишком много предполагаем. много... Не слишком ли много мы показали?... Насколько мы можем видеть, наши постулаты [правдоподобны... Мы практически определили числовую полезность как то, для чего обоснован расчет математических ожиданий ”- VNM 1953, § 3.1.1 с. 16 и § 3.7.1 стр. 28
Таким образом, содержание теоремы состоит в том, что построение u возможно, и они мало что заявляют о его природе.
Часто бывает, что человек, столкнувшийся с реальными азартными играми с деньгами, не предпринимает никаких действий для максимизации ожидаемой стоимости своих долларовых активов. Например, человек, у которого есть сбережения всего в 1000 долларов, может неохотно рисковать всем ради 20% шансов выиграть 10000 долларов, даже если
Однако, если человек является VNM-рациональным, такие факты автоматически учитываются в его функции полезности u. В этом примере мы можем заключить, что
, где суммы в долларах здесь действительно представляют результаты (см. «значение »), три возможных ситуации, с которыми может столкнуться человек. В частности, u может проявлять такие свойства, как u ($ 1) + u ($ 1) ≠ u ($ 2), вообще не противореча VNM-рациональности. Это приводит к количественной теории неприятия денежного риска.
В 1738 году Даниэль Бернулли опубликовал трактат, в котором постулирует это рациональное поведение. можно описать как максимизацию математического ожидания функции u, которая, в частности, не обязательно должна быть оценена в денежном выражении, что позволяет учитывать уклонение от риска. Это гипотеза ожидаемой полезности. Как уже говорилось, эта гипотеза может показаться смелой. Цель теоремы об ожидаемой полезности - предоставить «скромные условия» (т. Е. Аксиомы), описывающие, когда выполняется гипотеза ожидаемой полезности, которые можно оценить напрямую и интуитивно:
«Аксиом не должно быть слишком много, их система должна быть как можно более простым и прозрачным, и каждая аксиома должна иметь непосредственное интуитивное значение, по которому можно напрямую судить о ее уместности. В ситуации, подобной нашей, это последнее требование особенно важно, несмотря на его расплывчатость: мы хотим сделать интуитивное концепция поддается математической обработке и позволяет как можно более четко увидеть, какие гипотезы для этого требуются ». - ВНМ 1953 § 3.5.2, с. 25
Таким образом, утверждения о том, что гипотеза ожидаемой полезности не характеризует рациональность, должны отвергать одну из аксиом VNM. Возникло множество обобщенных теорий ожидаемой полезности, большинство из которых опускают или ослабляют аксиому независимости.
Поскольку теорема ничего не предполагает о природе возможных исходов азартных игр, они могут быть морально значимыми событиями, например, связанными с жизнью, смертью, болезнью, или здоровье других. Рациональный агент фон Неймана-Моргенштерна способен действовать с большой заботой о таких событиях, жертвуя большим личным богатством или благополучием, и все эти действия будут учитываться при построении / определении функции VNM-полезности агента. Другими словами, как то, что естественно воспринимается как «личная выгода», так и то, что естественно воспринимается как «альтруизм», неявно сбалансированы в функции полезности VNM рационального индивида. Таким образом, весь диапазон поведения , ориентированного на агента, или нейтрального к агенту возможен с помощью различных служебных функций VNM.
Если полезность равна , рациональный агент фон Неймана – Моргенштерна должно быть безразлично между и . Поэтому ориентированный на агента рациональный агент фон Неймана-Моргенштерна не может поддерживать более равное или «справедливое» распределение полезности между его собственными возможными будущими я.
Некоторые утилитарные моральные теории связаны с величинами, называемыми «общая полезность» и «средняя полезность» коллективов, и характеризуют мораль в условия одобрения полезности или счастья других с пренебрежением к собственному. Эти понятия могут быть связаны с VNM-утилитой, но отличны от нее:
Термин E-полезность для «полезности опыта» был придуман для обозначения типов «гедонистической» полезности, подобных тому, который используется в принципе наибольшего счастья Бентама. Поскольку мораль влияет на решения, мораль VNM-рационального агента будет влиять на определение его собственной функции полезности (см. Выше). Таким образом, мораль VNM-рационального агента может быть охарактеризована корреляцией VNM-полезности агента с VNM-полезностью, E-полезностью или «счастьем» других, среди других средств, но не игнорированием собственного VNM-утилита, противоречие в терминах.
Поскольку если L и M лотереи, то pL + (1 - p) M просто «расширяется» и считается самой лотереей, формализм VNM игнорирует то, что может восприниматься как «вложенная игра». Это связано с проблемой Эллсберга, когда люди предпочитают избегать восприятия рисков относительно рисков. Фон Нейман и Моргенштерн признали это ограничение:
«... такие концепции, как особая полезность азартных игр, не могут быть сформулированы без противоречий на этом уровне. Это может показаться парадоксальным утверждением. Но любой, кто серьезно попытался аксиоматизировать это неуловимая концепция, вероятно, согласится с ней ». - ВНМ 1953 § 3.7.1, с. 28.
Поскольку для любых двух VNM-агентов X и Y определяются только их VNM-полезные функции u X и u Y вплоть до аддитивных констант и мультипликативных положительных скаляров, теорема не предоставляет никакого канонического способа их сравнения. Отсюда такие выражения, как u X (L) + u Y (L) и u X (L) - u Y (L) не определены канонически, равно как и сравнения типа u X (L) < uY (L) канонически не верны или ложны. В частности, вышеупомянутые «общая VNM-полезность» и «средняя VNM-полезность» популяции не имеют канонического смысла без предположений о нормализации.
Показано, что гипотеза ожидаемой полезности имеет ограниченную точность прогнозов в ряде лабораторных эмпирических экспериментов, таких как парадокс Алле. Это заставляет некоторых людей интерпретировать как свидетельство того, что