Ожидаемая ценность точной информации

редактировать

В теории принятия решений ожидаемая ценность точной информации (EVPI) - это цена, которую можно было бы заплатить платите, чтобы получить доступ к точной информации. Общая дисциплина, использующая концепцию EVPI, - это экономика здравоохранения. В этом контексте и при рассмотрении решения о том, следует ли применять новую технологию лечения, всегда существует некоторая степень неопределенности, связанная с этим решением, потому что всегда есть шанс, что решение окажется неправильным. Ожидаемая ценность анализа точной информации пытается измерить ожидаемую стоимость этой неопределенности, которую «можно интерпретировать как ожидаемую ценность точной информации (EVPI), поскольку точная информация может исключить возможность ошибочной решение », по крайней мере, с теоретической точки зрения.

Содержание
  • 1 Уравнение
  • 2 Пример
  • 3 См. также
  • 4 Ссылки
Уравнение

Проблема моделируется с помощью матрица выигрыша Rij, в которой индекс строки i описывает выбор, который должен сделать игрок, а индекс столбца j описывает случайную переменную, о которой игрок еще не знает, с вероятностью p j нахождения в состоянии j. Если игрок должен выбрать i, не зная значения j, лучшим выбором будет тот, который максимизирует ожидаемую денежную ценность :

EMV = max i ∑ jpj R ij {\ displaystyle {\ t_dv {EMV}} = \ max _ {i} \ sum _ {j} p_ {j} R_ {ij}}{\ displaystyle {\ t_dv {EMV}} = \ max _ { i} \ sum _ {j} p_ {j} R_ {ij}}

где

∑ jpj R ij {\ displaystyle \ sum _ {j} p_ {j} R_ {ij} }{\ displaystyle \ sum _ {j} p_ {j} R_ {ij}}

- ожидаемый выигрыш за действие i, т.е. значение ожидание, и

EMV = max i {\ displaystyle {\ t_dv {EMV}} = \ max _ {i}}{\ displaystyle {\ t_dv {EMV}} = \ max _ {i}}

выбирает максимум из этих ожиданий для всех доступных действий. С другой стороны, зная j, игрок может выбрать значение i, которое оптимизирует ожидание для этого конкретного j. Следовательно, ожидаемое значение с учетом точной информации равно

EV | PI = ∑ jpj (макс я R ij), {\ displaystyle {\ t_dv {EV}} | {\ t_dv {PI}} = \ sum _ {j} p_ {j} (\ max _ {i} R_ {ij }),}{\ displaystyle {\ t_dv {EV}} | {\ t_dv {PI}} = \ sum _ {j} p_ {j} (\ max _ {i} R_ {ij}),}

где pj {\ displaystyle p_ {j}}p_ {j} - вероятность того, что система находится в состоянии j, а R ij {\ displaystyle R_ {ij} }R_ {ij} - это выплата, если следовать за действием i, когда система находится в состоянии j. Здесь (max i R i j), {\ displaystyle (\ max _ {i} R_ {ij}),}{\ displaystyle (\ max _ {i} R_ {ij}),} указывает лучший выбор действия i для каждого состояния j.

Ожидаемое значение точной информации - это разница между этими двумя величинами,

EVPI = EV | PI - EMV. {\ displaystyle {\ t_dv {EVPI}} = {\ t_dv {EV}} | {\ t_dv {PI}} - {\ t_dv {EMV}}.}{\ displaystyle {\ t_dv {EVPI}} = {\ t_dv {EV}} | {\ t_dv {PI}} - {\ t_dv {EMV}}.}

Эта разница описывает, в ожидании, насколько больше значение, которое игрок может надеяться получить, зная j и выбирая лучшее i для этого j, по сравнению с выбором значения i до того, как j станет известен. Поскольку EV | PI обязательно больше или равно EMV, EVPI всегда неотрицательно.

EVPI предоставляет критерий, по которому можно судить обычных недостаточно информированных прогнозистов. EVPI можно использовать для отклонения дорогостоящих предложений: если кому-то предлагают знания по цене, превышающей EVPI, лучше отказаться от предложения. Однако это менее полезно при принятии решения о том, принимать ли предложение о прогнозировании, потому что нужно знать качество информации, которую он получает.

Пример

Настройка:

Предположим, вы собираетесь инвестировать только в один из трех инвестиционных инструментов: акции, паевой инвестиционный фонд или депозитный сертификат (CD). Далее предположим, что у рынка есть 50% -ный шанс роста, 30% -ный шанс остаться в норме и 20% -ый шанс спада. Если рынок вырастет, вложения в акции принесут 1500 долларов, а паевой инвестиционный фонд - 900 долларов. Если рынок останется, даже вложения в акции принесут 300 долларов, а взаимный фонд - 600 долларов. Если рынок упадет, вложения в акции потеряют 800 долларов, а паевой инвестиционный фонд - 200 долларов. Депозитный сертификат будет приносить 500 долларов независимо от колебаний рынка.

Вопрос:

Какова ожидаемая ценность точной информации?

Решение:

Здесь матрица выплат:

R = [1500 300 - 800 900 600 - 200 500 500 500] {\ displaystyle R = {\ begin {bmatrix} 1500 300 -800 \\ 900 600 -200 \\ 500 500 500 \ end {bmatrix}}}{\ displaystyle R = {\ begin {bmatrix} 1500 300 -800 \\ 900 600 -200 \\ 500 500 500 \ end {bmatrix}}}

Вектор вероятности:

p = [0,5 0,3 0,2] {\ displaystyle p = {\ begin {bmatrix} 0,5 \\ 0,3 \\ 0.2 \ end {bmatrix}}}{\ displaystyle p = {\ begin {bmatrix} 0,5 \\ 0,3 \\ 0,2 \ end {bmatrix}}}

Ожидание для каждой машины (R p {\ displaystyle Rp}{\ displaystyle Rp} ):

Запас опыта = 0,5 × 1500 + 0,3 × 300 + 0,2 × (- 800) = 680 {\ displaystyle {\ t_dv {Exp}} _ {\ text {stock}} = 0,5 \ times 1500 + 0,3 \ times 300 + 0,2 \ times (-800) = 680}{\ displaystyle {\ t_dv {Exp}} _ {\ text {акции}} = 0,5 \ раз 1500 + 0,3 \ раз 300 + 0,2 \ раз (-800) = 680}
Exp взаимный фонд = 0,5 × 900 + 0,3 × 600 + 0,2 × (- 200) = 590 {\ displaystyle {\ t_dv {Exp}} _ {\ text {взаимный фонд}} = 0,5 \ times 900 + 0,3 \ times 600+ 0,2 \ times (-200) = 590}{\ displaystyle {\ t_dv {Exp}} _ {\ text {взаимный фонд}} = 0,5 \ умножить на 900 + 0,3 \ умножить на 600 + 0,2 \ раз (-200) = 590}
Депозитный сертификат Exp = 0,5 × 500 + 0,3 × 500 + 0,2 × 500 = 500 {\ displaystyle {\ t_dv {Exp}} _ {\ text {депозитный сертификат} } = 0,5 \ раз 500 + 0,3 \ раз 500 + 0,2 \ раз 500 = 500}{\ displaystyle {\ t_dv {Exp}} _ {\ text {сертификат депозита}} = 0,5 \ раз 500 + 0,3 \ раз 500 + 0,2 \ раз 500 = 500}

Максимум этих ожиданий - серийный автомобиль. Не зная, в каком направлении пойдет рынок (зная только вероятность направлений), мы ожидаем, что больше всего денег заработаем на биржевом рынке.

Таким образом,

EMV = 680 {\ displaystyle {\ t_dv {EMV}} = 680}{\ t_dv { EMV}} = 680

С другой стороны, подумайте, знали ли мы заранее, в какую сторону развернется рынок. Зная направление рынка, мы (потенциально) примем другое решение об инвестиционном инструменте.

Ожидание максимизации прибыли с учетом состояния рынка:

EV | PI = 0,5 × 1500 + 0,3 × 600 + 0,2 × 500 = 1030 {\ displaystyle {\ t_dv {EV}} | {\ t_dv {PI}} = 0,5 \ times 1500 + 0,3 \ times 600 + 0,2 \ times 500 = 1030 }{\ t_dv {EV}} | {\ t_dv {PI}} = 0,5 \ раз 1500 + 0,3 \ раз 600 + 0,2 \ раз 500 = 1030

То есть, учитывая каждое направление рынка, мы выбираем инвестиционный инструмент, который максимизирует прибыль.

Следовательно,

EVPI = EV | PI - EMV = 1030 - 680 = 350. {\ displaystyle {\ t_dv {EVPI}} = {\ t_dv {EV}} | {\ t_dv {PI}} - {\ t_dv {EMV}} = 1030-680 = 350.}{\ displaystyle {\ t_dv {EVPI}} = {\ t_dv {EV}} | {\ t_dv {PI}} - {\ t_dv {EMV}} = 1030–680 = 350.}

Заключение:

Знание направления движения рынка (т.е. наличие точной информации) стоит 350 долларов.

Обсуждение:

Если кто-то продавал информацию, которая гарантировала точное предсказание будущего направления рынка, мы хотели бы покупать эту информацию только в том случае, если цена была меньше 350 долларов. Если цена превышала 350 долларов, мы не покупали информацию, если цена была меньше 350 долларов, мы покупали информацию. Если цена была ровно 350 долларов, то наше решение бесполезно.

Предположим, стоимость информации составила 349,99 доллара США, и мы ее купили. Тогда мы ожидаем получить 1030 - 349,99 = 680,01>680. Таким образом, купив информацию, мы смогли заработать на 0,01 доллара больше, чем если бы мы не покупали информацию.

Предположим, стоимость информации составляла 350,01 доллара США, и мы ее купили. Тогда мы ожидаем, что получим 1030 - 350,01 = 679,99 < 680. Therefore, by purchasing the information we lost $0.01 when compared to not having purchased the information.

Предположим, что цена информации составляет 350 долларов США, и мы ее купили. Тогда мы ожидаем получить 1030 - 350,00 = 680,00 = 680. Следовательно, покупая информацию, мы не получали и не теряли никаких денег, решив купить эту информацию, по сравнению с тем, чтобы не покупать информацию.

Примечание. В качестве практического примера, использование денег для покупки предметов связано с расходами (временная стоимость денег), которые также необходимо учитывать.

См. Также
Ссылки
Последняя правка сделана 2021-05-19 09:52:49
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте