Двоичная регрессия

редактировать

В статистике, в частности регрессионном анализе, двоичная регрессия оценивает взаимосвязь между одной или несколькими независимыми переменными и одиночная выходная двоичная переменная. Обычно моделируется вероятность двух альтернатив, вместо того, чтобы просто выводить одно значение, как в линейной регрессии.

Двоичная регрессия обычно анализируется как частный случай биномиальной регрессии с одним результат (n = 1 {\ displaystyle n = 1}n = 1 ), и одна из двух альтернатив, рассматриваемая как «успех» и кодируемая как 1: значение - это количество успехов в 1 испытании, либо 0, либо 1. Наиболее распространенными моделями бинарной регрессии являются логит-модель (логистическая регрессия ) и пробит-модель (пробит-регрессия ).

Содержание
  • 1 Приложения
  • 2 Интерпретации
    • 2.1 Модель со скрытыми переменными
    • 2.2 Вероятностная модель
  • 3 См. Также
  • 4 Ссылки
Приложения

Двоичная регрессия в основном применяется либо для прогнозирования (двоичная классификация ), либо для оценки ассоциации между независимыми переменными и выходными данными. В экономике бинарные регрессии используются для моделирования бинарного выбора.

Интерпретации

Модели бинарной регрессии можно интерпретировать как модели скрытых переменных вместе с моделью измерения; или как вероятностные модели, непосредственно моделирующие вероятность.

Модель скрытых переменных

Интерпретация скрытых переменных традиционно использовалась в биоанализе, что привело к пробит-модели, где нормальная дисперсия и пороговое значение предполагается. Интерпретация скрытой переменной также используется в теории ответа элемента (IRT).

Формально интерпретация скрытой переменной утверждает, что результат y связан с вектором независимых переменных x следующим образом:

y = 1 [y ∗>0] {\ displaystyle y = 1 [y ^ {* }>0]}{\displaystyle y=1[y^{*}>0]}

где y ∗ = x β + ε {\ displaystyle y ^ {*} = x \ beta + \ varepsilon}{\ displaystyle y ^ {*} = x \ beta + \ varepsilon} и ε ∣ x ∼ G {\ displaystyle \ varepsilon \ mid x \ sim G}{\ displaystyle \ varepsilon \ mid x \ sim G} , β - это вектор параметров, а G - распределение вероятностей.

Эта модель может применяться во многих в экономическом контексте. Например, результатом может быть решение менеджера инвестировать в программу, y ∗ {\ displaystyle y ^ {*}}y ^ {*} - ожидаемая чистая дисконтированная денежная сумма. flow, а x - вектор переменных, которые могут повлиять на денежный поток этой программы. Тогда менеджер будет инвестировать только в том случае, если он ожидает, что чистый дисконтированный денежный поток будет положительным.

Часто ошибка тер Предполагается, что m ε {\ displaystyle \ varepsilon}\ varepsilon следует нормальному распределению, обусловленному независимыми переменными x. Это генерирует стандартную пробит-модель.

Вероятностную модель

Простейшей прямой вероятностной моделью является логит-модель, которая моделирует логарифмические шансы как линейная функция независимой переменной или переменных. Логит-модель является «самой простой» в смысле обобщенных линейных моделей (GLIM): логарифмические шансы являются естественным параметром для экспоненциального семейства распределения Бернулли, и, следовательно, самый простой в использовании для вычислений.

Еще одна прямая вероятностная модель - это линейная вероятностная модель, которая моделирует саму вероятность как линейную функцию независимых переменных. Недостатком линейной вероятностной модели является то, что для некоторых значений независимых переменных модель будет предсказывать вероятности меньше нуля или больше единицы.

См. Также
Ссылки
Последняя правка сделана 2021-05-12 06:26:05
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте