Поправка Хекмана - это статистический метод коррекции смещения из неслучайно выбранных выборок или иным образом случайно усеченных зависимых переменные, распространенная проблема количественных социальных наук при использовании данных наблюдений. Концептуально это достигается путем явного моделирования индивидуальной вероятности выборки каждого наблюдения (так называемое уравнение выбора) вместе с условным ожиданием зависимой переменной (так называемый результат уравнение). Результирующая функция правдоподобия математически похожа на модель Тобита для цензурированных зависимых переменных, связь, впервые проведенную Джеймсом Хекманом в 1976 году. Хекман также разработал двухэтапный подход функции управления для оценки этой модели, который позволяет избежать вычислительной нагрузки, связанной с необходимостью оценивать оба уравнения вместе, хотя и за счет неэффективности. Хекман получил Нобелевскую премию по экономическим наукам в 2000 году за свою работу в этой области.
Статистический анализ, основанный на неслучайно выбранных выборках, может привести к ошибочным выводам. Коррекция Хекмана, двухэтапный статистический подход, предлагает средства корректировки неслучайно выбранных выборок.
Хекман рассмотрел предвзятость из-за использования неслучайно выбранных выборок для оценки поведенческих отношений как ошибку спецификации. Он предлагает двухэтапный метод оценки для исправления смещения. Коррекция использует идею функции управления и ее легко реализовать. Поправка Хекмана включает допущение нормальности, предоставляет тест на смещение выборки и формулу для модели с поправкой на смещение.
Предположим, что исследователь хочет оценить определяющие факторы предложения заработной платы, но имеет доступ к наблюдениям за заработной платой только для тех, кто работает. Поскольку работающие люди выбираются из совокупности неслучайно, оценка детерминант заработной платы из работающей подгруппы населения может внести систематическую ошибку. Коррекция Хекмана проходит в два этапа.
На первом этапе исследователь формулирует модель вероятности работы, основанную на экономической теории. Каноническая спецификация для этого отношения - регрессия пробит формы
где D обозначает занятость (D = 1, если респондент работает, и D = 0 в противном случае), Z - вектор независимых переменных, - это вектор неизвестных параметров, а Φ - кумулятивная функция распределения стандартного нормального распределения. Оценка модели дает результаты, которые можно использовать для прогнозирования этой вероятности трудоустройства для каждого человека.
На втором этапе исследователь корректирует самостоятельный выбор путем включения преобразования этих предсказанных индивидуальных вероятностей в качестве дополнительной объясняющей переменной. Уравнение заработной платы может быть указано:
где обозначает основное предложение заработной платы, которое не соблюдается, если респондент не работает. Тогда условное ожидание заработной платы при условии, что человек работает, составляет
В предположении, что условия ошибки равны вместе нормально, мы имеем
где ρ - корреляция между ненаблюдаемыми детерминантами склонности к работе и ненаблюдаемыми детерминантами предложения заработной платы u, σ u - стандартное отклонение , а - обратное соотношение Миллса вычисляется как . Это уравнение демонстрирует понимание Хекмана о том, что выборку можно рассматривать как форму смещения пропущенных переменных, как условную как для X, так и для it как если бы образец был выбран случайным образом. Уравнение заработной платы можно оценить, заменив оценками Пробита из первого этапа, построив термин, и включение его в качестве дополнительной объясняющей переменной в линейную регрессию оценку уравнения заработной платы. Поскольку , коэффициент при может быть равен нулю, только если , поэтому проверка нуля, когда коэффициент при равен нулю, эквивалентна проверке выборочной селективности.
Достижения Хекмана породили большое количество эмпирических приложений в экономике, а также в других социальных науках. Оригинальный метод впоследствии был обобщен Хекманом и другими.
Поправка Хекмана - это двухэтапная M-оценка, в которой ковариационная матрица, сгенерированная OLS-оценкой второго этапа, несовместима. Исправить стандартные ошибки и другую статистику можно сгенерировать с помощью асимптотического приближения или повторной выборки, например, через gh a bootstrap.
sampleSelection
.heckman
предоставляет модель выбора Хекмана.