Методика оценки параметров в статистике, особенно в эконометрике
В эконометрике и статистика, обобщенный метод моментов (GMM ) - это общий метод оценки параметров в статистических моделях. Обычно он применяется в контексте полупараметрических моделей, где интересующий параметр является конечномерным, тогда как полная форма функции распределения данных может быть неизвестна, и поэтому оценка максимального правдоподобия не применимо.
Метод требует, чтобы для модели было указано определенное количество моментов. Эти моментные условия являются функциями параметров модели и данных, так что их ожидание равно нулю при истинных значениях параметров. Затем метод GMM минимизирует определенную норму выборочных средних значений моментов, и поэтому его можно рассматривать как частный случай оценки минимального расстояния.
Оценщики GMM известны как непротиворечивые, асимптотически нормальные и эффективные в классе всех оценок, которые не используют никаких дополнительных информация помимо той, что содержится в настоящих условиях. GMM был предложен Ларсом Питером Хансеном в 1982 году как обобщение метода моментов, введенного Карлом Пирсоном в 1894 году. Однако эти оценки математически эквивалентны к тем, которые основаны на «условиях ортогональности» (Sargan, 1958, 1959) или «уравнениях несмещенной оценки» (Huber, 1967; Wang et al., 1997).
Содержание
- 1 Описание
- 2 Свойства
- 2.1 Согласованность
- 2.2 Асимптотическая нормальность
- 2.3 Эффективность
- 3 Реализация
- 4 J-тест Саргана – Хансена
- 5 Область применения
- 6 Реализации
- 7 См. Также
- 8 Ссылки
- 9 Дополнительная литература
Описание
Предположим, что доступные данные состоят из T наблюдений {Y t}t = 1,..., T, где каждое наблюдение Y t является n-мерной многомерной случайной величиной. Мы предполагаем, что данные поступают из некой статистической модели, определенной с точностью до неизвестного параметра θ ∈ Θ. Цель задачи оценки - найти «истинное» значение этого параметра, θ 0, или, по крайней мере, достаточно близкую оценку.
Общее предположение GMM состоит в том, что данные Y t генерируются слабо стационарным эргодическим случайным процессом. (Случай независимых и одинаково распределенных (iid) переменных Y t является частным случаем этого условия.)
Чтобы применить GMM, нам необходимо имеют "моментные условия", то есть нам нужно знать вектор-функцию g (Y, θ) такую, что
, где E обозначает ожидание, а Y t является общим наблюдением. Более того, функция m (θ) должна отличаться от нуля для θ ≠ θ 0, в противном случае параметр θ не будет идентифицирован в точке- .
Основная идея GMM заключается в замене теоретической математическое ожидание E [⋅] с его эмпирическим аналогом - выборочное среднее:
, а затем минимизировать норму этого выражения относительно к θ. Минимизирующее значение θ - это наша оценка для θ 0.
. По закону больших чисел, для больших значений T, поэтому мы ожидаем, что . Обобщенный метод моментов ищет число , которое составило бы как можно ближе к нулю. Математически это эквивалентно минимизации определенной нормы (норма m, обозначается как | | m ||, измеряет расстояние между m и нулем). Свойства полученной оценки будут зависеть от конкретного выбора функции нормы, и поэтому теория GMM рассматривает все семейство норм, определяемое как
, где W - положительно-определенная матрица весов, а обозначает транспонирование. На практике весовая матрица W вычисляется на основе доступного набора данных, который будет обозначаться как . Таким образом, оценка GMM может быть записана как
При подходящих условиях эта оценка непротиворечива, асимптотически нормальный и с правильным выбором матрицы весов также асимптотически эффективный.
Свойства
Согласованность
Согласованность - это статистическое свойство оценщика, указывающее, что, имея достаточное количество наблюдений, оценщик сходится с вероятностью к истинному значению параметра:
Достаточные условия для оценки GMM быть последовательными:
- где W положительная полуопределенная матрица,
- только для
- пробел возможных параметров компактный,
- непрерывно в каждом θ с вероятностью единица,
Второе условие здесь (так -названное условие глобальной идентификации ) часто особенно трудно проверить. Существуют более простые необходимые, но недостаточные условия, которые могут использоваться для обнаружения проблемы, не связанной с идентификацией:
- Условие заказа . Размерность моментной функции m (θ) должна быть по крайней мере такой же, как размерность вектора параметров θ.
- Локальная идентификация . Если g (Y, θ) непрерывно дифференцируем в окрестности , то матрица должен иметь полный ранг столбца.
На практике эконометристы-прикладники часто просто предполагают, что глобальная идентификация верна, не доказывая ее на самом деле.
Асимптотическая нормальность
Асимптотическая нормальность - полезное свойство, поскольку оно позволяет нам построить доверительные интервалы для оценщика и проведите различные тесты. Прежде чем мы сможем сделать утверждение об асимптотическом распределении оценки GMM, нам нужно определить две вспомогательные матрицы:
Тогда при условиях 1–6, перечисленных ниже, оценка GMM будет асимптотически нормальной с предельным распределением :
Условия:
- согласован (см. Предыдущий раздел),
- Набор возможных параметров является компактным,
- непрерывно дифференцируемо в некоторой окрестности N из с вероятностью один,
- матрица неособая.
Эффективность
Итак о выборе матрицы W мы пока ничего не сказали, за исключением того, что она должна быть положительно полуопределенной. Фактически, любая такая матрица будет давать непротиворечивую и асимптотически нормальную оценку GMM, единственная разница будет в асимптотической дисперсии этой оценки. Можно показать, что выбор
приведет к наиболее эффективной оценке в классе всех асимптотически нормальных оценок. Эффективность в этом случае означает, что такая оценка будет иметь наименьшую возможную дисперсию (мы говорим, что матрица A меньше, чем матрица B, если B – A является положительно полуопределенным).
В этом случае формула для асимптотического распределения оценки GMM упрощается до
Доказательство того, что такой выбор весовой матрицы действительно оптимально, часто принимается с небольшими изменениями при установлении эффективности других оценщиков. Как показывает опыт, матрица взвешивания является оптимальной, когда она превращает «формулу сэндвича» для сжатия дисперсии в более простое выражение.
Доказательство . Мы рассмотрим разницу между асимптотической дисперсией с произвольным W и асимптотической дисперсией с . Если мы сможем разложить эту разницу на симметричное произведение формы CC 'для некоторой матрицы C, то это будет гарантировать, что эта разница неотрицательно определена, и, следовательно, будет оптимальным по определению. |
| |
| |
| |
| |
где мы ввели матрицы A и B, чтобы немного si упростить обозначение; I - это единичная матрица. Мы видим, что матрица B здесь симметрична и идемпотентна : . Это означает, что I − B также симметричен и идемпотентен: . Таким образом, мы можем продолжить факторизацию предыдущего выражения как |
| |
Реализация
Одна из трудностей с реализацией описанного метода состоит в том, что мы не можем взять W = Ω, потому что по определению матрицы Ω, нам нужно знать значение θ 0, чтобы вычислить эту матрицу, а θ 0 - это именно та величина, которую мы не знаем и пытаемся оценить в первую очередь. В случае, когда Y t является iid, мы можем оценить W как
Существует несколько подходов для решения этой проблемы, первый из которых является наиболее популярным:
- Двухэтапный допустимый GMM :
- Шаг 1: Возьмите W = I (единичная матрица ) или другую положительно-определенную матрицу и вычислить предварительную оценку GMM . Эта оценка согласована для θ 0, хотя и неэффективна.
- Шаг 2: сходится по вероятности к Ω и, следовательно, если мы вычислим с этой взвешивающей матрицей оценка будет асимптотически эффективной.
- Итерированной GMM . По сути, та же процедура, что и двухэтапный GMM, за исключением того, что матрица пересчитывается несколько раз. То есть оценка, полученная на шаге 2, используется для вычисления весовой матрицы для шага 3 и так далее, пока не будет выполнен некоторый критерий сходимости.
Асимптотически никакое улучшение не может быть достигнуто с помощью таких итераций, хотя некоторые эксперименты Монте-Карло показывают, что свойства этой оценки с конечной выборкой немного лучше. - Постоянное обновление GMM (CUGMM или CUE). Оценка одновременно с оценкой весовой матрицы W:
В экспериментах Монте-Карло этот метод продемонстрировал лучшую производительность, чем традиционный двухшаговый GMM: оценка имеет меньшее медианное смещение (хотя более толстые хвосты), а J-тест для переопределения ограничений во многих случаях был более надежным.
Еще одна важная проблема в реализации процедуры минимизации заключается в том, что функция должна искать (возможно, многомерное) пространство параметров Θ и находить значение θ, которое минимизирует целевую функцию. Общих рекомендаций по такой процедуре не существует, это является предметом отдельной области, численная оптимизация.
J-тест Саргана – Хансена
Когда количество моментов больше, чем размер вектор параметров θ, модель называется переидентифицированной. Сарган (1958) предложил тесты для чрезмерной идентификации ограничений, основанные на оценках инструментальных переменных, которые распределяются в больших выборках как переменные хи-квадрат со степенями свободы, которые зависят от количества чрезмерно идентифицируемых ограничений. Впоследствии Хансен (1982) применил этот тест к математически эквивалентной формулировке оценок GMM. Обратите внимание, однако, что такая статистика может быть отрицательной в эмпирических приложениях, где модели указаны неправильно, и тесты отношения правдоподобия могут дать понимание, поскольку модели оцениваются как при нулевой, так и при альтернативной гипотезе (Bhargava and Sargan, 1983).
Концептуально мы можем проверить, достаточно ли близко до нуля, чтобы предположить, что модель хорошо соответствует данным. Затем метод GMM заменил задачу решения уравнения , которое выбирает , чтобы точно соответствовать ограничениям, вычислением минимизации. Минимизацию всегда можно выполнить, даже если не существует , такое что . Это то, что делает J-test. J-тест также называется тестом на переопределение ограничений.
Формально мы рассматриваем две гипотезы :
- (нулевая гипотеза о том, что модель «действительна») и
- (альтернативная гипотеза, эта модель «недействительна»; данные не подходят для соответствия ограничения)
Согласно гипотезе следующая так называемая J-статистика асимптотически хи-квадрат распределена с k –L степеней свободы. Определим J как:
- под
где - оценка GMM параметра , k - количество моментов (размерность вектора g), l - число оцениваемых параметров (размерность вектора θ). Матрица должна сходиться по вероятности к , эффективная матрица весов (обратите внимание, что ранее мы требовали только, чтобы W была пропорциональна , чтобы оценка была эффективно, однако для проведения J-теста W должно быть точно равно , а не просто пропорционально).
Согласно альтернативной гипотезе , J-статистика асимптотически неограничена:
- в
Для проведения теста мы вычисляем значение J на основе данных. Это неотрицательное число. Мы сравниваем его (например) с квантилем 0,95 из распределение:
- отклоняется с доверительной вероятностью 95%, если
- нельзя отклонить с уровнем достоверности 95%, если
Область действия
Многие другие популярные методы оценки могут быть применены с точки зрения оптимизации GMM:
- Обычные наименьшие квадраты (OLS) эквивалентно GMM с условиями момента:
- Взвешенный метод наименьших квадратов (WLS)
- Инструментальные переменные регрессия (IV)
- Нелинейный метод наименьших квадратов (NLLS):
- Оценка максимального правдоподобия (MLE):
Реализации
См. Также
Ссылки
Дополнительная литература
- Huber, P. (1967). Поведение оценок максимального правдоподобия в нестандартных условиях. Труды Пятого симпозиума Беркли по математической статистике и вероятности 1, 221-233.
- Ньюи У., Макфадден Д. (1994). Оценка большой выборки и проверка гипотез, Справочник по эконометрике, глава 36. Elsevier Science.
- Imbens, Guido W. ; Spady, Ричард Х.; Джонсон, Филлип (1998). «Теоретико-информационные подходы к выводу в моделях моментных состояний» (PDF). Econometrica. 66 (2): 333–357. DOI : 10.2307 / 2998561. JSTOR 2998561. CS1 maint: ref = harv (ссылка )
- Сарган, Дж. Д. (1958). Оценка экономических отношений с использованием инструментальных переменных. Econometrica, 26, 393-415.
- Sargan, JD (1959). Оценка взаимосвязей с автокоррелированными остатками с помощью инструментальных переменных. Journal of the Royal Statistical Society B, 21, 91-105.
- Wang, CY, Wang, S., and Carroll, R. (1997). Оценка в выборке на основе выбора с ошибкой измерения и бутстрап-анализом. Journal of Econometrics, 77, 65-86.
- Bhargava, A., and Sargan, JD (1983). Оценка динамических случайных эффектов на основе панельных данных, охватывающих короткие периоды времени. Econometrica, 51, 6, 1635-1659.
- Hayashi, Fumio (2000). Econometrics. Princeton: Princeton University Press. ISBN 0-691-01018-8.
- Хансен, Ларс Питер (2002). «Метод моментов». В Смелсер, штат Нью-Джерси ; Бейтс, ПБ (ред.). Международная энциклопедия Социальные и поведенческие науки. Oxford: Pergamon.
- Hall, Аластер Р. (2005). Обобщенный метод моментов. Продвинутые тексты по эконометрике. Издательство Оксфордского университета. ISBN 0-19-877520-2.
- Faciane, Кирби Адам младший (2006). Статистика для эмпирических и количественных финансов. Статистика для эмпирических и количественных финансов. H.C. Бэрд. ISBN 0-9788208-9-4.
- Специальные выпуски журнала Business and Economic Statistics: vol. 14, вып. 3 и т. 20, нет. 4.