В статистике тест Вальда (назван в честь Абрахама Вальда ) оценивает ограничения для статистических параметров на основе взвешенного расстояния между неограниченной оценкой и ее гипотетическим значением в соответствии с нулевой гипотезой, где вес - это точность оценки. Интуитивно понятно, что чем больше это взвешенное расстояние, тем меньше вероятность того, что ограничение истинно. Хотя конечные выборочные распределения критериев Вальда, как правило, неизвестны, оно имеет асимптотическое χ-распределение при нулевой гипотезе, факт, который можно использовать для определения статистической значимости.
Вместе с множителем Лагранжа и критерием отношения правдоподобия тест Вальда является одним из трех классических подходов к проверке гипотез. Преимущество теста Вальда перед двумя другими состоит в том, что он требует только оценки модели без ограничений, что снижает вычислительную нагрузку по сравнению с тестом отношения правдоподобия. Однако основным недостатком является то, что (в конечных выборках) он не инвариантен к изменениям в представлении нулевой гипотезы; другими словами, алгебраически эквивалентные выражения ограничения нелинейных параметров могут приводить к различным значениям тестовой статистики. Это потому, что статистика Вальда выводится из разложения Тейлора, а различные способы записи эквивалентных нелинейных выражений приводят к нетривиальным различиям в соответствующих коэффициентах Тейлора. Другая аберрация, известная как эффект Хаука – Доннера, может возникать в биномиальных моделях, когда оцениваемый (неограниченный) параметр близок к границе пространства параметров - например, подобранная вероятность очень близка к нулю или единице - что приводит к тому, что тест Вальда больше не монотонно увеличивает расстояние между неограниченным параметром и параметром ограничения.
По тесту Вальда оценочное , который был найден как максимизирующий аргумент неограниченной функции правдоподобия, сравнивается с предполагаемым значением . В частности, квадрат разницы взвешивается по кривизне функции логарифмического правдоподобия.
Если гипотеза включает только ограничение по одному параметру, то статистика Вальда принимает следующий вид:
который при нулевой гипотезе следует асимптотическому χ-распределению с одной степенью свободы. Квадратный корень из статистики Вальда с одним ограничением можно понимать как (псевдо) t-ratio, которое, однако, на самом деле не t-распределено, за исключением особого случая линейного регрессия с нормально распределенными ошибками. В общем, оно следует асимптотическому распределению z.
где - это стандартная ошибка оценки максимального правдоподобия (MLE), квадратный корень из дисперсии. Существует несколько способов согласованной оценки матрицы отклонений , которая в конечных выборках приводит к альтернативным оценкам стандартных ошибок и связанной статистики теста и p-значений.
Тест Вальда можно использовать для проверки одной гипотезы по нескольким параметрам, а также для совместной проверки нескольких гипотез по одному / нескольким параметрам. Пусть будет нашей выборочной оценкой параметров P (т. Е. является вектором P 1), который должен асимптотически следовать нормальному распределению с ковариационная матрица V, . Проверка гипотез Q по параметрам P выражается с помощью матрицы Q P R:
Статистика теста:
где - оценка ковариационной матрицы.
ДоказательствоПредположим, что . Тогда по теореме Слуцкого и свойствам нормального распределения умножение на R имеет распределение:
Вспоминая, что квадратичная форма нормального распределения имеет Распределение хи-квадрат :
Окончательная перестановка n дает:
Что, если ковариационная матрица неизвестна априори и ее нужно оценивать на основе данных? Если у нас есть согласованная оценка из , то в силу независимости оценки ковариации и уравнения, приведенного выше, мы имеем:
В стандартной форме тест Вальда используется для проверки линейных гипотезы, которые могут быть представлены одной матрицей R. Если кто-то желает проверить нелинейную гипотезу вида:
Тестовая статистика принимает следующий вид:
где - производная от c, оцененная в выборочном оценщике. Этот результат получается с использованием дельта-метода , который использует аппроксимацию дисперсии первого порядка.
Тот факт, что используется аппроксимация дисперсии, имеет недостаток, заключающийся в том, что статистика Вальда не инвариантна к нелинейному преобразованию / повторной параметризации гипотеза: он может давать разные ответы на один и тот же вопрос, в зависимости от того, как вопрос сформулирован. Например, вопрос о том, R = 1, - это то же самое, что вопрос о том, log R = 0; но статистика Вальда для R = 1 не совпадает со статистикой Вальда для log R = 0 (поскольку, как правило, нет четкой связи между стандартными ошибками R и log R, поэтому ее необходимо аппроксимировать).
Существует несколько альтернатив тесту Вальда, а именно тест отношения правдоподобия и тест множителя Лагранжа (также известный как результат теста). Роберт Ф. Энгл показал, что эти три теста, тест Вальда, тест отношения правдоподобия и тест множителя Лагранжа, асимптотически эквивалентны. Хотя они асимптотически эквивалентны, в конечных выборках они могут достаточно расходиться, чтобы привести к различным выводам.
Существует несколько причин предпочесть критерий отношения правдоподобия или множитель Лагранжа критерию Вальда: