В статистике, д'Агостина в K 2 тестом, названный в честь Ральфа D'Agostino, является благость-из-приступа меры ухода из нормальности, то есть тест ставит перед собой целью установить, исходит ли данная выборка из нормально распределенного населения. Тест основан на преобразованиях эксцесса и асимметрии выборки и имеет силу только в отношении альтернатив, что распределение является асимметричным и / или куртовым.
СОДЕРЖАНИЕ
- 1 Асимметрия и эксцесс
- 2 Преобразованная асимметрия и эксцесс образца
- 3 Статистика Omnibus K 2
- 4 См. Также
- 5 ссылки
Асимметрия и эксцесс
Далее { x i } обозначает выборку из n наблюдений, g 1 и g 2 - асимметрия и эксцесс выборки, m j ’s - центральные моменты j-й выборки и является выборочным средним. Часто в литературе, относящейся к тестированию на нормальность, асимметрия и эксцесс обозначаются как √ β 1 и β 2 соответственно. Такое обозначение может быть неудобным, поскольку, например, √ β 1 может быть отрицательной величиной.
Асимметрия и эксцесс образца определяются как
Эти величины согласованно оценивают теоретическую асимметрию и эксцесс распределения соответственно. Более того, если выборка действительно происходит из нормальной популяции, то точные конечные выборочные распределения асимметрии и эксцесса сами могут быть проанализированы с точки зрения их средних значений μ 1, дисперсий μ 2, асимметрии γ 1 и куртоза γ 2. Это было сделано Пирсоном (1931), который вывел следующие выражения:
а также
Например, можно ожидать, что образец размером n = 1000, взятый из нормально распределенной совокупности, будет иметь асимметрию 0, SD 0,08 и эксцесс 0, SD 0,15, где SD указывает стандартное отклонение.
Преобразованная асимметрия и эксцесс образца
Образец перекос г 1 и эксцесс г 2 являются асимптотически нормальными. Однако скорость их сходимости к пределу распределения удручающе мала, особенно для g 2. Например, даже при n = 5000 наблюдений выборочный эксцесс g 2 имеет как асимметрию, так и эксцесс примерно 0,3, что нельзя игнорировать. Чтобы исправить эту ситуацию, было предложено преобразовать величины g 1 и g 2 таким образом, чтобы сделать их распределение как можно ближе к стандартному нормальному.
В частности, Д'Агостино (1970) предложил следующее преобразование для асимметрии выборки: Ошибка harvtxt: цель отсутствует: CITEREFD'Agostino1970 ( справка )
где постоянные α и δ вычисляются как
и где μ 2 = μ 2 ( g 1) - дисперсия g 1, а γ 2 = γ 2 ( g 1) - эксцесс - выражения, приведенные в предыдущем разделе.
Точно так же Анскомб и Глинн (1983) предложили преобразование для g 2, которое достаточно хорошо работает для размеров выборки 20 и более:
где
и μ 1 = μ 1 ( g 2), μ 2 = μ 2 ( g 2), γ 1 = γ 1 ( g 2) - величины, вычисленные Пирсоном.
Статистика Omnibus K 2
Статистические данные Z 1 и Z 2 могут быть объединены для создания комплексного теста, способного обнаруживать отклонения от нормального значения из-за асимметрии или эксцесса ( D'Agostino, Belanger amp; D'Agostino 1990): ошибка harv: цель отсутствует: CITEREFD'AgostinoBelangerD'Agostino1990 ( справка )
Если нулевая гипотеза нормальности верна, то K 2 приблизительно χ 2 -распределен с 2 степенями свободы.
Обратите внимание, что статистика g 1, g 2 не является независимой, а только некоррелированной. Следовательно, их преобразования Z 1, Z 2 также будут зависимыми ( Shenton amp; Bowman 1977), что ставит под сомнение достоверность приближения χ 2. Моделирование показывает, что при нулевой гипотезе статистика теста K 2 характеризуется
| ожидаемое значение | стандартное отклонение | 95% квантиль |
п = 20 | 1,971 | 2.339 | 6,373 |
n = 50 | 2,017 | 2,308 | 6,339 |
n = 100 | 2,026 | 2,267 | 6,271 |
n = 250 | 2,012 | 2,174 | 6,129 |
n = 500 | 2,009 | 2,113 | 6.063 |
n = 1000 | 2.000 | 2,062 | 6.038 |
χ 2 (2) распределение | 2.000 | 2.000 | 5,991 |
Смотрите также
Рекомендации