Д'Агостина в K squared тест

редактировать

В статистике, д'Агостина в K 2 тестом, названный в честь Ральфа D'Agostino, является благость-из-приступа меры ухода из нормальности, то есть тест ставит перед собой целью установить, исходит ли данная выборка из нормально распределенного населения. Тест основан на преобразованиях эксцесса и асимметрии выборки и имеет силу только в отношении альтернатив, что распределение является асимметричным и / или куртовым.

СОДЕРЖАНИЕ

  • 1 Асимметрия и эксцесс
  • 2 Преобразованная асимметрия и эксцесс образца
  • 3 Статистика Omnibus K 2
  • 4 См. Также
  • 5 ссылки

Асимметрия и эксцесс

Далее {  x i  } обозначает выборку из n наблюдений, g 1 и g 2 - асимметрия и эксцесс выборки, m j ’s - центральные моменты j-й выборки и является выборочным средним. Часто в литературе, относящейся к тестированию на нормальность, асимметрия и эксцесс обозначаются как √ β 1 и β 2 соответственно. Такое обозначение может быть неудобным, поскольку, например, √ β 1 может быть отрицательной величиной. Икс ¯ {\ displaystyle {\ bar {x}}}

Асимметрия и эксцесс образца определяются как

грамм 1 знак равно м 3 м 2 3 / 2 знак равно 1 п я знак равно 1 п ( Икс я - Икс ¯ ) 3 ( 1 п я знак равно 1 п ( Икс я - Икс ¯ ) 2 ) 3 / 2   , грамм 2 знак равно м 4 м 2 2 - 3 знак равно 1 п я знак равно 1 п ( Икс я - Икс ¯ ) 4 ( 1 п я знак равно 1 п ( Икс я - Икс ¯ ) 2 ) 2 - 3   . {\ displaystyle {\ begin {align} amp; g_ {1} = {\ frac {m_ {3}} {m_ {2} ^ {3/2}}}} = {\ frac {{\ frac {1} {n}) } \ sum _ {i = 1} ^ {n} \ left (x_ {i} - {\ bar {x}} \ right) ^ {3}} {\ left ({\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ left (x_ {i} - {\ bar {x}} \ right) ^ {2} \ right) ^ {3/2}}} \, \\ amp; g_ {2} = {\ frac {m_ {4}} {m_ {2} ^ {2}}} - 3 = {\ frac {{\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ left (x_ {i} - {\ bar {x}} \ right) ^ {4}} {\ left ({\ frac {1} {n}} \ sum _ {i = 1} ^ { n} \ left (x_ {i} - {\ bar {x}} \ right) ^ {2} \ right) ^ {2}}} - 3 \. \ end {выровнено}}}

Эти величины согласованно оценивают теоретическую асимметрию и эксцесс распределения соответственно. Более того, если выборка действительно происходит из нормальной популяции, то точные конечные выборочные распределения асимметрии и эксцесса сами могут быть проанализированы с точки зрения их средних значений μ 1, дисперсий μ 2, асимметрии γ 1 и куртоза γ 2. Это было сделано Пирсоном (1931), который вывел следующие выражения:

μ 1 ( грамм 1 ) знак равно 0 , μ 2 ( грамм 1 ) знак равно 6 ( п - 2 ) ( п + 1 ) ( п + 3 ) , γ 1 ( грамм 1 ) μ 3 ( грамм 1 ) μ 2 ( грамм 1 ) 3 / 2 знак равно 0 , γ 2 ( грамм 1 ) μ 4 ( грамм 1 ) μ 2 ( грамм 1 ) 2 - 3 знак равно 36 ( п - 7 ) ( п 2 + 2 п - 5 ) ( п - 2 ) ( п + 5 ) ( п + 7 ) ( п + 9 ) . {\ displaystyle {\ begin {align} amp; \ mu _ {1} (g_ {1}) = 0, \\ amp; \ mu _ {2} (g_ {1}) = {\ frac {6 (n-2)} {(n + 1) (n + 3)}}, \\ amp; \ gamma _ {1} (g_ {1}) \ Equiv {\ frac {\ mu _ {3} (g_ {1})} {\ mu _ {2} (g_ {1}) ^ {3/2}}} = 0, \\ amp; \ gamma _ {2} (g_ {1}) \ Equiv {\ frac {\ mu _ {4 } (g_ {1})} {\ mu _ {2} (g_ {1}) ^ {2}}} - 3 = {\ frac {36 (n-7) (n ^ {2} + 2n-5)} {(n-2) (n + 5) (n + 7) (n + 9)}}. \ end {выравнивается}}}

а также

μ 1 ( грамм 2 ) знак равно - 6 п + 1 , μ 2 ( грамм 2 ) знак равно 24 п ( п - 2 ) ( п - 3 ) ( п + 1 ) 2 ( п + 3 ) ( п + 5 ) , γ 1 ( грамм 2 ) μ 3 ( грамм 2 ) μ 2 ( грамм 2 ) 3 / 2 знак равно 6 ( п 2 - 5 п + 2 ) ( п + 7 ) ( п + 9 ) 6 ( п + 3 ) ( п + 5 ) п ( п - 2 ) ( п - 3 ) , γ 2 ( грамм 2 ) μ 4 ( грамм 2 ) μ 2 ( грамм 2 ) 2 - 3 знак равно 36 ( 15 п 6 - 36 п 5 - 628 п 4 + 982 п 3 + 5777 п 2 - 6402 п + 900 ) п ( п - 3 ) ( п - 2 ) ( п + 7 ) ( п + 9 ) ( п + 11 ) ( п + 13 ) . {\ displaystyle {\ begin {align} amp; \ mu _ {1} (g_ {2}) = - {\ frac {6} {n + 1}}, \\ amp; \ mu _ {2} (g_ {2 }) = {\ frac {24n (n-2) (n-3)} {(n + 1) ^ {2} (n + 3) (n + 5)}}, \\ amp; \ gamma _ {1 } (g_ {2}) \ Equiv {\ frac {\ mu _ {3} (g_ {2})} {\ mu _ {2} (g_ {2}) ^ {3/2}}} = {\ frac {6 (n ^ {2} -5n + 2)} {(n + 7) (n + 9)}} {\ sqrt {\ frac {6 (n + 3) (n + 5)} {n ( n-2) (n-3)}}}, \\ amp; \ gamma _ {2} (g_ {2}) \ Equ {\ frac {\ mu _ {4} (g_ {2})} {\ mu _ {2} (g_ {2}) ^ {2}}} - 3 = {\ frac {36 (15n ^ {6} -36n ^ {5} -628n ^ {4} + 982n ^ {3} + 5777n ^ {2} -6402n + 900)} {n (n-3) (n-2) (n + 7) (n + 9) (n + 11) (n + 13)}}. \ End {выравнивается} }}

Например, можно ожидать, что образец размером n = 1000, взятый из нормально распределенной совокупности, будет иметь асимметрию 0, SD 0,08 и эксцесс 0, SD 0,15, где SD указывает стандартное отклонение.

Преобразованная асимметрия и эксцесс образца

Образец перекос г 1 и эксцесс г 2 являются асимптотически нормальными. Однако скорость их сходимости к пределу распределения удручающе мала, особенно для g 2. Например, даже при n = 5000 наблюдений выборочный эксцесс g 2 имеет как асимметрию, так и эксцесс примерно 0,3, что нельзя игнорировать. Чтобы исправить эту ситуацию, было предложено преобразовать величины g 1 и g 2 таким образом, чтобы сделать их распределение как можно ближе к стандартному нормальному.

В частности, Д'Агостино (1970) предложил следующее преобразование для асимметрии выборки: Ошибка harvtxt: цель отсутствует: CITEREFD'Agostino1970 ( справка )

Z 1 ( грамм 1 ) знак равно δ asinh ( грамм 1 α μ 2 ) , {\ displaystyle Z_ {1} (g_ {1}) = \ delta \ operatorname {asinh} \ left ({\ frac {g_ {1}} {\ alpha {\ sqrt {\ mu _ {2}}}}}} \верно),}

где постоянные α и δ вычисляются как

W 2 знак равно 2 γ 2 + 4 - 1 , δ знак равно 1 / пер W , α 2 знак равно 2 / ( W 2 - 1 ) , {\ displaystyle {\ begin {align} amp; W ^ {2} = {\ sqrt {2 \ gamma _ {2} +4}} - 1, \\ amp; \ delta = 1 / {\ sqrt {\ ln W}}, \\ amp; \ alpha ^ {2} = 2 / (W ^ {2} -1), \ end {выровнено}}}

и где μ 2 = μ 2 ( g 1) - дисперсия g 1, а γ 2 = γ 2 ( g 1) - эксцесс - выражения, приведенные в предыдущем разделе.

Точно так же Анскомб и Глинн (1983) предложили преобразование для g 2, которое достаточно хорошо работает для размеров выборки 20 и более:

Z 2 ( грамм 2 ) знак равно 9 А 2 { 1 - 2 9 А - ( 1 - 2 / А 1 + грамм 2 - μ 1 μ 2 2 / ( А - 4 ) ) 1 / 3 } , {\ displaystyle Z_ {2} (g_ {2}) = {\ sqrt {\ frac {9A} {2}}} \ left \ {1 - {\ frac {2} {9A}} - \ left ({\ гидроразрыв {1-2 / A} {1 + {\ frac {g_ {2} - \ mu _ {1}} {\ sqrt {\ mu _ {2}}}} {\ sqrt {2 / (A-4)}}}} \ right) ^ {\! 1/3} \ right \},}

где

А знак равно 6 + 8 γ 1 ( 2 γ 1 + 1 + 4 / γ 1 2 ) , {\ displaystyle A = 6 + {\ frac {8} {\ gamma _ {1}}} \ left ({\ frac {2} {\ gamma _ {1}}} + {\ sqrt {1 + 4 / \ гамма _ {1} ^ {2}}} \ right),}

и μ 1 = μ 1 ( g 2), μ 2 = μ 2 ( g 2), γ 1 = γ 1 ( g 2) - величины, вычисленные Пирсоном.

Статистика Omnibus K 2

Статистические данные Z 1 и Z 2 могут быть объединены для создания комплексного теста, способного обнаруживать отклонения от нормального значения из-за асимметрии или эксцесса ( D'Agostino, Belanger amp; D'Agostino 1990): ошибка harv: цель отсутствует: CITEREFD'AgostinoBelangerD'Agostino1990 ( справка )

K 2 знак равно Z 1 ( грамм 1 ) 2 + Z 2 ( грамм 2 ) 2 {\ Displaystyle К ^ {2} = Z_ {1} (g_ {1}) ^ {2} + Z_ {2} (g_ {2}) ^ {2} \,}

Если нулевая гипотеза нормальности верна, то K 2 приблизительно χ 2 -распределен с 2 степенями свободы.

Обратите внимание, что статистика g 1, g 2 не является независимой, а только некоррелированной. Следовательно, их преобразования Z 1, Z 2 также будут зависимыми ( Shenton amp; Bowman 1977), что ставит под сомнение достоверность приближения χ 2. Моделирование показывает, что при нулевой гипотезе статистика теста K 2 характеризуется

ожидаемое значение стандартное отклонение 95% квантиль
п = 20 1,971 2.339 6,373
n = 50 2,017 2,308 6,339
n = 100 2,026 2,267 6,271
n = 250 2,012 2,174 6,129
n = 500 2,009 2,113 6.063
n = 1000 2.000 2,062 6.038
χ 2 (2) распределение 2.000 2.000 5,991

Смотрите также

Рекомендации

Последняя правка сделана 2023-04-21 01:58:03
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте