Тест Ван дер Вардена

редактировать

Назван в честь голландского математика Бартель Леендерт ван дер Варден, критерий Ван дер Вардена - это статистический тест, в котором k функций распределения популяции равны. Тест Ван дер Вардена преобразует ранги из стандартного одностороннего дисперсионного анализа Краскела-Уоллиса в квантили стандартного нормального распределения (подробности приведены ниже). Они называются нормальными оценками, и тест рассчитывается на основе этих нормальных оценок.

Версия теста для k популяций является расширением теста для двух популяций, опубликованного Van der Waerden (1952,1953).

Содержание

1 Предпосылки
2 Определение теста
3 Сравнение с тестом Краскела-Уоллиса
4 Ссылки

Предпосылки

Дисперсионный анализ (ANOVA) - это анализ данных метод исследования значимости факторов (независимых переменных ) в многофакторной модели. Однофакторную модель можно рассматривать как обобщение двухвыборочного t-критерия. То есть t-критерий для двух выборок - это проверка гипотезы о равенстве двух средних значений совокупности. Однофакторный дисперсионный анализ ANOVA проверяет гипотезу о равенстве k средних значений совокупности. Стандартный ANOVA предполагает, что ошибки (то есть остатки) нормально распределены. Если это предположение о нормальности неверно, альтернативой является использование непараметрического теста.

Определение теста

Пусть n j (j = 1, 2,..., k) представляют размеры выборки для каждой из k групп (т. е. выборок) в данных. Пусть N обозначает размер выборки для всех групп. Пусть X ij представляет значение i в группе j. Нормальные оценки вычисляются как

A ij = Φ - 1 (R (X ij) N + 1) {\ displaystyle A_ {ij} = \ Phi ^ {- 1} \ left ({\ frac {R (X_ {ij})} {N + 1}} \ right)}

A_ {ij} = \ Phi ^ {- 1} \ left (\ frac {R ( X_ {ij})} {N + 1} \ right)

где R (X ij) обозначает ранг наблюдения X ij, а Φ обозначает нормальный функция квантиля. Среднее значение нормальных оценок для каждой выборки можно затем вычислить как

A ¯ j = 1 nj ∑ i = 1 nj A ijj = 1, 2,…, k {\ displaystyle {\ bar {A}} _ { j} = {\ frac {1} {n_ {j}}} \ sum _ {i = 1} ^ {n_ {j}} A_ {ij} \ quad j = 1,2, \ ldots, k}

\ bar {A} _j = \ frac {1} {n_j} \ sum_ {i = 1} ^ {n_j} A_ {ij} \ quad j = 1,2, \ ldots, k

Дисперсию обычных оценок можно вычислить как

s 2 = 1 N - 1 ∑ j = 1 k ∑ i = 1 nj A ij 2 {\ displaystyle s ^ {2} = {\ frac {1} { N-1}} \ sum _ {j = 1} ^ {k} \ sum _ {i = 1} ^ {n_ {j}} A_ {ij} ^ {2}}

s ^ 2 = \ frac {1} {N-1} \ sum_ {j = 1} ^ k \ sum_ {i = 1} ^ {n_j} A_ {ij} ^ 2

Тест Ван дер Вардена может затем определяется следующим образом:

H0: все k функций распределения совокупности идентичны

Ha: по крайней мере одна из совокупностей имеет тенденцию давать более крупные наблюдения, чем по крайней мере одна из других совокупностей

Тестовая статистика

T 1 = 1 s 2 ∑ J = 1 knj A ¯ J 2 {\ displaystyle T_ {1} = {\ frac {1} {s ^ {2}}} \ sum _ {j = 1} ^ {k } n_ {j} {\ bar {A}} _ {j} ^ {2}}

T_1 = \ frac {1} {s ^ 2} \ sum_ {j = 1} ^ kn_j \ bar {A} _j ^ 2

Для уровня значимости α критическая область равна

T 1>χ α, k - 1 2 {\ displaystyle T_ {1}>\ chi _ {\ alpha, k-1} ^ {2}}

$T_1>\ chi _ {\ alpha, k-1} ^ 2$

где Χ α, k - 1 - квантиль α- распределения хи-квадрат с k - 1 степенями свободы. Нулевая гипотеза отклоняется, если статистика теста находится в критической области. Если гипотеза об идентичных распределениях отклоняется, можно выполнить процедуру множественных сравнений, чтобы определить, какие пары популяций имеют тенденцию различаться. Популяции j 1 и j 2 кажутся разными, если выполняется следующее неравенство:

| A ¯ j 1 - A ¯ j 2 |>st 1 - α / 2 N - 1 - T 1 N - К 1 nj 1 + 1 nj 2 {\ displaystyle \ left \ vert {\ bar {A}} _ {j_ {1}} - {\ bar {A }} _ {j_ {2}} \ right \ vert>s \, t_ {1- \ alpha / 2} {\ sqrt {\ frac {N-1-T_ {1}} {Nk}}} {\ sqrt {{\ frac {1} {n_ {j_ {1}}}} + {\ frac {1} {n_ {j_ {2}}}}}}}

$\left\vert \bar{A}_{j_1} - \bar{A}_{j_2}\right\vert>s \, t_ {1- \ alpha / 2} \ sqrt {\ frac {N-1-T_1} {Nk}} \ sqrt {\ frac {1} {n_ {j_1}} + \ frac {1} {n_ {j_2}}} класс =$

с t 1 - α / 2 (1 - α / 2) - квантиль t-распределения.

Сравнение с критерием Краскела-Уоллиса

Наиболее распространенное не- параметрическим тестом для однофакторной модели является тест Краскела-Уоллиса. Тест Краскела-Уоллиса основан на ранжировании данных. Преимущество теста Ван дер Вардена состоит в том, что он обеспечивает высокую эффективность стандартного анализа ANOVA, когда предположения нормальности фактически выполняются, но он также обеспечивает надежность теста Краскела-Уоллиса, когда t Допущения нормальности не выполняются.

Ссылки

Conover, W.J. (1999). Практическая непараметрическая статистика (Третье изд.). Вайли. pp. 396–406.

van der Waerden, B.L. (1952). «Порядок тестов для задачи с двумя выборками и их мощность», Indagationes Mathematicae, 14, 453–458.
van der Waerden, B.L. (1953). «Порядок тестов для задачи с двумя выборками. II, III», Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen, Serie A, 564, 303–310, 311–316.

Эта статья включает материалы, являющиеся общественным достоянием с веб-сайта Национального института стандартов и технологий https://www.nist.gov.