Тест Ван дер Вардена

редактировать

Назван в честь голландского математика Бартель Леендерт ван дер Варден, критерий Ван дер Вардена - это статистический тест, в котором k функций распределения популяции равны. Тест Ван дер Вардена преобразует ранги из стандартного одностороннего дисперсионного анализа Краскела-Уоллиса в квантили стандартного нормального распределения (подробности приведены ниже). Они называются нормальными оценками, и тест рассчитывается на основе этих нормальных оценок.

Версия теста для k популяций является расширением теста для двух популяций, опубликованного Van der Waerden (1952,1953).

Содержание
  • 1 Предпосылки
  • 2 Определение теста
  • 3 Сравнение с тестом Краскела-Уоллиса
  • 4 Ссылки
Предпосылки

Дисперсионный анализ (ANOVA) - это анализ данных метод исследования значимости факторов (независимых переменных ) в многофакторной модели. Однофакторную модель можно рассматривать как обобщение двухвыборочного t-критерия. То есть t-критерий для двух выборок - это проверка гипотезы о равенстве двух средних значений совокупности. Однофакторный дисперсионный анализ ANOVA проверяет гипотезу о равенстве k средних значений совокупности. Стандартный ANOVA предполагает, что ошибки (то есть остатки) нормально распределены. Если это предположение о нормальности неверно, альтернативой является использование непараметрического теста.

Определение теста

Пусть n j (j = 1, 2,..., k) представляют размеры выборки для каждой из k групп (т. е. выборок) в данных. Пусть N обозначает размер выборки для всех групп. Пусть X ij представляет значение i в группе j. Нормальные оценки вычисляются как

A ij = Φ - 1 (R (X ij) N + 1) {\ displaystyle A_ {ij} = \ Phi ^ {- 1} \ left ({\ frac {R (X_ {ij})} {N + 1}} \ right)}A_ {ij} = \ Phi ^ {- 1} \ left (\ frac {R ( X_ {ij})} {N + 1} \ right)

где R (X ij) обозначает ранг наблюдения X ij, а Φ обозначает нормальный функция квантиля. Среднее значение нормальных оценок для каждой выборки можно затем вычислить как

A ¯ j = 1 nj ∑ i = 1 nj A ijj = 1, 2,…, k {\ displaystyle {\ bar {A}} _ { j} = {\ frac {1} {n_ {j}}} \ sum _ {i = 1} ^ {n_ {j}} A_ {ij} \ quad j = 1,2, \ ldots, k}\ bar {A} _j = \ frac {1} {n_j} \ sum_ {i = 1} ^ {n_j} A_ {ij} \ quad j = 1,2, \ ldots, k

Дисперсию обычных оценок можно вычислить как

s 2 = 1 N - 1 ∑ j = 1 k ∑ i = 1 nj A ij 2 {\ displaystyle s ^ {2} = {\ frac {1} { N-1}} \ sum _ {j = 1} ^ {k} \ sum _ {i = 1} ^ {n_ {j}} A_ {ij} ^ {2}}s ^ 2 = \ frac {1} {N-1} \ sum_ {j = 1} ^ k \ sum_ {i = 1} ^ {n_j} A_ {ij} ^ 2

Тест Ван дер Вардена может затем определяется следующим образом:

H0: все k функций распределения совокупности идентичны
Ha: по крайней мере одна из совокупностей имеет тенденцию давать более крупные наблюдения, чем по крайней мере одна из других совокупностей

Тестовая статистика

T 1 = 1 s 2 ∑ J = 1 knj A ¯ J 2 {\ displaystyle T_ {1} = {\ frac {1} {s ^ {2}}} \ sum _ {j = 1} ^ {k } n_ {j} {\ bar {A}} _ {j} ^ {2}}T_1 = \ frac {1} {s ^ 2} \ sum_ {j = 1} ^ kn_j \ bar {A} _j ^ 2

Для уровня значимости α критическая область равна

T 1>χ α, k - 1 2 {\ displaystyle T_ {1}>\ chi _ {\ alpha, k-1} ^ {2}} T_1>\ chi _ {\ alpha, k-1} ^ 2

где Χ α, k - 1 - квантиль α- распределения хи-квадрат с k - 1 степенями свободы. Нулевая гипотеза отклоняется, если статистика теста находится в критической области. Если гипотеза об идентичных распределениях отклоняется, можно выполнить процедуру множественных сравнений, чтобы определить, какие пары популяций имеют тенденцию различаться. Популяции j 1 и j 2 кажутся разными, если выполняется следующее неравенство:

| A ¯ j 1 - A ¯ j 2 |>st 1 - α / 2 N - 1 - T 1 N - К 1 nj 1 + 1 nj 2 {\ displaystyle \ left \ vert {\ bar {A}} _ {j_ {1}} - {\ bar {A }} _ {j_ {2}} \ right \ vert>s \, t_ {1- \ alpha / 2} {\ sqrt {\ frac {N-1-T_ {1}} {Nk}}} {\ sqrt {{\ frac {1} {n_ {j_ {1}}}} + {\ frac {1} {n_ {j_ {2}}}}}}} \left\vert \bar{A}_{j_1} - \bar{A}_{j_2}\right\vert>s \, t_ {1- \ alpha / 2} \ sqrt {\ frac {N-1-T_1} {Nk}} \ sqrt {\ frac {1} {n_ {j_1}} + \ frac {1} {n_ {j_2}}} класс =

с t 1 - α / 2 (1 - α / 2) - квантиль t-распределения.

Сравнение с критерием Краскела-Уоллиса

Наиболее распространенное не- параметрическим тестом для однофакторной модели является тест Краскела-Уоллиса. Тест Краскела-Уоллиса основан на ранжировании данных. Преимущество теста Ван дер Вардена состоит в том, что он обеспечивает высокую эффективность стандартного анализа ANOVA, когда предположения нормальности фактически выполняются, но он также обеспечивает надежность теста Краскела-Уоллиса, когда t Допущения нормальности не выполняются.

Ссылки
  • Conover, W.J. (1999). Практическая непараметрическая статистика (Третье изд.). Вайли. pp. 396–406.
  • van der Waerden, B.L. (1952). «Порядок тестов для задачи с двумя выборками и их мощность», Indagationes Mathematicae, 14, 453–458.
  • van der Waerden, B.L. (1953). «Порядок тестов для задачи с двумя выборками. II, III», Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen, Serie A, 564, 303–310, 311–316.

Эта статья включает материалы, являющиеся общественным достоянием с веб-сайта Национального института стандартов и технологий https://www.nist.gov.

Последняя правка сделана 2021-06-18 09:24:49
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте