Назван в честь голландского математика Бартель Леендерт ван дер Варден, критерий Ван дер Вардена - это статистический тест, в котором k функций распределения популяции равны. Тест Ван дер Вардена преобразует ранги из стандартного одностороннего дисперсионного анализа Краскела-Уоллиса в квантили стандартного нормального распределения (подробности приведены ниже). Они называются нормальными оценками, и тест рассчитывается на основе этих нормальных оценок.
Версия теста для k популяций является расширением теста для двух популяций, опубликованного Van der Waerden (1952,1953).
Дисперсионный анализ (ANOVA) - это анализ данных метод исследования значимости факторов (независимых переменных ) в многофакторной модели. Однофакторную модель можно рассматривать как обобщение двухвыборочного t-критерия. То есть t-критерий для двух выборок - это проверка гипотезы о равенстве двух средних значений совокупности. Однофакторный дисперсионный анализ ANOVA проверяет гипотезу о равенстве k средних значений совокупности. Стандартный ANOVA предполагает, что ошибки (то есть остатки) нормально распределены. Если это предположение о нормальности неверно, альтернативой является использование непараметрического теста.
Пусть n j (j = 1, 2,..., k) представляют размеры выборки для каждой из k групп (т. е. выборок) в данных. Пусть N обозначает размер выборки для всех групп. Пусть X ij представляет значение i в группе j. Нормальные оценки вычисляются как
где R (X ij) обозначает ранг наблюдения X ij, а Φ обозначает нормальный функция квантиля. Среднее значение нормальных оценок для каждой выборки можно затем вычислить как
Дисперсию обычных оценок можно вычислить как
Тест Ван дер Вардена может затем определяется следующим образом:
Тестовая статистика
Для уровня значимости α критическая область равна
где Χ α, k - 1 - квантиль α- распределения хи-квадрат с k - 1 степенями свободы. Нулевая гипотеза отклоняется, если статистика теста находится в критической области. Если гипотеза об идентичных распределениях отклоняется, можно выполнить процедуру множественных сравнений, чтобы определить, какие пары популяций имеют тенденцию различаться. Популяции j 1 и j 2 кажутся разными, если выполняется следующее неравенство:
с t 1 - α / 2 (1 - α / 2) - квантиль t-распределения.
Наиболее распространенное не- параметрическим тестом для однофакторной модели является тест Краскела-Уоллиса. Тест Краскела-Уоллиса основан на ранжировании данных. Преимущество теста Ван дер Вардена состоит в том, что он обеспечивает высокую эффективность стандартного анализа ANOVA, когда предположения нормальности фактически выполняются, но он также обеспечивает надежность теста Краскела-Уоллиса, когда t Допущения нормальности не выполняются.
Эта статья включает материалы, являющиеся общественным достоянием с веб-сайта Национального института стандартов и технологий https://www.nist.gov.