Поправка Йетса на преемственность

редактировать

В статистике, Поправка Йейтса (или хи-квадрат тест Йетса в ) используется в некоторых ситуациях при проверке независимости в таблице сопряженности. Он направлен на исправление внесенной ошибки, предполагая, что дискретные вероятности частот в таблице могут быть аппроксимированы непрерывным распределением ( хи-квадрат ). В некоторых случаях поправка Йетса может слишком сильно подстраиваться, и поэтому ее текущее использование ограничено.

СОДЕРЖАНИЕ
  • 1 Поправка на ошибку аппроксимации
  • 2 2 × 2 таблицы
  • 3 См. Также
  • 4 ссылки
Поправка на ошибку аппроксимации

Использование распределения хи-квадрат для интерпретации статистики хи-квадрат Пирсона требует предположения, что дискретная вероятность наблюдаемых биномиальных частот в таблице может быть аппроксимирована непрерывным распределением хи-квадрат. Это предположение не совсем верно и вносит некоторую ошибку.

Для того, чтобы уменьшить погрешность в приближении Франк Йейтс, английский статистик, предложил поправку на непрерывность, которая подстраивается формула для хи-квадрат тест Пирсона путем вычитания 0,5 из разницы между каждой наблюдаемой величины и его ожидаемого значения в таблице 2 × 2 на случай чрезвычайных ситуаций. Это уменьшает полученное значение хи-квадрат и, таким образом, увеличивает его p-значение.

Эффект коррекции Йетса состоит в том, чтобы предотвратить переоценку статистической значимости небольших данных. Эта формула в основном используется, когда хотя бы одна ячейка таблицы имеет ожидаемое количество меньше 5. К сожалению, поправка Йейтса может иметь тенденцию к чрезмерной корректировке. Это может привести к чрезмерно консервативному результату, который не сможет отвергнуть нулевую гипотезу, когда это необходимо ( ошибка типа II ). Таким образом, предполагается, что поправка Йейтса не нужна даже при довольно малых размерах выборки, например:

я знак равно 1 N О я знак равно 20 {\ Displaystyle \ сумма _ {я = 1} ^ {N} O_ {я} = 20 \,}

Ниже приводится исправленная версия Йейтса статистики хи-квадрат Пирсона :

χ Йейтс 2 знак равно я знак равно 1 N ( | О я - E я | - 0,5 ) 2 E я {\ displaystyle \ chi _ {\ text {Yates}} ^ {2} = \ sum _ {i = 1} ^ {N} {(| O_ {i} -E_ {i} | -0.5) ^ {2} \ over E_ {i}}}

куда:

O i = наблюдаемая частота
E i = ожидаемая (теоретическая) частота, утвержденная нулевой гипотезой
N = количество различных событий
Стол 2 × 2

В качестве сокращения для таблицы 2 × 2 со следующими записями:

  S F
А а б а + б
B c d c + d
а + с б + г N

мы можем написать N = a + b + c + d

χ Йейтс 2 знак равно а + б + c + d ( | а d - б c | - ( ( а + б + c + d ) / 2 ) 2 ( а + б ) ( c + d ) ( а + c ) ( б + d ) . {\ displaystyle \ chi _ {\ text {Yates}} ^ {2} = {\ frac {a + b + c + d (| ad-bc | - ((a + b + c + d) / 2) ^ {2}} {(a + b) (c + d) (a + c) (b + d)}}.}.

В некоторых случаях так лучше.

χ Йейтс 2 знак равно N ( Максимум ( 0 , | а d - б c | - N / 2 ) ) 2 N S N F N А N B . {\ displaystyle \ chi _ {\ text {Yates}} ^ {2} = {\ frac {N (\ max (0, | ad-bc | -N / 2)) ^ {2}} {N_ {S} N_ {F} N_ {A} N_ {B}}}.}
Смотрите также
Рекомендации
Последняя правка сделана 2024-01-11 06:13:14
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте