В статистике, Поправка Йейтса (или хи-квадрат тест Йетса в ) используется в некоторых ситуациях при проверке независимости в таблице сопряженности. Он направлен на исправление внесенной ошибки, предполагая, что дискретные вероятности частот в таблице могут быть аппроксимированы непрерывным распределением ( хи-квадрат ). В некоторых случаях поправка Йетса может слишком сильно подстраиваться, и поэтому ее текущее использование ограничено.
Использование распределения хи-квадрат для интерпретации статистики хи-квадрат Пирсона требует предположения, что дискретная вероятность наблюдаемых биномиальных частот в таблице может быть аппроксимирована непрерывным распределением хи-квадрат. Это предположение не совсем верно и вносит некоторую ошибку.
Для того, чтобы уменьшить погрешность в приближении Франк Йейтс, английский статистик, предложил поправку на непрерывность, которая подстраивается формула для хи-квадрат тест Пирсона путем вычитания 0,5 из разницы между каждой наблюдаемой величины и его ожидаемого значения в таблице 2 × 2 на случай чрезвычайных ситуаций. Это уменьшает полученное значение хи-квадрат и, таким образом, увеличивает его p-значение.
Эффект коррекции Йетса состоит в том, чтобы предотвратить переоценку статистической значимости небольших данных. Эта формула в основном используется, когда хотя бы одна ячейка таблицы имеет ожидаемое количество меньше 5. К сожалению, поправка Йейтса может иметь тенденцию к чрезмерной корректировке. Это может привести к чрезмерно консервативному результату, который не сможет отвергнуть нулевую гипотезу, когда это необходимо ( ошибка типа II ). Таким образом, предполагается, что поправка Йейтса не нужна даже при довольно малых размерах выборки, например:
Ниже приводится исправленная версия Йейтса статистики хи-квадрат Пирсона :
куда:
В качестве сокращения для таблицы 2 × 2 со следующими записями:
S | F | ||
---|---|---|---|
А | а | б | а + б |
B | c | d | c + d |
а + с | б + г | N |
мы можем написать N = a + b + c + d
В некоторых случаях так лучше.