Нулевое распределение

редактировать

В статистической проверке гипотез, то распределение нуля является распределением вероятностей в тестовых статистиках, когда нулевая гипотеза верна. Например, в F-тесте нулевое распределение является F-распределением. Нулевое распределение - это инструмент, который ученые часто используют при проведении экспериментов. Нулевое распределение - это распределение двух наборов данных при нулевой гипотезе. Если результаты двух наборов данных не выходят за рамки параметров ожидаемых результатов, то нулевая гипотеза считается верной.

Нулевое и альтернативное распределение

СОДЕРЖАНИЕ

1 Примеры применения
2 Получение нулевого распределения
3 Нулевое распределение с большим размером выборки
4 ссылки

Примеры применения

Нулевая гипотеза часто является частью эксперимента. Нулевая гипотеза пытается показать, что среди двух наборов данных нет статистической разницы между результатами выполнения одного действия и результатов выполнения другого действия. Например, ученый может попытаться доказать, что у людей, которые проходят две мили в день, более здоровое сердце, чем у людей, которые проходят менее двух миль в день. Ученый использовал нулевую гипотезу, чтобы проверить здоровье сердец людей, которые проходили две мили в день, против здоровья сердец людей, которые проходили менее двух миль в день. Если бы не было разницы между их частотой сердечных сокращений, тогда ученый мог бы сказать, что статистика теста будет следовать нулевому распределению. Затем ученые могли определить, что если есть существенная разница, это означает, что тест следует альтернативному распределению.

Получение нулевого распределения

В процедуре проверки гипотез необходимо сформировать совместное распределение тестовой статистики для проведения теста и контроля ошибок I типа. Однако истинное распределение часто неизвестно, и для представления данных следует использовать правильное нулевое распределение. Например, одна выборка и две выборки для проверки средних могут использовать t статистик, которые имеют гауссовское нулевое распределение, тогда как F- статистика, проверяя k групп средних значений совокупности, которые имеют гауссовскую квадратичную форму нулевого распределения. Нулевое распределение определяется как асимптотические распределения тестовой статистики с преобразованием нулевого квантиля, основанные на предельном нулевом распределении. На практике тестовая статистика нулевого распределения часто неизвестна, так как она основана на распределении, генерирующем неизвестные данные. Процедуры повторной выборки, такие как непараметрическая или основанная на модели бутстрап, могут обеспечить согласованные оценки для нулевых распределений. Неправильный выбор нулевого распределения оказывает значительное влияние на ошибку типа I и свойства мощности в процессе тестирования. Другой подход к получению нулевого распределения тестовой статистики состоит в использовании данных генерации оценки нулевого распределения.

Нулевое распределение с большим размером выборки

Нулевое распределение играет решающую роль в крупномасштабном тестировании. Большой размер выборки позволяет нам реализовать более реалистичное эмпирическое нулевое распределение. Можно сгенерировать эмпирический нуль, используя алгоритм подбора MLE. В рамках байесовской модели крупномасштабные исследования позволяют поместить нулевое распределение в вероятностный контекст с его ненулевыми аналогами. Когда размер выборки n велик, например, более 10 000, эмпирические нули используют собственные данные исследования для оценки соответствующего нулевого распределения. Важное предположение состоит в том, что из-за большой доли нулевых случаев (gt; 0,9) данные могут отображать само нулевое распределение. В некоторых случаях теоретический нуль может не сработать, что не совсем неверно, но требует соответствующей корректировки. В крупномасштабных наборах данных легко найти отклонения данных от идеальной математической основы, например, независимых и одинаково распределенных (iid) выборок. Кроме того, корреляция между единицами выборки и ненаблюдаемыми ковариатами может привести к неправильному теоретическому нулевому распределению. Методы перестановки часто используются при множественном тестировании для получения эмпирического нулевого распределения, созданного на основе данных. Эмпирические нулевые методы были введены с центральным алгоритмом сопоставления в статье Эфрона.

Следует учесть несколько моментов, используя метод перестановки. Методы перестановки не подходят для коррелированных единиц выборки, поскольку процесс перестановки выборки подразумевает независимость и требует допущений iid. Кроме того, в литературе показано, что распределение перестановок быстро сходится к N (0,1), когда n становится большим. В некоторых случаях методы перестановки и эмпирические методы можно комбинировать, используя перестановку null replace N (0,1) в эмпирическом алгоритме.

Рекомендации