Z-тест

редактировать

A Z-тест - это любой статистический тест, для которого распределение тестовой статистики при нулевой гипотезе можно аппроксимировать нормальным распределением. Z-тест проверяет среднее значение распределения. Для каждого уровня значимости в доверительном интервале Z-тест имеет одно критическое значение (например, 1,96 для 5% двусторонних), что делает его более удобным, чем T-критерий Стьюдента, критические значения которого определяются размером выборки (через соответствующие степени свободы ).

Из-за центральной предельной теоремы многие статистические данные тестов приблизительно нормально распределяются для больших выборок. Следовательно, многие статистические тесты могут быть удобно выполнены как приблизительные Z-тесты, если размер выборки большой или дисперсия генеральной совокупности известна. Если дисперсия генеральной совокупности неизвестна (и, следовательно, ее необходимо оценивать по самой выборке) и размер выборки невелик (n < 30), the Student's t-test may be more appropriate.

Как выполнить Z-тест, когда T является статистикой, которая приблизительно нормально распределена ниже нулевая гипотеза выглядит следующим образом:

Сначала оцените ожидаемое значение μ для T при нулевой гипотезе и получите оценку s стандартного отклонения для T.

Во-вторых, определите свойства T: односторонний или двусторонний.

Для нулевой гипотезы H0: μ≥μ 0против альтернативной гипотезы H1: μ<μ0, это верхний / правый хвост (односторонний).

Для Нулевая гипотеза H0: μ≤μ 0против альтернативной гипотезы H1: μ>μ 0, он нижний / левый (односторонний).

Для нулевой гипотезы H0: μ = μ 0против альтернативной гипотезы H1: μ ≠ μ 0, он двусторонний.

В-третьих, вычислите стандартную оценку :

$Z = (X ¯ - μ 0) s {\ displaystyle Z = {\ frac {({\ bar {X} } - \ mu _ {0})} {s}}}$ ${\ displaystyle Z = {\ frac {({\ bar {X}} - \ mu _ {0})} {s}}}$ ,

который односторонний и двусторонние p-значения могут быть вычислены как Φ (Z) (для тестов с верхним / правым хвостом), Φ (-Z) (для тестов с нижним / левым хвостом) и 2Φ (- | Z |) (для двусторонних тестов), где Φ - стандартная нормальная кумулятивная функция распределения.

Содержание

1 Использование в тестировании местоположения
2 Условия
3 Пример
4 Z-тесты, отличные от тестов местоположения
5 См. Также
6 Ссылки

Использование в тестировании местоположения

Термин «Z-тест» часто используется для обозначения одноэлементный тест местоположения, сравнивающий среднее значение набора измерений с заданной константой, когда дисперсия выборки известна. Например, если наблюдаемые данные X 1,..., X n являются (i) независимыми, (ii) имеют общее среднее значение μ и (iii) имеют общее дисперсия σ, то среднее значение выборки X имеет среднее μ и дисперсию $σ 2 n {\ displaystyle {\ frac {\ sigma ^ {2}} {n}}}$ ${\ displaystyle {\ frac {\ sigma ^ {2}} {n}}}$ .
Нулевая гипотеза состоит в том, что среднее значение X - заданное число μ 0. Мы можем использовать X как тест-статистику, отклоняя нулевую гипотезу, если X - μ 0 велико.
Для расчета стандартизированной статистики $Z = (X ¯ - μ 0) s {\ displaystyle Z = {\ frac {({\ bar {X}} - \ mu _ {0})} {s}}}$ ${\ displaystyle Z = {\ frac {({\ bar {X}} - \ mu _ {0})} {s}}}$ , нам нужно знать или иметь приблизительное значение для σ, из которого мы можем вычислить $s 2 = σ 2 n {\ displaystyle s ^ {2} = {\ frac {\ sigma ^ {2}} {n}}}$ ${\ displaystyle s ^ {2} = {\ frac {\ sigma ^ {2}} {n}}}$ . В некоторых приложениях σ известно, но это случается нечасто.
Если размер выборки средний или большой, мы можем заменить σ на дисперсию выборки, дав тест плагина. Результирующий тест не будет точным Z-тестом, поскольку не учитывается неопределенность в дисперсии выборки, однако он будет хорошим приближением, если размер выборки не мал.
A Можно использовать t-тест для учета неопределенности в дисперсии выборки, когда данные в точности нормальные.
Разница между Z-тестом и t-тестом: Z-тест используется, когда размер выборки большой (n>50) или генеральная совокупность дисперсия известна. t-критерий используется, когда размер выборки невелик (n <50) and population variance is unknown.
Не существует универсальной константы, при которой размер выборки обычно считается достаточно большим, чтобы оправдать использование подключаемого теста. Типичные практические правила: размер выборки должен быть 50 или более наблюдений.
Для больших размеров выборки процедура t-теста дает почти те же значения p, что и процедура Z-теста.
Другие тесты местоположения, которые могут быть выполнены как Z- Тесты - это двухвыборочный тест местоположения и тест парных разностей.

Условия

Для применимости Z-теста должны быть выполнены определенные условия.

Мешающие параметры должны быть известным или оцененным с высокой точностью (примером мешающего параметра может быть стандартное отклонение в тесте местоположения с одной выборкой). Z-тесты фокусируются на одном параметре и обрабатывают все остальные неизвестные параметры как фиксированные на их истинных значениях. На практике, в соответствии с теоремой Слуцкого, "вставка" непротиворечивых оценок мешающих параметров может быть просто ифид. Однако, если размер выборки недостаточно велик для того, чтобы эти оценки были достаточно точными, Z-тест может работать некорректно.
Статистика теста должна соответствовать нормальному распределению. Обычно апеллируют к центральной предельной теореме , чтобы оправдать предположение о том, что тестовая статистика обычно изменяется. Существует множество статистических исследований по вопросу о том, когда тестовая статистика изменяется примерно нормально. Если изменение тестовой статистики сильно ненормально, Z-тест не должен использоваться.

Если оценки мешающих параметров вставлены, как описано выше, важно использовать оценки, соответствующие способу получения данных. выборка. В особом случае Z-тестов для задачи размещения одной или двух выборок обычное стандартное отклонение выборки подходит только в том случае, если данные были собраны как независимая выборка.

В некоторых ситуациях можно разработать тест, который должным образом учитывает различия в оценках дополнительных параметров мешающих параметров. В случае проблем с одним и двумя выборками это делает t-тест.

Пример

Предположим, что в конкретном географическом регионе среднее значение и стандартное отклонение результатов теста чтения составляют 100 и 12 баллов соответственно. Нас интересуют оценки 55 учеников в конкретной школе, которые получили средний балл 96. Мы можем спросить, значительно ли этот средний балл значительно ниже, чем средний региональный, то есть сопоставимы ли учащиеся в этой школе с простым случайным выборка из 55 студентов из региона в целом, или их оценки на удивление низкие?

Сначала вычислите стандартную ошибку среднего:

SE = σ n = 12 55 = 12 7,42 = 1,62 {\ displaystyle \ mathrm {SE} = {\ frac {\ sigma} {\ sqrt {n}}} = {\ frac {12} {\ sqrt {55}}} = {\ frac {12} {7.42}} = 1.62 \, \!}

{\ mathrm {SE}} = {\ frac {\ sigma} { {\ sqrt n}}} = {\ frac {12} {{\ sqrt {55}}}} = {\ frac {12} {7.42}} = 1.62 \, \!

где $σ {\ displaystyle {\ sigma}}$ ${ \ sigma}$ - стандартное отклонение генеральной совокупности.

Затем вычислите z-показатель, который представляет собой расстояние от выборочного среднего до среднего генерального в единицах стандартной ошибки:

z = M - μ SE = 96 - 100 1.62 = - 2.47 {\ displaystyle z = {\ frac {M- \ mu} {\ mathrm {SE}}} = {\ frac {96-100} {1.62}} = - 2.47 \, \!}

z = {\ frac {M- \ mu} {{\ mathrm {SE}}}} = {\ frac {96-100} {1.62}} = - 2.47 \, \!

В этом примере мы рассматриваем среднее значение и дисперсию совокупности как известные, что было бы целесообразно, если бы все учащиеся в регионе были протестированы. Если параметры популяции неизвестны, следует провести t-тест.

Средний балл в классе составляет 96, что составляет −2,47 единиц стандартной ошибки от среднего значения для генеральной совокупности, равного 100. Глядя на z-оценку в таблице стандартного нормального распределения кумулятивной вероятности, мы находим, что вероятность наблюдения стандартного нормального значения ниже -2,47 составляет приблизительно 0,5 - 0,4932 = 0,0068. Это одностороннее p-значение для нулевой гипотезы о том, что 55 студентов сопоставимы с простой случайной выборкой из совокупности всех испытуемых. Двустороннее значение p составляет приблизительно 0,014 (вдвое больше одностороннего значения p).

Другими словами, с вероятностью 1–0,014 = 0,986 у простой случайной выборки из 55 студентов средний результат теста будет в пределах 4 единиц от среднего для генеральной совокупности. Можно также сказать, что с вероятностью 98,6% мы отвергаем нулевую гипотезу о том, что 55 испытуемых сопоставимы с простой случайной выборкой из популяции испытуемых.

Z-тест говорит нам, что 55 интересующих студентов имеют необычно низкий средний тестовый балл по сравнению с большинством простых случайных выборок аналогичного размера из популяции тестируемых. Недостатком этого анализа является то, что он не учитывает, имеет ли значение размер эффекта из 4 баллов. Если бы вместо классной комнаты мы рассмотрели субрегион, содержащий 900 студентов, средний балл которых был 99, наблюдались бы почти такие же z-значение и p-значение. Это показывает, что если размер выборки достаточно велик, очень небольшие отличия от нулевого значения могут быть статистически значимыми. См. статистическая проверка гипотез для дальнейшего обсуждения этого вопроса.

Z-тесты, отличные от тестов местоположения

Тесты местоположения являются наиболее знакомыми Z-тестами. Другой класс Z-тестов возникает в оценке максимального правдоподобия параметров в параметрической статистической модели. Оценки максимального правдоподобия являются приблизительно нормальными при определенных условиях, и их асимптотическая дисперсия может быть вычислена в терминах информации Фишера. Оценка максимального правдоподобия, деленная на ее стандартную ошибку, может использоваться в качестве тестовой статистики для нулевой гипотезы о том, что значение параметра в генеральной совокупности равно нулю. В более общем смысле, если $θ ^ {\ displaystyle {\ hat {\ theta}}}$ $\hat{\theta}$ - оценка максимального правдоподобия параметра θ, а θ 0 - значение θ при нулевой гипотезе

(θ ^ - θ 0) / SE (θ ^) {\ displaystyle ({\ hat {\ theta}} - \ theta _ {0}) / {\ rm {SE}} ({\ hat {\ theta}})}

({\ hat {\ theta}} - \ theta _ {0}) / {{\ rm {SE}}} ({\ hat {\ theta}})

можно использовать как статистику Z-теста.

При использовании Z-теста для оценок максимального правдоподобия важно знать, что нормальное приближение может быть плохим, если размер выборки недостаточно велик. Хотя не существует простого универсального правила, определяющего, насколько большим должен быть размер выборки для использования Z-теста, моделирование может дать хорошее представление о том, подходит ли Z-тест в данной ситуации.

Z-тесты используются всякий раз, когда можно утверждать, что тестовая статистика следует нормальному распределению при интересующей нулевой гипотезе. Многие непараметрические тестовые статистики, такие как U-статистика, примерно нормальны для достаточно больших размеров выборки и поэтому часто выполняются как Z-тесты.

См. Также

Ссылки

Sprinthall, R.C. (2011). Базовый статистический анализ (9-е изд.). Pearson Education. ISBN 978-0-205-05217-2.
Каселла, Г., Бергер, Р. Л. (2002). Статистические выводы. Duxbury Press. ISBN 0-534-24312-6.
Дуглас Монтгомери, Джордж Рангер (2014). Прикладная статистика и вероятность для инженеров (6-е изд.). John Wiley Sons, inc. ISBN 9781118539712, 9781118645062.