Определение размера выборки

редактировать

Определение размера выборки - это акт выбора количества наблюдений или реплик для включения в статистическая выборка. Размер выборки - важная особенность любого эмпирического исследования, цель которого - сделать выводы о генеральной совокупности из выборки. На практике размер выборки, используемой в исследовании, обычно определяется на основе стоимости, времени или удобства сбора данных, а также необходимости предоставления достаточной статистической мощности. В сложных исследованиях может быть несколько разных размеров выборки: например, в стратифицированном опросе будут разные размеры для каждой страты. В переписи данные ищутся для всей генеральной совокупности, следовательно, предполагаемый размер выборки равен генеральной совокупности. В экспериментальном дизайне, где исследование может быть разделено на разные группы лечения, для каждой группы могут быть разные размеры выборки.

Размеры выборки могут быть выбраны несколькими способами:

на основе опыта - небольшие выборки, хотя иногда неизбежны, могут привести к широким доверительным интервалам и риску ошибок в статистической гипотезе тестирование.
с использованием целевой дисперсии для оценки, которая должна быть получена из выборки, полученной в конечном итоге, т.е. если требуется высокая точность (узкий доверительный интервал), это приводит к низкой целевой дисперсии оценщика.
с использованием целевой показатель мощности статистического теста, который будет применяться после сбора образца.
с использованием уровня достоверности, т.е. чем больше требуемый уровень достоверности, тем больше размер выборки (с учетом требование постоянной точности).

Содержание

1 Введение
2 Оценка
- 2.1 Оценка доли
- 2.2 Оценка среднего
3 Требуемые размеры выборки для проверки гипотез
- 3.1 Таблицы
- 3.2 Уравнение ресурсов Мида
- 3.3 Кумулятивная функция распределения
4 Размер стратифицированной выборки
5 Quali тативное исследование
6 См. также
7 Примечания
8 Ссылки
9 Дополнительная литература
10 Внешние ссылки

Введение

Большие размеры выборки обычно приводят к увеличению точность при оценке неизвестных параметров. Например, если мы хотим узнать долю определенного вида рыб, инфицированных патогеном, мы обычно можем получить более точную оценку этой доли, если бы мы взяли и исследовали 200, а не 100 рыб. Несколько фундаментальных фактов математической статистики описывают это явление, включая закон больших чисел и центральную предельную теорему.

. В некоторых ситуациях повышение точности для больших размеров выборки минимально или даже не существует. Это может быть результатом наличия систематических ошибок или сильной зависимости в данных, или если данные следуют распределению с тяжелыми хвостами.

Размеры выборки можно оценивать по качеству полученных оценок. Например, если оценивается пропорция, можно иметь 95% доверительный интервал шириной менее 0,06 единицы. В качестве альтернативы, размер выборки можно оценить на основе степени проверки гипотезы. Например, если мы сравниваем поддержку определенного политического кандидата среди женщин с поддержкой этого кандидата среди мужчин, мы можем пожелать иметь 80% мощности, чтобы обнаружить разницу в уровнях поддержки в 0,04 единицы.

Оценка

Оценка доли

Относительно простой ситуацией является оценка доли. Например, мы можем захотеть оценить долю жителей в сообществе, которым исполнилось 65 лет.

Оценка для пропорции : $p ^ = X / n {\ displaystyle {\ hat {p}} = X / n}$ $\ hat p = X / n$ , где X - количество «положительных» наблюдений (например, количество людей из n включенных в выборку людей, которым не менее 65 лет). Когда наблюдения независимы, этот оценщик имеет (масштабированное) биномиальное распределение (а также выборка среднее данных из Распределение Бернулли ). Максимальная дисперсия этого распределения составляет 0,25n, что происходит, когда истинный параметр равен p = 0,5. На практике, поскольку p неизвестно, для оценки размера выборки часто используется максимальная дисперсия. Если известна разумная оценка p, то вместо 0,25 можно использовать величину $p (1 - p) {\ displaystyle p (1-p)}$ ${\ displaystyle p (1-p)}$ .

Для достаточно большого n распределение $p ^ {\ displaystyle {\ hat {p}}}$ ${\ hat {p}}$ будет близко аппроксимировано нормальным распределением. Используя это и метод Вальда для биномиального распределения, получаем доверительный интервал формы

(p ^ - Z 0,25 n, p ^ + Z 0,25 n) {\ displaystyle \ left ({\ widehat {p}} - Z {\ sqrt {\ frac {0.25} {n}}}, \ quad {\ widehat {p}} + Z {\ sqrt {\ frac {0.25} {n}}} \ right) }

{\ displaystyle \ left ({\ widehat {p}} - Z {\ sqrt {\ frac {0.25} {n}}}, \ quad {\ widehat {p}} + Z {\ sqrt {\ frac {0.25} {n}}} \ right)}

где Z - стандартная Z-оценка для желаемого уровня достоверности (1,96 для 95% доверительного интервала).

Если мы хотим иметь доверительный интервал, который составляет всего W единиц по ширине (W / 2 с каждой стороны выборочного среднего), мы бы решили

Z 0,25 n = W / 2 {\ displaystyle Z {\ sqrt {\ frac {0,25} {n}}} = W / 2 }

{\ displaystyle Z {\ sqrt {\ frac {0.25} {n}}} = W / 2}

для n, что дает размер выборки

$n = Z 2 W 2 {\ displaystyle n = {\ frac {Z ^ {2}} {W ^ {2}}}}$ ${\ displaystyle n = {\ гидроразрыв {Z ^ {2}} {W ^ {2}}}}$ , в случае использования 0,5 в качестве наиболее консервативной оценки доли. (Примечание: W / 2 = предел погрешности.)

В противном случае формула будет иметь вид $Z p (1 - p) n = W / 2 {\ displaystyle Z { \ sqrt {\ frac {p (1-p)} {n}}} = W / 2}$ ${\ displaystyle Z {\ sqrt {\ frac {p (1-p)} {n }}} = W / 2}$ , что дает $n = 4 Z 2 p (1 - p) W 2 {\ displaystyle n = {\ frac {4Z ^ {2} p (1-p)} {W ^ {2}}}}$ ${\ displaystyle n = {\ frac {4Z ^ { 2} p (1-p)} {W ^ {2}}}}$ .

Например, если мы заинтересованы в оценке доли населения США, поддерживающей конкретную кандидатом в президенты, и мы хотим, чтобы ширина 95% доверительного интервала составляла не более 2 процентных пунктов (0,02), тогда нам потребуется размер выборки (1,96) / (0,02) = 9604. Разумно использовать оценку 0,5 для p в этом случае, потому что президентские гонки часто близки к 50/50, и также разумно использовать консервативную оценку. Погрешность в данном случае составляет 1 процентный пункт (половина 0,02).

Оценка среднего значения

Пропорция - это частный случай среднего. При оценке среднего значения генеральной совокупности с использованием независимой и идентично распределенной (iid) выборки размера n, где каждое значение данных имеет дисперсию σ, стандартная ошибка среднего значения выборки составляет:

σ n. {\ displaystyle {\ frac {\ sigma} {\ sqrt {n}}}.}

{\ displaystyle {\ frac {\ sigma} {\ sqrt {n}}}.}

Это выражение количественно описывает, как оценка становится более точной по мере увеличения размера выборки. Использование центральной предельной теоремы для обоснования аппроксимации выборочного среднего с помощью нормального распределения дает доверительный интервал вида

(x ¯ - Z σ n, x ¯ + Z σ n) {\ displaystyle \ left ({\ bar {x}} - {\ frac {Z \ sigma} {\ sqrt {n}}}, \ quad {\ bar {x}} + {\ frac {Z \ sigma} {\ sqrt {n) }}} \ right)}

{\ displaystyle \ left ({\ bar {x}} - {\ frac {Z \ sigma} {\ sqrt {n}}}, \ quad {\ bar {x}} + {\ frac {Z \ sigma) } {\ sqrt {n}}} \ right)}

где Z - стандартная Z-оценка для желаемого уровня достоверности (1,96 для 95% доверительного интервала).

Если мы хотим иметь уверенность интервал, который составляет W единиц общей шириной (W / 2 на каждой стороне выборочного среднего), мы должны решить

Z σ n = W / 2 {\ displaystyle {\ frac {Z \ sigma} {\ sqrt {n }}} = W / 2}

{\ displaystyle {\ frac {Z \ sigma} {\ sqrt {n}}} = W / 2}

для n, что дает размер выборки

$n = 4 Z 2 σ 2 W 2 {\ displaystyle n = {\ frac {4Z ^ {2} \ sigma ^ {2} } {W ^ {2}}}}$ ${\ displaystyle n = {\ frac {4Z ^ {2} \ sigma ^ {2}} {W ^ {2}}}}$ . (Примечание: W / 2 = предел погрешности.)

Например, если нас интересует оценка степени, на которую лекарство снижает кровяное давление субъекта, с доверительным интервалом 95% то есть шесть единиц шириной, и мы знаем, что стандартное отклонение артериального давления в популяции составляет 15, тогда требуемый размер выборки составляет $4 × 1,96 2 × 15 2 6 2 = 96,04 {\ displaystyle {\ frac {4 \ times 1,96 ^ {2} \ times 15 ^ {2}} {6 ^ {2}}} = 96,04}$ ${\ displaystyle {\ frac {4 \ times 1.96 ^ {2} \ times 15 ^ {2}} {6 ^ { 2}}} = 96,04}$ , которое будет округлено до 97, поскольку полученное значение является минимальным размером выборки, а размеры выборки должны быть целыми числами и не должны превышать расчетного минимума.

Требуемые размеры выборки для проверки гипотез

Обычная проблема, с которой сталкиваются статистики, - это вычисление размера выборки, необходимого для получения определенной степени для теста при заданном Ошибка I типа коэффициент α. Как показано ниже, это можно оценить с помощью заранее определенных таблиц для определенных значений, уравнения ресурсов Мида или, в более общем смысле, кумулятивной функцией распределения :

Таблицы

.. Power	d
.. Power	Коэна. 0,2	0,5	0,8
0,25	84	14	6
0,50	193	32	13
0,60	246	40	16
0,70	310	50	20
0,80	393	64	26
0,90	526	85	34
0,95	651	105	42
0,99	920	148	58

Показанная таблица справа может использоваться в двухвыборочном t-критерии для оценки размеров выборки экспериментальной группы и контрольной группы, которые имеют равный размер, то есть общее количество лиц в испытании вдвое больше указанного числа, а желаемый уровень значимости составляет 0,05. Используются следующие параметры:

Желаемая статистическая мощность испытания, показанная в столбце слева.
d Коэна (= величина эффекта), которая представляет собой ожидаемую разницу между означает целевых значений между экспериментальной группой и контрольной группой, разделенных на ожидаемое стандартное отклонение.

уравнение ресурсов Мида

уравнение ресурсов Мида часто используется для оценки размеров выборки лабораторных животных, а также во многих других лабораторных экспериментах. Он может быть не таким точным, как использование других методов при оценке размера выборки, но дает представление о том, какой размер выборки является подходящим, когда такие параметры, как ожидаемые стандартные отклонения или ожидаемые различия в значениях между группами, неизвестны или очень трудно оценить.

Все параметры в уравнении фактически являются степенями свободы числа своих концептов, и, следовательно, их числа вычитаются на 1 перед вставкой в уравнение.

Уравнение:

E = N - B - T, {\ displaystyle E = NBT,}

E = N - B - T,

где:

N - общее количество людей или единиц в исследовании ( минус 1)
B - блокирующий компонент, представляющий эффекты окружающей среды, разрешенные в проекте (минус 1)
T - компонент обработки, соответствующий количеству групп обработки (включая контрольную группу ), или количество задаваемых вопросов (минус 1)
E - это степени свободы компонента ошибки и должно быть где-то между 10 и 20.

Например, если исследование с использованием лабораторных животных планируется с четырьмя экспериментальными группами (T = 3), по восемь животных в группе, всего 32 животных (N = 31), без какой-либо дополнительной стратификации. (B = 0), тогда E будет равно 28, что выше порогового значения 20, что указывает на то, что размер выборки может быть слишком большим, и шесть животных на группу могут быть более подходящими.

Кумулятивная функция распределения

Пусть X i, i = 1, 2,..., n - независимые наблюдения, взятые из нормального распределения с неизвестным средним μ и известной дисперсией σ. Рассмотрим две гипотезы: нулевая гипотеза :

H 0: μ = 0 {\ displaystyle H_ {0}: \ mu = 0}

H_0: \ mu = 0

и альтернативная гипотеза:

H a: μ = μ ∗ {\ displaystyle H_ {a}: \ mu = \ mu ^ {*}}

H_a: \ mu = \ mu ^ *

для некоторой «наименьшей значимой разницы» μ>0. Это наименьшее значение, при котором мы хотим наблюдать разницу. Теперь, если мы хотим (1) отклонить H 0 с вероятностью не менее 1 - β, когда H a истинно (т.е. степень 1 - β), и (2) отклонить H 0 с вероятностью α, когда H 0 истинно, тогда нам понадобится следующее:

Если z α - верхняя α процентная точка стандартного нормального распределения, тогда

Pr (x ¯>z α σ / n ∣ H 0) = α {\ displaystyle \ Pr ({\ bar {x}}>z_ {\ alpha} \ sigma / {\ sqrt {n}} \ mid H_ {0}) = \ alpha}

\Pr({\bar {x}}>z _ {\ alpha} \ sigma / {\ sqrt {n}} \ mid H_ { 0}) = \ alpha

и поэтому

'Отклонить H 0, если наше среднее значение по выборке (

x ¯ {\ displaystyle {\ bar {x}}}

{\ bar {x}}

) больше

z α σ / n {\ displaystyle z _ {\ alpha} \ sigma / {\ sqrt {n}}}

z _ {\ alpha} \ sigma / \ sqrt {n}

- это правило принятия решения, которое удовлетворяет (2) (это одностороннее test.)

Теперь мы хотим, чтобы это происходило с вероятностью не менее 1 - β, когда H a верно. В этом случае среднее значение по выборке будет получено из нормального распределения со средним значением μ. Следовательно, нам требуется

Pr (x ¯>z α σ / n ∣ H a) ≥ 1 - β {\ displaystyle \ Pr ({\ bar {x}}>z _ {\ alpha} \ sigma / {\ sqrt {n}} \ mid H_ {a}) \ geq 1- \ beta}

\Pr({\bar {x}}>z _ {\ alpha} \ sigma / {\ sqrt {n}} \ mid H_ {a}) \ geq 1- \ beta

, это можно показать (см. Статистическая мощность # Пример ), когда

n ≥ (z α + Φ - 1 (1 - β) μ ∗ / σ) 2 {\ displaystyle n \ geq \ left ({\ frac {z _ {\ alpha} + \ Phi ^ {- 1} (1- \ beta)} {\ mu ^ {*} / \ sigma}} \ right) ^ {2}}

{\ displaystyle n \ geq \ left ({\ frac {z _ {\ alpha} + \ Phi ^ {- 1} (1- \ beta)} {\ mu ^ {*} / \ sigma}} \ right) ^ {2}}

где $Φ {\ displaystyle \ Phi}$ $\ Phi$ - нормальная кумулятивная функция распределения.

Размер стратифицированной выборки

С более сложными методами выборки, такими как стратифицированная sampling, выборка часто может быть разделена на подвыборки. Как правило, если имеется H таких подвыборок (из H разных слоев), то каждая из них будет иметь размер выборки n h, h = 1, 2,..., H. Эти n h должны соответствовать правилу n 1 + n 2 +... + n H = n (т.е. что общий размер выборки определяется суммой размеров подвыборки). Оптимальный выбор этих n h может быть выполнен различными способами, используя (например) оптимальное распределение Неймана.

Существует множество причин для использования стратифицированной выборки: для уменьшения дисперсии оценок выборки, для использования частично неслучайных методов или для изучения слоев по отдельности. Полезным, отчасти неслучайным методом может быть выборка людей в легкодоступных местах, а если нет, выборка кластеров для экономии командировочных расходов.

В целом для H-страт средневзвешенное значение выборки равно

Икс ¯ вес знак равно ∑ час = 1 HW hx ¯ h, {\ displaystyle {\ bar {x}} _ {w} = \ sum _ {h = 1} ^ {H} W_ {h} {\ bar {x} } _ {h},}

\ bar x_w = \ sum_ {h = 1} ^ H W_h \ bar x_h,

Var ⁡ (x ¯ w) = ∑ h = 1 HW h 2 Var ⁡ (x ¯ h). {\ displaystyle \ operatorname {Var} ({\ bar {x}} _ {w}) = \ sum _ {h = 1} ^ {H} W_ {h} ^ {2} \ operatorname {Var} ({\ bar {x}} _ {h}).}

{\ displaystyle \ operatorname {Var} ({\ bar {x}} _ {w}) = \ sum _ {h = 1} ^ {H} W_ {h} ^ {2} \ operatorname {Var} ({\ bar {x}} _ {h}).}

Веса, $W h {\ displaystyle W_ {h}}$ $W_h$ , часто, но не всегда, представляют пропорции населения элементы в стратах и $W h = N h / N {\ displaystyle W_ {h} = N_ {h} / N}$ $W_h = N_h / N$ . Для фиксированного размера выборки $n = ∑ nh {\ displaystyle n = \ sum n_ {h}}$ ${\ Displaystyle п = \ сумма п_ {ч}}$ ,

Var ⁡ (x ¯ w) = ∑ h = 1 HW h 2 Var ⁡ (x ¯ час) (1 nh - 1 N h), {\ displaystyle \ operatorname {Var} ({\ bar {x}} _ {w}) = \ sum _ {h = 1} ^ {H} W_ {h} ^ {2} \ operatorname {Var} ({\ bar {x}} _ {h}) \ left ({\ frac {1} {n_ {h}}} - {\ frac {1} {N_ {h}} } \ right),}

{\ displaystyle \ operatorname {Var} ({\ bar {x}} _ {w}) = \ sum _ {h = 1} ^ {H} W_ {h} ^ {2} \ operatorname {Var} ({ \ bar {x}} _ {h}) \ left ({\ frac {1} {n_ {h}}} - {\ frac {1} {N_ {h}}} \ right),}

который может быть минимальным, если частота дискретизации внутри каждого слоя сделана пропорциональной стандартному отклонению внутри каждого слоя: $nh / N h = k S h {\ displaystyle n_ {h} / N_ {h} = kS_ {h}}$ $n_h / N_h = k S_h$ , где $S h = Var ⁡ (x ¯ h) {\ displaystyle S_ {h} = {\ sqrt {\ operatorname {Var} ({\ bar {x}} _ {h})}}}$ ${\ displaystyle S_ {h} = {\ sqrt {\ operatorname {Var} ({\ bar {x}} _ {h})}}}$ и $k {\ displaystyle k}$ $k$ - константа, такая что $∑ nh = n {\ displaystyle \ sum {n_ {h}} = n}$ $\ sum {n_h} = n$ .

«Оптимальное распределение» достигается, когда частота дискретизации внутри страт прямо пропорциональна стандартным отклонениям внутри страт и обратно пропорционально квадратному корню из стоимости выборки на элемент в пределах страты, $C h {\ displaystyle C_ {h}}$ $C_h$ :

nh N h = KS h C h, {\ displaystyle {\ frac {n_ {h}} {N_ {h}}} = {\ frac {KS_ {h}} {\ sqrt {C_ {h}}}},}

\ frac {n_h} { N_h} = \ frac {K S_h} {\ sqrt {C_h}},

где $K {\ displaystyle K}$ $K$ - константа такая, что $∑ nh = n {\ displaystyle \ sum {n_ {h}} = n}$ $\ sum {n_h} = n$ , или, в более общем смысле, когда

nh = K ′ W h S h C h. {\ displaystyle n_ {h} = {\ frac {K'W_ {h} S_ {h}} {\ sqrt {C_ {h}}}}.}

n_h = \frac{K' W_h S_h}{\sqrt{C_h}}.

Качественное исследование

Определение размера выборки в качественных исследованиях используется другой подход. Как правило, это субъективное суждение, принимаемое по ходу исследования. Один из подходов заключается в продолжении включения дополнительных участников или материала до тех пор, пока не будет достигнуто насыщение. Число, необходимое для достижения насыщения, было исследовано эмпирически.

Существует нехватка надежных указаний по оценке размеров выборки перед началом исследования с рядом приведенных предложений. Инструмент, похожий на количественный расчет мощности, основанный на отрицательном биномиальном распределении, был предложен для тематического анализа.

См. Также

Портал математики

Планирование экспериментов
Пример инженерной поверхности отклика в разделе Пошаговая регрессия
h Коэна

Примечания

Ссылки

Bartlett, JE, II; Kotrlik, J. W.; Хиггинс, К. (2001). «Организационное исследование: определение подходящего размера выборки для опросного исследования» (PDF). Информационные технологии, обучение и журнал производительности. 19 (1): 43–50.
Киш, Л. (1965). Обзорная выборка. Вайли. ISBN 978-0-471-48900-9.
Смит, Скотт (8 апреля 2013 г.). «Определение размера выборки: как убедиться, что вы получили правильный размер выборки». Qualtrics. Проверено 19 сентября 2018 г.
Израиль, Гленн Д. (1992). «Определение размера выборки». Университет Флориды, PEOD-6. Проверено 29 июня 2019 года.
Ренс ван де Шут, Милица Миочевич (ред.). 2020. Решения для малых выборок (открытый доступ): руководство для прикладных исследователей и практиков. Routledge.

Дополнительная литература

NIST: Выбор размеров образцов
ASTM E122-07: Стандартная практика расчета размера образца для оценки с заданной точностью среднего значения для характеристики партии или процесса

Внешние ссылки

Сценарий MATLAB, реализующий формулу размера выборки Кохрана