Определение размера выборки - это акт выбора количества наблюдений или реплик для включения в статистическая выборка. Размер выборки - важная особенность любого эмпирического исследования, цель которого - сделать выводы о генеральной совокупности из выборки. На практике размер выборки, используемой в исследовании, обычно определяется на основе стоимости, времени или удобства сбора данных, а также необходимости предоставления достаточной статистической мощности. В сложных исследованиях может быть несколько разных размеров выборки: например, в стратифицированном опросе будут разные размеры для каждой страты. В переписи данные ищутся для всей генеральной совокупности, следовательно, предполагаемый размер выборки равен генеральной совокупности. В экспериментальном дизайне, где исследование может быть разделено на разные группы лечения, для каждой группы могут быть разные размеры выборки.
Размеры выборки могут быть выбраны несколькими способами:
Большие размеры выборки обычно приводят к увеличению точность при оценке неизвестных параметров. Например, если мы хотим узнать долю определенного вида рыб, инфицированных патогеном, мы обычно можем получить более точную оценку этой доли, если бы мы взяли и исследовали 200, а не 100 рыб. Несколько фундаментальных фактов математической статистики описывают это явление, включая закон больших чисел и центральную предельную теорему.
. В некоторых ситуациях повышение точности для больших размеров выборки минимально или даже не существует. Это может быть результатом наличия систематических ошибок или сильной зависимости в данных, или если данные следуют распределению с тяжелыми хвостами.
Размеры выборки можно оценивать по качеству полученных оценок. Например, если оценивается пропорция, можно иметь 95% доверительный интервал шириной менее 0,06 единицы. В качестве альтернативы, размер выборки можно оценить на основе степени проверки гипотезы. Например, если мы сравниваем поддержку определенного политического кандидата среди женщин с поддержкой этого кандидата среди мужчин, мы можем пожелать иметь 80% мощности, чтобы обнаружить разницу в уровнях поддержки в 0,04 единицы.
Относительно простой ситуацией является оценка доли. Например, мы можем захотеть оценить долю жителей в сообществе, которым исполнилось 65 лет.
Оценка для пропорции : , где X - количество «положительных» наблюдений (например, количество людей из n включенных в выборку людей, которым не менее 65 лет). Когда наблюдения независимы, этот оценщик имеет (масштабированное) биномиальное распределение (а также выборка среднее данных из Распределение Бернулли ). Максимальная дисперсия этого распределения составляет 0,25n, что происходит, когда истинный параметр равен p = 0,5. На практике, поскольку p неизвестно, для оценки размера выборки часто используется максимальная дисперсия. Если известна разумная оценка p, то вместо 0,25 можно использовать величину .
Для достаточно большого n распределение будет близко аппроксимировано нормальным распределением. Используя это и метод Вальда для биномиального распределения, получаем доверительный интервал формы
Если мы хотим иметь доверительный интервал, который составляет всего W единиц по ширине (W / 2 с каждой стороны выборочного среднего), мы бы решили
для n, что дает размер выборки
, в случае использования 0,5 в качестве наиболее консервативной оценки доли. (Примечание: W / 2 = предел погрешности.)
В противном случае формула будет иметь вид , что дает .
Например, если мы заинтересованы в оценке доли населения США, поддерживающей конкретную кандидатом в президенты, и мы хотим, чтобы ширина 95% доверительного интервала составляла не более 2 процентных пунктов (0,02), тогда нам потребуется размер выборки (1,96) / (0,02) = 9604. Разумно использовать оценку 0,5 для p в этом случае, потому что президентские гонки часто близки к 50/50, и также разумно использовать консервативную оценку. Погрешность в данном случае составляет 1 процентный пункт (половина 0,02).
Пропорция - это частный случай среднего. При оценке среднего значения генеральной совокупности с использованием независимой и идентично распределенной (iid) выборки размера n, где каждое значение данных имеет дисперсию σ, стандартная ошибка среднего значения выборки составляет:
Это выражение количественно описывает, как оценка становится более точной по мере увеличения размера выборки. Использование центральной предельной теоремы для обоснования аппроксимации выборочного среднего с помощью нормального распределения дает доверительный интервал вида
Если мы хотим иметь уверенность интервал, который составляет W единиц общей шириной (W / 2 на каждой стороне выборочного среднего), мы должны решить
для n, что дает размер выборки
. (Примечание: W / 2 = предел погрешности.)
Например, если нас интересует оценка степени, на которую лекарство снижает кровяное давление субъекта, с доверительным интервалом 95% то есть шесть единиц шириной, и мы знаем, что стандартное отклонение артериального давления в популяции составляет 15, тогда требуемый размер выборки составляет , которое будет округлено до 97, поскольку полученное значение является минимальным размером выборки, а размеры выборки должны быть целыми числами и не должны превышать расчетного минимума.
Обычная проблема, с которой сталкиваются статистики, - это вычисление размера выборки, необходимого для получения определенной степени для теста при заданном Ошибка I типа коэффициент α. Как показано ниже, это можно оценить с помощью заранее определенных таблиц для определенных значений, уравнения ресурсов Мида или, в более общем смысле, кумулятивной функцией распределения :
.. Power | d | ||
---|---|---|---|
Коэна. 0,2 | 0,5 | 0,8 | |
0,25 | 84 | 14 | 6 |
0,50 | 193 | 32 | 13 |
0,60 | 246 | 40 | 16 |
0,70 | 310 | 50 | 20 |
0,80 | 393 | 64 | 26 |
0,90 | 526 | 85 | 34 |
0,95 | 651 | 105 | 42 |
0,99 | 920 | 148 | 58 |
Показанная таблица справа может использоваться в двухвыборочном t-критерии для оценки размеров выборки экспериментальной группы и контрольной группы, которые имеют равный размер, то есть общее количество лиц в испытании вдвое больше указанного числа, а желаемый уровень значимости составляет 0,05. Используются следующие параметры:
уравнение ресурсов Мида часто используется для оценки размеров выборки лабораторных животных, а также во многих других лабораторных экспериментах. Он может быть не таким точным, как использование других методов при оценке размера выборки, но дает представление о том, какой размер выборки является подходящим, когда такие параметры, как ожидаемые стандартные отклонения или ожидаемые различия в значениях между группами, неизвестны или очень трудно оценить.
Все параметры в уравнении фактически являются степенями свободы числа своих концептов, и, следовательно, их числа вычитаются на 1 перед вставкой в уравнение.
Уравнение:
где:
Например, если исследование с использованием лабораторных животных планируется с четырьмя экспериментальными группами (T = 3), по восемь животных в группе, всего 32 животных (N = 31), без какой-либо дополнительной стратификации. (B = 0), тогда E будет равно 28, что выше порогового значения 20, что указывает на то, что размер выборки может быть слишком большим, и шесть животных на группу могут быть более подходящими.
Пусть X i, i = 1, 2,..., n - независимые наблюдения, взятые из нормального распределения с неизвестным средним μ и известной дисперсией σ. Рассмотрим две гипотезы: нулевая гипотеза :
и альтернативная гипотеза:
для некоторой «наименьшей значимой разницы» μ>0. Это наименьшее значение, при котором мы хотим наблюдать разницу. Теперь, если мы хотим (1) отклонить H 0 с вероятностью не менее 1 - β, когда H a истинно (т.е. степень 1 - β), и (2) отклонить H 0 с вероятностью α, когда H 0 истинно, тогда нам понадобится следующее:
Если z α - верхняя α процентная точка стандартного нормального распределения, тогда
и поэтому
- это правило принятия решения, которое удовлетворяет (2) (это одностороннее test.)
Теперь мы хотим, чтобы это происходило с вероятностью не менее 1 - β, когда H a верно. В этом случае среднее значение по выборке будет получено из нормального распределения со средним значением μ. Следовательно, нам требуется
, это можно показать (см. Статистическая мощность # Пример ), когда
где - нормальная кумулятивная функция распределения.
С более сложными методами выборки, такими как стратифицированная sampling, выборка часто может быть разделена на подвыборки. Как правило, если имеется H таких подвыборок (из H разных слоев), то каждая из них будет иметь размер выборки n h, h = 1, 2,..., H. Эти n h должны соответствовать правилу n 1 + n 2 +... + n H = n (т.е. что общий размер выборки определяется суммой размеров подвыборки). Оптимальный выбор этих n h может быть выполнен различными способами, используя (например) оптимальное распределение Неймана.
Существует множество причин для использования стратифицированной выборки: для уменьшения дисперсии оценок выборки, для использования частично неслучайных методов или для изучения слоев по отдельности. Полезным, отчасти неслучайным методом может быть выборка людей в легкодоступных местах, а если нет, выборка кластеров для экономии командировочных расходов.
В целом для H-страт средневзвешенное значение выборки равно
с
Веса, , часто, но не всегда, представляют пропорции населения элементы в стратах и . Для фиксированного размера выборки ,
который может быть минимальным, если частота дискретизации внутри каждого слоя сделана пропорциональной стандартному отклонению внутри каждого слоя: , где и - константа, такая что .
«Оптимальное распределение» достигается, когда частота дискретизации внутри страт прямо пропорциональна стандартным отклонениям внутри страт и обратно пропорционально квадратному корню из стоимости выборки на элемент в пределах страты, :
где - константа такая, что , или, в более общем смысле, когда
Определение размера выборки в качественных исследованиях используется другой подход. Как правило, это субъективное суждение, принимаемое по ходу исследования. Один из подходов заключается в продолжении включения дополнительных участников или материала до тех пор, пока не будет достигнуто насыщение. Число, необходимое для достижения насыщения, было исследовано эмпирически.
Существует нехватка надежных указаний по оценке размеров выборки перед началом исследования с рядом приведенных предложений. Инструмент, похожий на количественный расчет мощности, основанный на отрицательном биномиальном распределении, был предложен для тематического анализа.