Распределение выборки

редактировать

В статистика, распределение выборки или распределение конечной выборки - это распределение вероятностей заданной случайной выборки на основе статистика. Если произвольно большое количество выборок, каждая из которых включает несколько наблюдений (точек данных), использовалось отдельно для вычисления одного значения статистики (например, выборочное среднее или выборка дисперсия ) для каждой выборки, то распределение выборки - это распределение вероятностей значений, которые принимает статистика. Во многих контекстах наблюдается только одна выборка, но распределение выборки можно найти теоретически.

Выборочные распределения важны в статистике, потому что они значительно упрощают путь к статистическому выводу. В частности, они позволяют основывать аналитические соображения на распределении вероятностей статистики, а не на совместном распределении вероятностей всех отдельных значений выборки.

Содержание

  • 1 Введение
  • 2 Стандартная ошибка
  • 3 Примеры
  • 4 Ссылки
  • 5 Внешние ссылки

Введение

распределение выборки статистики - это распределение этой статистики, рассматриваемое как случайная величина, когда получено из случайной выборки размера n {\ displaystyle n }n . Его можно рассматривать как распределение статистики для всех возможных выборок из одной и той же совокупности данного размера выборки. Распределение выборки зависит от основного распределения генеральной совокупности, рассматриваемой статистики, используемой процедуры выборки и размера используемой выборки. Часто возникает значительный интерес к тому, можно ли аппроксимировать выборочное распределение с помощью асимптотического распределения, которое соответствует предельному случаю либо как количество случайных выборок конечного размера, взятых из бесконечной совокупности и используемых для получения распределение стремится к бесконечности, или когда из той же совокупности берется только одна «выборка» равного бесконечного размера.

Например, рассмотрим нормальную совокупность со средним μ {\ displaystyle \ mu}\ mu и дисперсией σ 2 {\ displaystyle \ sigma ^ {2}}\ sigma ^ {2} . Предположим, мы многократно отбираем образцы заданного размера из этой совокупности и вычисляем среднее арифметическое x ¯ {\ displaystyle \ scriptstyle {\ bar {x}}}\ scriptstyle {\ bar x} для каждой выборки. - эта статистика называется выборочным средним. Распределение этих средних или средних значений называется «выборочным распределением выборочного среднего». Это распределение является нормальным N (μ, σ 2 / n) {\ displaystyle \ scriptstyle {\ mathcal {N}} (\ mu, \, \ sigma ^ {2} / n)}\ scriptstyle {\ mathcal {N}} (\ mu, \, \ sigma ^ {2} / n) (n - размер выборки), поскольку основная совокупность является нормальной, хотя распределения выборки также часто могут быть близки к нормальным, даже если распределение совокупности не является нормальным (см. центральная предельная теорема ). Альтернативой выборочному среднему является выборка медиана. При вычислении для одной и той же совокупности он имеет распределение выборки, отличное от среднего и обычно не является нормальным (но может быть близким для больших размеров выборки).

Среднее значение выборки из совокупности, имеющей нормальное распределение, является примером простой статистики, взятой из одной из простейших статистических совокупностей. Для других статистических данных и других популяций формулы более сложные, и часто их нет в закрытой форме. В таких случаях выборочные распределения могут быть аппроксимированы с помощью моделирования Монте-Карло, методов начальной загрузки или теории асимптотического распределения.

Стандартная ошибка

стандартное отклонение выборочного распределения статистики называется стандартной ошибкой это количество. Для случая, когда статистика представляет собой выборочное среднее, а выборки не коррелированы, стандартная ошибка составляет:

σ x ¯ = σ n {\ displaystyle \ sigma _ {\ bar {x}} = {\ frac {\ sigma } {\ sqrt {n}}}}\ sigma _ {{{\ bar x}}} = {\ frac {\ sigma} {{\ sqrt {n}}}}

где σ {\ displaystyle \ sigma}\ sigma - стандартное отклонение распределения населения этого количества, а n {\ displaystyle n }n - размер выборки (количество элементов в выборке).

Важным следствием этой формулы является то, что размер выборки должен быть увеличен в четыре раза (умножен на 4), чтобы получить половину (1/2) ошибки измерения. При разработке статистических исследований, в которых стоимость является фактором, это может иметь значение для понимания компромиссов между затратами и выгодами.

Примеры

НаселениеСтатистикаРаспределение выборки
Нормальное : N (μ, σ 2) {\ displaystyle {\ mathcal {N}} (\ mu, \ sigma ^ {2})}{\ mathcal {N}} (\ mu, \ sigma ^ {2}) Среднее значение выборки X ¯ {\ displaystyle {\ bar {X}}}{\ bar {X}} из выборок размером nИкс ¯ ∼ N (μ, σ 2 n) {\ Displaystyle {\ bar {X}} \ sim {\ mathcal {N}} {\ Big (} \ mu, \, {\ frac {\ sigma ^ {2 }} {n}} {\ Big)}}{\ bar X} \ sim {\ mathcal {N}} {\ Big (} \ mu, \, {\ frac {\ sigma ^ {2}} {n}} {\ Big)} .

Если стандартное отклонение σ {\ displaystyle \ sigma}\ sigma неизвестно, можно считать, что T = (X ¯ - μ) n S {\ displaystyle T = \ left ({\ bar {X}} - \ mu \ right) {\ frac {\ sqrt {n}} {S}}}{\ displaystyle T = \ left ({\ bar {X}} - \ mu \ справа) {\ frac {\ sqrt {n}} {S}}} , что следует t-распределение Стьюдента с ν = n - 1 {\ displaystyle \ nu = n-1}\ nu = n - 1 степенями свободы. Здесь S 2 {\ displaystyle S ^ {2}}S ^ {2 } - это дисперсия выборки, а T {\ displaystyle T}T- основная величина, чье распределение не зависит от σ {\ displaystyle \ sigma}\ sigma .

Бернулли : Бернулли ⁡ (p) {\ displaystyle \ operatorname {Bernoulli} (p)}\ operatorname {Бернулли} (p) Примерная доля «успешных испытаний» X ¯ {\ displaystyle {\ bar {X}}}{\ bar {X}} n X ¯ ∼ биномиальной ⁡ (n, p) {\ displaystyle n {\ bar {X}} \ sim \ operatorname {Binomial} (n, p)}n {\ bar X} \ sim \ operatorname {Binomial} (n, p)
Две независимые нормальные совокупности:.

N (μ 1, σ 1 2) {\ displaystyle {\ mathcal {N}} (\ mu _ {1}, \ sigma _ {1} ^ {2})}{\ mathcal {N}} (\ mu _ {1}, \ sigma _ {1} ^ {2}) и N (μ 2, σ 2 2) {\ displaystyle {\ mathcal {N}} (\ mu _ {2}, \ sigma _ {2} ^ {2})}{\ mathcal {N}} (\ mu _ {2}, \ sigma _ {2} ^ {2})

Разница между выборочными средними, X ¯ 1 - X ¯ 2 {\ displaystyle {\ bar {X}} _ {1} - {\ bar {X}} _ {2}}{\ bar X} _ {1} - {\ bar X} _ {2} Икс ¯ 1 - Икс ¯ 2 ∼ N (μ 1 - μ 2, σ 1 2 n 1 + σ 2 2 n 2) {\ displaystyle {\ bar {X}} _ {1} - {\ bar {X}} _ {2} \ sim {\ mathcal {N}} \! \ left (\ mu _ {1} - \ mu _ {2}, \, {\ frac {\ sigma _ { 1} ^ {2}} {n_ {1}}} + {\ frac {\ sigma _ {2} ^ {2}} { n_ {2}}} \ right)}{\ bar X} _ {1} - {\ bar X} _ {2} \ sim {\ mathcal {N}} \! \ left (\ mu _ {1} - \ mu _ {2}, \, {\ frac {\ sigma _ {1} ^ {2}} {n_ {1}}} + {\ frac {\ sigma _ {2} ^ {2}} {n_ {2}}} \ right)
Любое абсолютно непрерывное распределение F с плотностью ƒMedian X (k) {\ displaystyle X _ {(k)}}X _ {{(k)}} из выборки размером n = 2k - 1, где выборка упорядочена X (1) {\ displaystyle X _ {(1)}}X _ {{(1)}} в X (n) {\ displaystyle X _ {(n)}}X _ {{(n)}} е X (k) (x) = (2 k - 1)! (к - 1)! 2 f (x) (F (x) (1 - F (x))) k - 1 {\ displaystyle f_ {X _ {(k)}} (x) = {\ frac {(2k-1)!} { (k-1)! ^ {2}}} f (x) {\ Big (} F (x) (1-F (x)) {\ Big)} ^ {k-1}}f _ {{X _ {{(k)}}}} (x) = {\ frac {(2k-1) !} {(k-1)! ^ {2}}} f (x) {\ Big (} F (x) (1-F (x)) {\ Big)} ^ {{k-1}}
Любое распределение с функцией распределения FMaximum M = max X k {\ displaystyle M = \ max \ X_ {k}}M = \ max \ X_ {k} из случайной выборки размером nFM ( Икс) знак равно п (M ≤ Икс) знак равно ∏ п (Икс К ≤ Икс) = (F (x)) n {\ Displaystyle F_ {M} (х) = P (M \ Leq x) = \ prod P (X_ {k} \ leq x) = \ left (F (x) \ right) ^ {n}}F_ {M} (x) = P (M \ leq x) = \ prod P (X_ {k} \ leq x) = \ left (F (x) \ right) ^ {n}

Ссылки

Внешние ссылки

Последняя правка сделана 2021-06-06 09:27:43
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте