Интервал допуска

редактировать

A Интервал допуска - это статистический интервал, в пределах которого, с некоторым уровнем достоверности определенная часть выборки населения падает. «Более конкретно, интервал допуска 100 × p% / 100 × (1-α) обеспечивает пределы, в которые попадает, по крайней мере, определенная часть (p) популяции с заданным уровнем достоверности (1-α)». «(P, 1-α) интервал допуска (TI), основанный на выборке, построен так, чтобы он включал по крайней мере долю p выборочной совокупности с достоверностью 1-α; такой TI обычно упоминается как p- содержание - (1 − α) покрытие TI. " "A (p, 1 − α) верхний предел допуска (TL) - это просто верхний доверительный предел 1 − α для 100 p процентиля совокупности. "

Интервал допуска можно рассматривать как статистическую версию файла. «В случае с известными параметрами 95% интервал допуска и 95% прогнозный интервал совпадают». Если бы мы знали точные параметры популяции, мы могли бы вычислить диапазон, в который попадает определенная часть населения. Например, если мы знаем, что популяция нормально распределена с mean μ {\ displaystyle \ mu}\ mu и стандартным отклонением σ {\ displaystyle \ sigma}\ sigma , тогда интервал μ ± 1,96 σ {\ displaystyle \ mu \ pm 1.96 \ sigma}\ mu \ pm 1.96 \ sigma включает 95% населения (1,96 - это z-показатель для 95% охвата нормально распределенной совокупности).

Однако, если у нас есть только выборка из генеральной совокупности, мы знаем только выборочное среднее μ ^ {\ displaystyle {\ hat {\ mu}}}{\ hat {\ mu}} и стандартное отклонение выборки σ ^ {\ displaystyle {\ hat {\ sigma}}}{\ hat {\ sigma}} , которые являются только оценками истинных параметров. В этом случае μ ^ ± 1,96 σ ^ {\ displaystyle {\ hat {\ mu}} \ pm 1,96 {\ hat {\ sigma}}}{\ hat {\ mu}} \ pm 1.96 {\ hat {\ sigma}} не обязательно будет включать 95% населения из-за разницы в этих оценках. Интервал допуска ограничивает эту дисперсию, вводя уровень достоверности γ {\ displaystyle \ gamma}\ gamma , который представляет собой уверенность, с которой этот интервал фактически включает указанную часть совокупности. Для нормально распределенной совокупности z-оценка может быть преобразована в «коэффициент k» или коэффициент допуска для заданного γ {\ displaystyle \ gamma}\ gamma с помощью таблиц поиска. или несколько аппроксимационных формул. «По мере приближения степеней свободы к бесконечности интервалы прогнозирования и допуска становятся равными».

Содержание
  • 1 Формулы
    • 1.1 Нормальный случай
  • 2 Отношение к другим интервалам
    • 2.1 Примеры
  • 3 Расчет
  • 4 См. Также
  • 5 Ссылки
  • 6 Дополнительная литература
Формулы

Нормальный случай

Отношение к другим интервалам

Интервал допуска менее широко известна, чем доверительный интервал и интервал прогнозирования, ситуация, на которую сетуют некоторые преподаватели, поскольку она может привести к неправильному использованию других интервалов, для которых более подходящим является интервал допуска.

Интервал допуска отличается от доверительного интервала тем, что доверительный интервал ограничивает однозначный параметр генеральной совокупности (среднее или дисперсия для пример) с некоторой уверенностью, в то время как интервал допуска ограничивает диапазон значений данных, который включает определенную долю населения. В то время как размер доверительного интервала полностью обусловлен ошибкой выборки и приближается к интервалу нулевой ширины при истинном параметре генеральной совокупности по мере увеличения размера выборки, размер интервала допуска частично обусловлен ошибкой выборки и частично фактическим дисперсия в генеральной совокупности и будет приближаться к вероятностному интервалу генеральной совокупности по мере увеличения размера выборки.

Интервал допуска связан с интервалом прогнозирования в том смысле, что оба они ограничивают вариацию в будущих выборках. Однако интервал прогнозирования ограничивает только одну будущую выборку, тогда как интервал допуска ограничивает всю совокупность (эквивалентно, произвольную последовательность будущих выборок). Другими словами, интервал прогнозирования в среднем покрывает указанную долю генеральной совокупности, тогда как интервал допуска покрывает его с определенным уровнем достоверности, что делает интервал допуска более подходящим, если один интервал предназначен для привязки нескольких будущих выборок.

Примеры

дает следующий пример:

Итак, рассмотрим еще раз пресловутый тестовый сценарий EPA пробег, в котором несколько номинально идентичных автомобилей определенного Модель тестируется на получение значений пробега y 1, y 2,..., y n {\ displaystyle y_ {1}, y_ {2},..., y_ {n}}y_ {1}, y_ {2},..., y_ {n} . Если такие данные обрабатываются для получения 95% доверительного интервала для среднего пробега модели, можно, например, использовать его для прогнозирования среднего или общего расхода бензина для произведенного парка таких автомобилей на первые 5000 миль. использования. Такой интервал, однако, не очень поможет человеку, арендующему одну из этих машин и задающемуся вопросом, хватит ли (полного) 10-галлонного бака бензина, чтобы довести его до места назначения на 350 миль. Для этой работы гораздо более полезен интервал прогнозирования. (Рассмотрим различные значения «уверенности на 95%», что μ ≥ 35 {\ displaystyle \ mu \ geq 35}\ mu \ geq 35 , а не «уверенности на 95%», что yn + 1 ≥ 35 {\ displaystyle y_ {n + 1} \ geq 35}y _ {{n + 1}} \ geq 35 .) Но ни доверительный интервал для μ {\ displaystyle \ mu}\ mu , ни интервал прогноза для один дополнительный пробег - это именно то, что нужно инженеру-конструктору, которому поручено определить, какой размер бензобака действительно необходим модели, чтобы гарантировать, что 99% произведенных автомобилей будут иметь запас хода в 400 миль. На самом деле инженеру нужен интервал допуска для доли p =.99 {\ displaystyle p =.99}p=.99миль таких автомобилей.

Другой пример:

Уровни содержания свинца в воздухе были получены в n = 15 {\ displaystyle n = 15}n=15различных областях на предприятии. Было отмечено, что логарифмически преобразованные уровни свинца хорошо подходят для нормального распределения (то есть данные взяты из логнормального распределения. Пусть μ {\ displaystyle \ mu}\ mu и σ 2 {\ displaystyle \ sigma ^ {2}}\ sigma ^ {2} , соответственно, обозначают среднее значение генеральной совокупности и дисперсию для данных, преобразованных в журнал. Если X {\ displaystyle X}Xобозначает соответствующую случайную величину, таким образом, мы имеем X ∼ N (μ, σ 2) {\ displaystyle X \ sim {\ mathcal {N}} (\ mu, \ sigma ^ {2})}X \ sim {\ mathcal {N}} ( \ mu, \ sigma ^ {2}) . Отметим, что exp ⁡ (μ) {\ displaystyle \ exp (\ mu)}{\ displaystyle \ exp (\ mu)} - это средний уровень свинца в воздухе. Доверительный интервал для μ { \ displaystyle \ mu}\ mu можно построить обычным способом на основе t-распределения ; это, в свою очередь, обеспечит доверительный интервал для среднего уровня опережения в воздухе. Если X ¯ {\ displaystyle {\ bar {X}}}{\ bar {X}} и S {\ displaystyle S}Sобозначают выборочное среднее и стандартное отклонение данных, преобразованных в журнал для образец размера n, 95% c Интервал достоверности для μ {\ displaystyle \ mu}\ mu задается как X ¯ ± tn - 1, 0,975 S / (n) {\ displaystyle {\ bar {X}} \ pm t_ {n-1,0.975} S / {\ sqrt {(}} n)}{\ bar {X}} \ pm t _ {{n-1,0.975}} S / {\ sqrt (} n) , где tm, 1 - α {\ displaystyle t_ {m, 1- \ alpha}}t _ {{m, 1- \ alpha}} обозначает квантиль 1 - α {\ displaystyle 1- \ alpha}1 - \ alpha t-распределения с m {\ displaystyle m}m степеней свободы. Также может быть интересным получение 95% верхней доверительной границы для среднего уровня свинца в воздухе. Такая граница для μ {\ displaystyle \ mu}\ mu задается как X ¯ + tn - 1, 0,95 S / n {\ displaystyle {\ bar {X}} + t_ { n-1,0.95} S / {\ sqrt {n}}}{\ bar {X}} + t _ {{n-1,0.95}} S / {\ sqrt {n}} . Следовательно, верхний доверительный интервал 95% для медианного упреждения по воздуху определяется как exp ⁡ (X ¯ + tn - 1, 0,95 S / n) {\ displaystyle \ exp {\ left ({\ bar {X}} + t_ {n-1,0.95} S / {\ sqrt {n}} \ right)}}\ exp {\ left ({\ bar {X}} + t _ {{n-1,0.95}} S / {\ sqrt {n}} \ right)} . Теперь предположим, что мы хотим спрогнозировать уровень содержания свинца в воздухе в определенной области лаборатории. Верхний предел прогноза 95% для логарифмически преобразованного уровня интереса задается как X ¯ + tn - 1, 0,95 S (1 + 1 / n) {\ displaystyle {\ bar {X}} + t_ {n- 1,0.95} S {\ sqrt {\ left (1 + 1 / n \ right)}}}{\ bar {X}} + t _ {{n-1,0.95}} S {\ sqrt {\ left (1 + 1 / n \ right)}} . Аналогичным образом может быть вычислен интервал двустороннего прогнозирования. Значение и интерпретация этих интервалов хорошо известны. Например, если доверительный интервал X ¯ ± tn - 1, 0,975 S / n {\ displaystyle {\ bar {X}} \ pm t_ {n-1,0,975} S / {\ sqrt {n}} }{\ bar {X}} \ pm t _ {{n-1,0.975}} S / {\ sqrt {n}} многократно вычисляется из независимых выборок, 95% вычисленных таким образом интервалов будут включать истинное значение μ {\ displaystyle \ mu}\ mu в долгосрочной перспективе. Другими словами, интервал предназначен для предоставления информации, касающейся только параметра μ {\ displaystyle \ mu}\ mu . Интервал прогнозирования имеет аналогичную интерпретацию и предназначен для предоставления информации только об одном уровне интереса. Теперь предположим, что мы хотим использовать выборку, чтобы сделать вывод, действительно ли по крайней мере 95% уровней опережения населения ниже порогового значения. Доверительный интервал и интервал прогнозирования не могут ответить на этот вопрос, поскольку доверительный интервал предназначен только для медианного уровня опережения, а интервал прогнозирования - только для одного уровня опережения. Требуется интервал допуска; более конкретно, верхний предел допуска. Верхний предел допуска должен вычисляться при условии, что по крайней мере 95% уровней опережения совокупности ниже предела, с определенным уровнем достоверности, скажем, 99%.

Расчет

Односторонний Нормальные интервалы допусков имеют точное решение в терминах выборочного среднего и выборочной дисперсии на основе нецентрального t-распределения. Двусторонние интервалы нормального допуска могут быть получены на основе нецентрального распределения хи-квадрат.

См. Также
Литература
Дополнительная информация
  • Хан, Джеральд Дж.; Микер, Уильям Q.; Эскобар, Луис А. (2017). Статистические интервалы: Руководство для практиков и исследователей (2-е изд.). John Wiley Sons, Incorporated. ISBN 978-0-471-68717-7.
Последняя правка сделана 2021-06-11 05:36:21
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте