Конструкция Неймана - это частотный метод для построения интервала с уровнем достоверности таким образом, что если мы повторим эксперимент много раз, интервал будет содержать истинное значение некоторого параметра в дробной части времени. Он назван в честь Ежи Неймана.
Содержание
- 1 Теория
- 2 Вероятность покрытия
- 3 Реализация
- 4 Классический пример
- 5 Другой пример
- 6 См. Также
- 7 Ссылки
Теория
Предположим - случайные величины с объединенным pdf , который зависит от k неизвестных параметров. Для удобства пусть будет пространством выборки, определяемым n случайными величинами, и затем определим точку выборки в пространстве выборки как . Нейман первоначально предложил определить две функции и так, что для любой точки выборки ,
- L и U однозначны и определены.
Учитывая наблюдение, , вероятность того, что находится между и определяется как с вероятностью Только или . Эти вычисленные вероятности не позволяют сделать значимый вывод о , поскольку вероятность равна нулю или единице. Кроме того, в соответствии с частотной конструкцией параметры модели являются неизвестными константами и не могут быть случайными величинами. Например, если , то . Аналогично, если , то
Как описывает Нейман в своей статье 1937 года, предположим, что мы рассматриваем все точки в пространстве выборки, то есть , которые представляют собой систему случайных величин, определяемую объединенным PDF-файлом, описанным выше. Поскольку и являются функциями они тоже являются случайными величинами, и можно исследовать значение следующего утверждения вероятности:.
- В рамках частотной конструкции параметры модели являются неизвестными константами и не могут быть случайными величинами. Рассматривая все точки выборки в пространстве выборки как случайные величины, определенные вышеупомянутым объединенным PDF-файлом, то есть все можно показать, что и являются функциями случайных величин и, следовательно, случайных величин. Следовательно, можно посмотреть на вероятность и для некоторых . Если - истинное значение , мы можем определить и так, чтобы вероятность и равно предварительно заданному уровню достоверности .
То есть где где и верхний и нижний доверительные границы для
Вероятность охвата
Вероятность охвата, , для конструкции Неймана - частота расчетов Предполагается, что доверительный интервал содержит фактическое интересующее значение. Обычно вероятность охвата устанавливается равной достоверности. Для построения Неймана вероятность покрытия устанавливается равной некоторому значению , где
Реализация
Конструкция Неймана может быть выполнена путем выполнения нескольких экспериментов, которые создают наборы данных, соответствующие заданному значению параметра. Эксперименты проводятся с использованием традиционных методов, а пространство подобранных значений параметров составляет полосу, из которой может быть выбран доверительный интервал.
Классический пример
График 50 доверительных интервалов из 50 выборок, созданных из нормального распределения.
Предположим, X {\ displaystyle X}~N (θ, σ 2) {\ displaystyle N (\ theta, \ sigma ^ {2})}, где θ {\ displaystyle \ theta}и σ 2 {\ displaystyle \ sigma ^ {2}}- неизвестные константы, для которых мы хотим оценить θ {\ displaystyle \ theta}. Мы можем определить (2) функции с одним значением, L {\ displaystyle L}и U {\ displaystyle U}, которые определены описанным выше процессом, так что заранее заданный уровень достоверности C {\ displaystyle C}и случайная выборка X ∗ {\ displaystyle X ^ {*}}=(x 1, x 2,... xn {\ displaystyle x_ {1}, x_ {2},... x_ {n}})
- L (X ∗) = x ¯ - tsn {\ displaystyle L (X ^ {*}) = {\ бар {x}} - {\ frac {ts} {\ sqrt {n}}}}
- U (X ∗) = x ¯ + tsn {\ displaystyle U (X ^ {*}) = {\ bar {x }} + {\ frac {ts} {\ sqrt {n}}}}
- где x ¯ = 1 n ∑ i = 1 nxi = 1 n (x 1, x 2,... xn) {\ displaystyle {\ bar {x}} = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} x_ {i} = {\ frac {1} {n}} (x_ {1}, x_ {2},... x_ {n})}, s = 1 n - 1 ∑ i = 1 n (xi - x ¯) 2 {\ displaystyle s = {\ sqrt {{\ гидроразрыв {1} {n-1}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ bar {x}}) ^ {2}}}}
- и t {\ displaystyle t}следует в распределении с (n-1) степенями свободы. t {\ displaystyle t}~t(1 - C / 2, n - 1) {\ displaystyle ({1-C} / 2, n-1)}
Другой пример
X 1, X 2,..., X n {\ displaystyle X_ {1}, X_ {2},..., X_ {n}}- случайные переменные iid, и пусть T = (X 1, X 2,..., XZ n) {\ displaystyle T = (X_ {1}, X_ {2},..., XZ_ {n})}. Предположим, T ∼ N (μ, σ 2) {\ displaystyle T \ sim N (\ mu, \ sigma ^ {2})}. Теперь построим доверительный интервал с уровнем достоверности C {\ displaystyle C}. Мы знаем, что x ¯ {\ displaystyle {\ bar {x}}}достаточно для μ {\ displaystyle \ mu}. Итак,
- p (- Z α 2 ≤ x ¯ - μ σ 2 ≤ Z α 2) = C {\ displaystyle p (-Z _ {\ frac {\ alpha} {2}} \ leq {\ frac {{ \ bar {x}} - \ mu} {\ sigma ^ {2}}} \ leq Z _ {\ frac {\ alpha} {2}}) = C}
- p (- Z α 2 σ 2 ≤ x ¯ - μ ≤ Z α 2 σ 2) знак равно C {\ displaystyle p (-Z _ {\ frac {\ alpha} {2}} \ sigma ^ {2} \ leq {\ bar {x}} - \ mu \ leq Z _ {\ frac {\ alpha} {2}} \ sigma ^ {2}) = C}
- p (x ¯ - Z α 2 σ 2 ≤ μ ≤ x ¯ + Z α 2 σ 2) = C { \ displaystyle p ({\ bar {x}} - Z _ {\ frac {\ alpha} {2}} \ sigma ^ {2} \ leq \ mu \ leq {\ bar {x}} + Z _ {\ frac {\ alpha} {2}} \ sigma ^ {2}) = C}
Это дает 100 (C)% {\ displaystyle 100 (C) \%}доверительный интервал для μ {\ displaystyle \ mu}где,
- L (T) = x ¯ - Z α 2 σ 2 {\ displaystyle L (T) = {\ bar {x}} - Z_ {\ гидроразрыва {\ alpha} {2}} \ sigma ^ {2}}
- U (T) = x ¯ + Z α 2 σ 2 {\ displaystyle U (T) = {\ bar {x}} + Z _ {\ frac {\ alpha} {2}} \ sigma ^ {2}}.
См. Также
Ссылки