Конструкция Неймана

редактировать

Конструкция Неймана - это частотный метод для построения интервала с уровнем достоверности $C, {\ displaystyle C, \,}$ ${\ displaystyle C, \,}$ таким образом, что если мы повторим эксперимент много раз, интервал будет содержать истинное значение некоторого параметра в дробной части $C {\ displaystyle C \,}$ $C\,$ времени. Он назван в честь Ежи Неймана.

Содержание

1 Теория
2 Вероятность покрытия
3 Реализация
4 Классический пример
5 Другой пример
6 См. Также
7 Ссылки

Теория

Предположим $X 1, X 2,... X n {\ displaystyle X_ {1}, X_ {2},... X_ {n}}$ ${\ displaystyle X_ {1}, X_ {2},... X_ {n} }$ - случайные величины с объединенным pdf $f (x 1, x 2,... xn | θ 1, θ 2,..., θ k) {\ displaystyle f (x_ {1}, x_ {2},... x_ {n} | \ theta _ {1}, \ theta _ {2},..., \ theta _ {k})}$ ${\ displaystyle f (x_ {1}, x_ {2},... x_ {n} | \ theta _ {1}, \ theta _ {2},..., \ theta _ {k})}$ , который зависит от k неизвестных параметров. Для удобства пусть $Θ {\ displaystyle \ Theta}$ $\ Theta$ будет пространством выборки, определяемым n случайными величинами, и затем определим точку выборки в пространстве выборки как $X = (X 1, X 2,... X n) {\ displaystyle X = (X_ {1}, X_ {2},... X_ {n})}$ ${\ displaystyle X = (X_ {1}, X_ {2},... X_ {n})}$ . Нейман первоначально предложил определить две функции $L (x) {\ displaystyle L (x)}$ $L (x)$ и $U (x) {\ displaystyle U (x)}$ $U (x)$ так, что для любой точки выборки $X {\ displaystyle X}$ $X$ ,

$L (X) ≤ U (X) {\ displaystyle L (X) \ leq U (X)}$ ${ \ displaystyle L (X) \ leq U (X)}$ $∀ X ∈ Θ {\ displaystyle \ forall X \ in \ Theta}$ ${\ displaystyle \ forall X \ in \ Theta}$
L и U однозначны и определены.

Учитывая наблюдение, $X ′ {\ displaystyle X ^ {'}}$ $X^{'}$ , вероятность того, что $θ 1 {\ displaystyle \ theta _ {1}}$ $\ theta _ {1}$ находится между $L (X ′) {\ displaystyle L (X ^ {'})}$ $L(X^{'})$ и $U (X ′) {\ displaystyle U (X ^ {'})}$ $U(X^{'})$ определяется как $P (L (X ′) ≤ θ 1 ≤ U (X ′) | X ′) {\ displaystyle P (L (X ^ {'}) \ leq \ theta _ {1} \ leq U (X ^ {'}) | X ^ {'})}$ $P(L(X^{'})\leq \theta _{1}\leq U(X^{'})|X^{'})$ с вероятностью Только $0 {\ displaystyle 0}$ ${\ displaystyle 0}$ или $1 {\ displaystyle 1}$ $1$ . Эти вычисленные вероятности не позволяют сделать значимый вывод о $θ 1 {\ displaystyle \ theta _ {1}}$ $\ theta _ {1}$ , поскольку вероятность равна нулю или единице. Кроме того, в соответствии с частотной конструкцией параметры модели являются неизвестными константами и не могут быть случайными величинами. Например, если $θ 1 = 5 {\ displaystyle \ theta _ {1} = 5}$ ${\ displaystyle \ theta _ {1} = 5}$ , то $P (2 ≤ 5 ≤ 10) = 1 {\ displaystyle P (2 \ leq 5 \ leq 10) = 1}$ ${\ displaystyle P (2 \ leq 5 \ leq 10) = 1}$ . Аналогично, если $θ 1 = 11 {\ displaystyle \ theta _ {1} = 11}$ ${\ displaystyle \ theta _ {1} = 11}$ , то $P (2 ≤ 11 ≤ 10) = 0 {\ displaystyle P (2 \ leq 11 \ leq 10) = 0}$ ${\ displaystyle P (2 \ leq 11 \ leq 10) = 0}$

Как описывает Нейман в своей статье 1937 года, предположим, что мы рассматриваем все точки в пространстве выборки, то есть $∀ X ∈ Θ {\ displaystyle \ forall X \ in \ Theta}$ ${\ displaystyle \ forall X \ in \ Theta}$ , которые представляют собой систему случайных величин, определяемую объединенным PDF-файлом, описанным выше. Поскольку $L {\ displaystyle L}$ $L$ и $U {\ displaystyle U}$ $U$ являются функциями $X {\ displaystyle X}$ $X$ они тоже являются случайными величинами, и можно исследовать значение следующего утверждения вероятности:.

В рамках частотной конструкции параметры модели являются неизвестными константами и не могут быть случайными величинами. Рассматривая все точки выборки в пространстве выборки как случайные величины, определенные вышеупомянутым объединенным PDF-файлом, то есть все

X ∈ Θ {\ displaystyle X \ in \ Theta}

{\ displaystyle X \ in \ Theta}

можно показать, что

L {\ displaystyle L}

L

U {\ displaystyle U}

U

являются функциями случайных величин и, следовательно, случайных величин. Следовательно, можно посмотреть на вероятность

L (X) {\ displaystyle L (X)}

{\ displaystyle L (X)}

U (X) {\ displaystyle U (X)}

U (X)

для некоторых

X ∈ Θ {\ displaystyle X \ in \ Theta}

{\ displaystyle X \ in \ Theta}

. Если

θ 1 ′ {\ displaystyle \ theta _ {1} ^ {'}}

\theta _{1}^{'}

- истинное значение

θ 1 {\ displaystyle \ theta _ {1}}

\ theta _ {1}

, мы можем определить

L {\ displaystyle L}

L

U {\ displaystyle U}

U

так, чтобы вероятность

L (X) ≤ θ 1 ′ {\ displaystyle L (X) \ leq \ theta _ {1} ^ {'}}

L(X)\leq \theta _{1}^{'}

θ 1 ′ ≤ U (X) {\ displaystyle \ theta _ {1} ^ {'} \ leq U (X)}

\theta _{1}^{'}\leq U(X)

равно предварительно заданному уровню достоверности

, C {\ displaystyle, C}

{\ displaystyle, C }

То есть $П (L (Икс) ≤ θ 1 ′ ≤ U (X) | θ 1 ′) = С {\ Displaystyle P (L (X) \ leq \ theta _ {1} ^ {'} \ Leq U (X) | \ theta _ {1} ^ {'}) = C}$ $P(L(X)\leq \theta _{1}^{'}\leq U(X)|\theta _{1}^{'})=C$ где $0 ≤ C ≤ 1 {\ displaystyle 0 \ leq C \ leq 1}$ ${\ displaystyle 0 \ leq C \ leq 1}$ где $L (X) {\ displaystyle L (X)}$ ${\ displaystyle L (X)}$ и $U (X) {\ displaystyle U (X)}$ $U (X)$ верхний и нижний доверительные границы для $θ 1 {\ displaystyle \ theta _ {1}}$ $\ theta _ {1}$

Вероятность охвата

Вероятность охвата, $C {\ displaystyle C}$ $C$ , для конструкции Неймана - частота расчетов Предполагается, что доверительный интервал содержит фактическое интересующее значение. Обычно вероятность охвата устанавливается равной $95% {\ displaystyle 95 \%}$ ${\ displaystyle 95 \%}$ достоверности. Для построения Неймана вероятность покрытия устанавливается равной некоторому значению $C {\ displaystyle C}$ $C$ , где $0 < C < 1 {\displaystyle 0$ ${\ displaystyle 0 <C <1}$ . Это значение $C {\ displaystyle C}$ $C$ говорит о том, насколько уверенно истинное значение содержится в интервале.

Реализация

Конструкция Неймана может быть выполнена путем выполнения нескольких экспериментов, которые создают наборы данных, соответствующие заданному значению параметра. Эксперименты проводятся с использованием традиционных методов, а пространство подобранных значений параметров составляет полосу, из которой может быть выбран доверительный интервал.

Классический пример

График 50 доверительных интервалов из 50 выборок, созданных из нормального распределения.

Предположим, $X {\ displaystyle X}$ $X$ ~ $N (θ, σ 2) {\ displaystyle N (\ theta, \ sigma ^ {2})}$ ${\ Displaystyle N (\ theta, \ sigma ^ {2})}$ , где $θ {\ displaystyle \ theta}$ $\ theta$ и $σ 2 {\ displaystyle \ sigma ^ {2}}$ $\ sigma ^ {2}$ - неизвестные константы, для которых мы хотим оценить $θ {\ displaystyle \ theta}$ $\ theta$ . Мы можем определить (2) функции с одним значением, $L {\ displaystyle L}$ $L$ и $U {\ displaystyle U}$ $U$ , которые определены описанным выше процессом, так что заранее заданный уровень достоверности $C {\ displaystyle C}$ $C$ и случайная выборка $X ∗ {\ displaystyle X ^ {*}}$ $X^{*}$ =( $x 1, x 2,... xn {\ displaystyle x_ {1}, x_ {2},... x_ {n}}$ ${\ displaystyle x_ {1}, x_ {2},... x_ {n}}$ )

L (X ∗) = x ¯ - tsn {\ displaystyle L (X ^ {*}) = {\ бар {x}} - {\ frac {ts} {\ sqrt {n}}}}

{\ displaystyle L (X ^ {*}) = {\ bar {x}} - {\ fra c {ts} {\ sqrt {n}}}}

U (X ∗) = x ¯ + tsn {\ displaystyle U (X ^ {*}) = {\ bar {x }} + {\ frac {ts} {\ sqrt {n}}}}

{\ displaystyle U (X ^ {*}) = {\ bar {x}} + {\ гидроразрыв {ts} {\ sqrt {n}}}}

где

x ¯ = 1 n ∑ i = 1 nxi = 1 n (x 1, x 2,... xn) {\ displaystyle {\ bar {x}} = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} x_ {i} = {\ frac {1} {n}} (x_ {1}, x_ {2},... x_ {n})}

{\ displaystyle {\ bar {x}} = {\ frac {1} {n}} \ sum _ {i = 1} ^ { n} x_ {i} = {\ frac {1} {n}} (x_ {1}, x_ {2},... x_ {n})}

s = 1 n - 1 ∑ i = 1 n (xi - x ¯) 2 {\ displaystyle s = {\ sqrt {{\ гидроразрыв {1} {n-1}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ bar {x}}) ^ {2}}}}

{\ displaystyle s = {\ sqrt {{\ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ bar {x}}) ^ {2}}}}

t {\ displaystyle t}

t

следует в распределении с (n-1) степенями свободы.

t {\ displaystyle t}

t

(1 - C / 2, n - 1) {\ displaystyle ({1-C} / 2, n-1)}

{\ отображает tyle ({1-C} / 2, n-1)}

Другой пример

$X 1, X 2,..., X n {\ displaystyle X_ {1}, X_ {2},..., X_ {n}}$ ${\ displaystyle X_ {1}, X_ {2},..., X_ {n}}$ - случайные переменные iid, и пусть $T = (X 1, X 2,..., XZ n) {\ displaystyle T = (X_ {1}, X_ {2},..., XZ_ {n})}$ ${\ displaystyle T = (X_ {1}, X_ {2},..., XZ_ {n})}$ . Предположим, $T ∼ N (μ, σ 2) {\ displaystyle T \ sim N (\ mu, \ sigma ^ {2})}$ ${\ displaystyle T \ sim N (\ mu, \ sigma ^ {2})}$ . Теперь построим доверительный интервал с уровнем достоверности $C {\ displaystyle C}$ $C$ . Мы знаем, что $x ¯ {\ displaystyle {\ bar {x}}}$ ${\ bar {x}}$ достаточно для $μ {\ displaystyle \ mu}$ $\ mu$ . Итак,