Дополнительная статистика

редактировать

дополнительная статистика - это показатель из выборки, которой ция не зависит от параметров модели. Вспомогательная статистика - это основная величина, которая также является статистикой. Дополнительная статистика может использоваться для построения интервалов прогноза.

Эта концепция была введена статистическим генетиком сэром Рональдом Фишером.

Содержание
  • 1 Пример
  • 2 Вспомогательное дополнение
    • 2.1 Пример
  • 3 См. Также
  • 4 Примечания
Пример

Предположим, что X 1,..., X n являются независимыми и одинаково распределенными, и нормально распределены с неизвестным ожидаемым значением μ и известной дисперсией 1. Пусть

X ¯ n = X 1 + ⋯ + X nn {\ displaystyle {\ overline {X}} _ {n} = {\ frac {X_ {1} + \, \ cdots \, + X_ {n} } {n}}}\ overline {X} _n = \ frac {X_1 + \, \ cdots \, + X_n} {n}

быть средним по выборке.

Следующие статистические меры дисперсии выборки

σ ^ 2: = ∑ (X i - X ¯) 2 n {\ displaystyle {\ hat {\ sigma}} ^ {2}: = \, {\ frac {\ sum \ left (X_ {i } - {\ overline {X}} \ right) ^ {2}} {n}}}\ hat {\ sigma} ^ 2: = \, \ frac {\ sum \ left (X_i- \ overline {X} \ right) ^ 2} {n}

- это все вспомогательные статистические данные, поскольку их распределения выборки не меняются при изменении μ. С вычислительной точки зрения это происходит потому, что в формулах члены μ отменяют - добавление постоянного числа к распределению (и всем выборкам) изменяет его максимум и минимум выборки на одну и ту же величину, поэтому это не меняет их разницы, как и для других: эти меры дисперсии не зависят от местоположения.

И наоборот, для нормальных переменных iid с известным средним значением 1 и неизвестной дисперсией σ, выборочное среднее X ¯ {\ display style {\ overline {X}}}{\ overline {X}} не является вспомогательной статистикой дисперсии, так как выборочное распределение выборочного среднего равно N (1, σ / n), которое зависит от σ - этой меры местоположения (в частности, его стандартная ошибка ) зависит от дисперсии.

Вспомогательное дополнение

Учитывая статистику T, которая не достаточна, вспомогательное дополнение - это статистика U, которая является вспомогательной и такая, что (T, U) достаточно. Интуитивно понятно, что вспомогательное дополнение «добавляет недостающую информацию» (без дублирования).

Статистика особенно полезна, если взять T как оценку максимального правдоподобия, чего в общем случае недостаточно; тогда можно попросить вспомогательное дополнение. В этом случае Фишер утверждает, что для определения информационного содержания необходимо условие о дополнительном дополнении: следует рассматривать содержание информации Фишера для T не как маргинальное значение T, а как условное распределение T, заданное U: сколько информации добавляет T? Это невозможно в общем случае, поскольку не существует необходимости во вспомогательном дополнении, а если он существует, он не обязательно должен быть уникальным, и не существует максимального дополнительного дополнения.

Пример

В бейсбол предположим, что разведчик наблюдает за отбивающим в N бит-битах. Предположим (нереально), что число N выбрано каким-то случайным процессом, который не зависит от способностей отбивающего - скажем, после каждого бита бросается монета, и результат определяет, останется ли разведчик наблюдать за следующий на летучей мыши. Возможные данные - это количество N летучих мышей и количество X попаданий: данные (X, N) являются достаточной статистикой. Наблюдаемое среднее значение X / N не может передать всю информацию, доступную в данных, потому что оно не может сообщить количество N летучих мышей (например, среднее значение 0,400, что составляет очень высокий, основанный только на пяти битах, не внушает такой уверенности в способностях игрока, как среднее значение 0,400, основанное на 100 битах). Число ат-летучих мышей N является вспомогательной статистикой, потому что

  • это часть наблюдаемых данных (это статистика), а
  • его распределение вероятностей не зависит от способности бьющего, поскольку оно был выбран случайным образом, независимо от способности тестирующего.

Эта дополнительная статистика является дополнительным дополнением к наблюдаемому среднему значению X / N, т. е. среднее значение X / N не является достаточная статистика, в том смысле, что она передает меньше всей релевантной информации в данных, но в сочетании с N становится достаточной.

См. Также
Примечания
Последняя правка сделана 2021-06-10 23:03:33
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте