дополнительная статистика - это показатель из выборки, которой ция не зависит от параметров модели. Вспомогательная статистика - это основная величина, которая также является статистикой. Дополнительная статистика может использоваться для построения интервалов прогноза.
Эта концепция была введена статистическим генетиком сэром Рональдом Фишером.
Предположим, что X 1,..., X n являются независимыми и одинаково распределенными, и нормально распределены с неизвестным ожидаемым значением μ и известной дисперсией 1. Пусть
быть средним по выборке.
Следующие статистические меры дисперсии выборки
- это все вспомогательные статистические данные, поскольку их распределения выборки не меняются при изменении μ. С вычислительной точки зрения это происходит потому, что в формулах члены μ отменяют - добавление постоянного числа к распределению (и всем выборкам) изменяет его максимум и минимум выборки на одну и ту же величину, поэтому это не меняет их разницы, как и для других: эти меры дисперсии не зависят от местоположения.
И наоборот, для нормальных переменных iid с известным средним значением 1 и неизвестной дисперсией σ, выборочное среднее не является вспомогательной статистикой дисперсии, так как выборочное распределение выборочного среднего равно N (1, σ / n), которое зависит от σ - этой меры местоположения (в частности, его стандартная ошибка ) зависит от дисперсии.
Учитывая статистику T, которая не достаточна, вспомогательное дополнение - это статистика U, которая является вспомогательной и такая, что (T, U) достаточно. Интуитивно понятно, что вспомогательное дополнение «добавляет недостающую информацию» (без дублирования).
Статистика особенно полезна, если взять T как оценку максимального правдоподобия, чего в общем случае недостаточно; тогда можно попросить вспомогательное дополнение. В этом случае Фишер утверждает, что для определения информационного содержания необходимо условие о дополнительном дополнении: следует рассматривать содержание информации Фишера для T не как маргинальное значение T, а как условное распределение T, заданное U: сколько информации добавляет T? Это невозможно в общем случае, поскольку не существует необходимости во вспомогательном дополнении, а если он существует, он не обязательно должен быть уникальным, и не существует максимального дополнительного дополнения.
В бейсбол предположим, что разведчик наблюдает за отбивающим в N бит-битах. Предположим (нереально), что число N выбрано каким-то случайным процессом, который не зависит от способностей отбивающего - скажем, после каждого бита бросается монета, и результат определяет, останется ли разведчик наблюдать за следующий на летучей мыши. Возможные данные - это количество N летучих мышей и количество X попаданий: данные (X, N) являются достаточной статистикой. Наблюдаемое среднее значение X / N не может передать всю информацию, доступную в данных, потому что оно не может сообщить количество N летучих мышей (например, среднее значение 0,400, что составляет очень высокий, основанный только на пяти битах, не внушает такой уверенности в способностях игрока, как среднее значение 0,400, основанное на 100 битах). Число ат-летучих мышей N является вспомогательной статистикой, потому что
Эта дополнительная статистика является дополнительным дополнением к наблюдаемому среднему значению X / N, т. е. среднее значение X / N не является достаточная статистика, в том смысле, что она передает меньше всей релевантной информации в данных, но в сочетании с N становится достаточной.