Полосы уверенности и прогнозов

редактировать

A доверительный интервал используется в статистическом анализе для представления неопределенности в оценке кривой или функции на основе ограниченных или зашумленных данных. Точно так же диапазон предсказания используется для представления неопределенности относительно значения новой точки данных на кривой, но подверженной шуму. Полосы уверенности и прогноза часто используются как часть графического представления результатов регрессионного анализа ..

Полосы уверенности тесно связаны с доверительными интервалами, которые представляют неопределенность в оценке одного численная величина. «Поскольку доверительные интервалы по своей конструкции относятся только к одной точке, они уже (в этой точке), чем доверительная полоса, которая должна удерживаться одновременно во многих точках».

Содержание

1 Точечная и одновременная достоверность Полосы
2 Полосы достоверности в регрессионном анализе
3 Полосы достоверности для распределений вероятностей
4 Другие применения доверительных диапазонов
5 Полосы прогноза
6 Ссылки

Точечные и одновременные доверительные интервалы

Предположим, наша цель - оценить функцию f (x). Например, f (x) может быть долей людей определенного возраста x, которые поддерживают данного кандидата на выборах. Если x измеряется с точностью до одного года, мы можем построить отдельный 95% доверительный интервал для каждого возраста. Каждый из этих доверительных интервалов покрывает соответствующее истинное значение f (x) с достоверностью 0,95. Взятые вместе, эти доверительные интервалы составляют 95% точечный доверительный интервал для f (x).

Выражаясь математически, точечный доверительный интервал $f ^ (x) ± w (x) {\ displaystyle {\ hat {f}} (x) \ pm w (x)}$ ${\ hat {f}} (x) \ pm w (x)$ с вероятностью охвата 1 - α удовлетворяет следующему условию отдельно для каждого значения x:

Pr (f ^ (x) - w (x) ≤ f (x) ≤ f ^ (x) + w (x))) Знак равно 1 - α, {\ Displaystyle \ Pr {\ Big (} {\ hat {f}} (x) -w (x) \ leq f (x) \ leq {\ hat {f}} (x) + w (x) {\ Big)} = 1- \ alpha,}

{\ displaystyle \ Pr {\ Big (} {\ hat {f}} (x) -w (x) \ leq f (x) \ leq {\ hat {f}} (x) + w (x) {\ Big)} = 1- \ alpha,}

где $f ^ (x) {\ displaystyle {\ hat {f}} (x)}$ $\ hat {f} (x)$ - точечная оценка f (x).

Вероятность одновременного охвата совокупности доверительных интервалов - это вероятность того, что все они охватывают свои соответствующие истинные значения одновременно. В приведенном выше примере вероятность одновременного охвата - это вероятность того, что интервалы для x = 18,19,... все охватывают свои истинные значения (при условии, что 18 - самый молодой возраст, в котором человек может голосовать). Если каждый интервал в отдельности имеет вероятность охвата 0,95, вероятность одновременного охвата обычно меньше 0,95. 95% одновременный доверительный интервал - это совокупность доверительных интервалов для всех значений x в области f (x), рассчитанная так, чтобы иметь вероятность одновременного охвата 0,95.

С математической точки зрения, диапазон одновременной достоверности $f ^ (x) ± w (x) {\ displaystyle {\ hat {f}} (x) \ pm w (x)}$ ${\ hat {f}} (x) \ pm w (x)$ с вероятностью охвата 1 - α удовлетворяет следующему условию:

Pr (f ^ (x) - w (x) ≤ f (x) ≤ f ^ (x) + w (x) для всех x) = 1 - α. {\ Displaystyle \ Pr {\ Big (} {\ hat {f}} (x) -w (x) \ leq f (x) \ leq {\ hat {f}} (x) + w (x) \; \; {\ text {для всех}} x {\ Big)} = 1- \ alpha.}

{\ displaystyle \ Pr {\ Big (} {\ hat {f}} (x) -w (x) \ leq f (x) \ leq {\ hat {f}} (x) + w (x) \; \; {\ text {для всех}} x {\ Большой)} = 1- \ альфа.}

Почти во всех случаях диапазон одновременной достоверности будет шире, чем диапазон точечной достоверности с той же вероятностью охвата. В определении точечной доверительной полосы этот универсальный квантор выходит за пределы функции вероятности.

Полосы уверенности для смоделированных данных, отражающие долю избирателей, поддерживающих данного кандидата на выборах, в зависимости от возраста избирателей. Показаны точечные 95% доверительные интервалы и одновременные 95% доверительные интервалы, построенные с использованием поправки Бонферрони.

Доверительные полосы в регрессионном анализе

Доверительные полосы обычно возникают в регрессионном анализе . В случае простой регрессии, включающей одну независимую переменную, результаты могут быть представлены в виде графика, показывающего оценочную линию регрессии вместе с точечными или одновременными доверительными полосами. Обычно используемые методы для построения одновременных доверительных интервалов в регрессии - это методы Бонферрони и Шеффе ; см. Семейные процедуры управления частотой ошибок для получения дополнительной информации.

Доверительные интервалы для простого линейного регрессионного анализа с использованием смоделированных данных. Показаны точечные 95% доверительные интервалы и одновременные 95% доверительные интервалы, построенные с использованием метода Шеффе.

Доверительные интервалы для вероятностных распределений

Доверительные интервалы могут быть построены вокруг оценок эмпирическая функция распределения. Простая теория позволяет построить точечные доверительные интервалы, но также возможно построить одновременную доверительную полосу для кумулятивной функции распределения в целом, инвертируя критерий Колмогорова-Смирнова или используя не- методы параметрического правдоподобия.

Другие применения доверительных интервалов

Доверительные интервалы возникают всякий раз, когда статистический анализ фокусируется на оценке функции.

Полосы уверенности также были разработаны для оценок функций плотности, функций спектральной плотности, функций квантиля, сглаживания диаграммы рассеяния, функции выживаемости и характеристические функции.

Полосы прогнозирования

Полосы прогнозирования связаны с интервалами прогнозирования таким же образом, как и доверительные интервалы. доверительным интервалам. Полосы прогнозов обычно возникают при регрессионном анализе. Цель диапазона прогнозов - охватить с заданной вероятностью значения одного или нескольких будущих наблюдений из той же совокупности, из которой был выбран данный набор данных. Так же, как интервалы предсказания шире доверительных интервалов, диапазоны предсказаний будут шире доверительных интервалов.

С математической точки зрения, диапазон прогнозов $f ^ (x) ± w (x) {\ displaystyle {\ hat {f}} (x) \ pm w (x)}$ ${\ hat {f}} (x) \ pm w (x)$ с вероятностью охвата 1 - α удовлетворяет следующему условию для каждого значения x:

Pr (f ^ (x) - w (x) ≤ y ∗ ≤ f ^ (x) + w (x)) = 1 - α, {\ displaystyle \ Pr {\ Big (} {\ hat {f}} (x) -w (x) \ leq y ^ {*} \ leq {\ hat {f}} (x) + w ( x) {\ Big)} = 1- \ alpha,}

{\ displaystyle \ Pr {\ Big (} {\ hat {f}} (x) -w (x) \ leq y ^ {*} \ leq {\ hat {f}} (x) + w (x) {\ Big)} = 1- \ alpha,}

где y - наблюдение, полученное в процессе генерации данных в данной точке x, которое не зависит от данных, используемых для построения точечной оценки $f ^ (x) {\ displaystyle {\ hat {f}} (x)}$ $\ hat {f} (x)$ и доверительный интервал w (x). Это интервал точечного предсказания. Можно было бы построить одновременный интервал для конечного числа независимых наблюдений, используя, например, метод Бонферрони, чтобы расширить интервал на соответствующую величину.

Ссылки