В теории вероятностей, Гливенко –Теорема Кантелли, названная в честь Валерия Ивановича Гливенко и Франческо Паоло Кантелли, определяет асимптотическое поведение эмпирической функции распределения как число независимых и одинаково распределенных наблюдений растет.
Содержание
- 1 Утверждение
- 2 Доказательство
- 3 Эмпирические измерения
- 4 Класс Гливенко – Кантелли
- 5 Примеры
- 6 См. также
- 7 Ссылки
- 8 Дополнительная литература
Утверждение
Равномерная сходимость более общих эмпирических показателей становится важным свойством классов Гливенко – Кантелли функций или наборов. Классы Гливенко – Кантелли возникают в теории Вапника – Червоненкиса с приложениями к машинному обучению. В эконометрике можно найти приложения с использованием M-оценок.
Предположим, что - независимые и одинаково распределенные случайные величины в с общей кумулятивной функцией распределения . эмпирическая функция распределения для определяется как
где - это индикаторная функция набора . Для каждого (фиксированного) , представляет собой последовательность случайных величин, которые сходятся к почти наверняка по строгому закону больших чисел, то есть сходится к точечно. Гливенко и Кантелли усилили этот результат, доказав равномерную сходимость к .
Теорема
- почти наверняка.
Эта теорема берет свое начало от Валерия Гливенко и Франческо Кантелли в 1933 году.
Замечания
- Если - стационарный эргодический процесс, тогда почти наверняка сходится к . Теорема Гливенко – Кантелли дает более сильный способ сходимости, чем этот в случае iid.
- Еще более сильный результат равномерной сходимости для эмпирической функции распределения доступен в форме расширенного типа закона повторного логарифма. См. асимптотические свойства эмпирической функции распределения для получения этих и связанных результатов.
Доказательство
Для простоты рассмотрим случай непрерывной случайной величины . Исправьте
F n (x) - F (x) ≤ F n (xj) - F (xj - 1) = F n (xj) - F (xj) + 1 / m, F n (x) - F (x) ≥ F n (xj - 1) - F (xj) = F n (xj - 1) - F (xj - 1) - 1 / m. {\ displaystyle {\ begin {align} F_ {n} (x) -F (x) \ leq F_ {n} (x_ {j}) - F (x_ {j-1}) = F_ {n} ( x_ {j}) - F (x_ {j}) + 1 / m, \\ F_ {n} (x) -F (x) \ geq F_ {n} (x_ {j-1}) - F ( x_ {j}) = F_ {n} (x_ {j-1}) - F (x_ {j-1}) - 1 / m. \ end {align}}}
Следовательно, почти наверняка
| | F n - F | | ∞ = sup x ∈ R | F n (x) - F (x) | ≤ max j ∈ {1,…, m} | F n (x j) - F (x j) | + 1 / м. {\ displaystyle || F_ {n} -F || _ {\ infty} = \ sup _ {x \ in \ mathbb {R}} | F_ {n} (x) -F (x) | \ leq \ max _ {j \ in \ {1, \ dots, m \}} | F_ {n} (x_ {j}) - F (x_ {j}) | + 1 / m.}
Поскольку макс. j ∈ {1,…, m} | F n (x j) - F (x j) | → 0 п.н. {\ textstyle \ max _ {j \ in \ {1, \ dots, m \}} | F_ {n} (x_ {j}) - F (x_ {j}) | \ to 0 {\ text {as} }}по строгому закону больших чисел мы можем гарантировать, что для любого целого числа m {\ textstyle m}мы найдем N {\ textstyle N}так, что для всех n ≥ N {\ displaystyle n \ geq N}
| | F n - F | | ∞ ≤ 1 / м п.н. {\ displaystyle || F_ {n} -F || _ {\ infty} \ leq 1 / m {\ text {a.s.}}},
, что является определением почти надежной сходимости.
Эмпирические меры
Можно обобщить эмпирическую функцию распределения, заменив набор (- ∞, x] {\ displaystyle (- \ infty, x]}произвольным набором C из класса наборов C {\ displaystyle {\ mathcal {C}}}для получения эмпирической меры, индексированной наборами C ∈ С. {\ Displaystyle С \ in {\ mathcal {C}}.}
- п n (C) = 1 n ∑ я = 1 n IC (X i), C ∈ C {\ displaystyle P_ {n} (C) = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} I_ {C} (X_ {i}), C \ in {\ mathcal {C}}}
Где IC (x) {\ displaystyle I_ {C} (x)}- это индикаторная функция каждого набора C {\ displaystyle C}.
Дальнейшее обобщение - это отображение, индуцированное P n {\ displaystyle P_ {n}}на измеримых вещественнозначных функциях f, которое задается как
- f ↦ P nf = ∫ S fd П N знак равно 1 N ∑ я знак равно 1 NF (Икс я), е е F. {\ Displaystyle F \ mapsto P_ {п} е = \ int _ {S} е \, dP_ {п} = {\ гидроразрыва {1 } {n}} \ sum _ {i = 1} ^ {n} f (X_ {i}), f \ in {\ mathcal {F}}.}
Тогда это становится важным свойством е классы, которые строгий закон больших чисел равномерно выполняется на F {\ displaystyle {\ mathcal {F}}}или C {\ displaystyle {\ mathcal {C}}}.
Класс Гливенко – Кантелли
Рассмотрим набор S {\ displaystyle {\ mathcal {S}}}с сигма-алгеброй Борелевские подмножества A и вероятностная мера P. Для класса подмножеств
- C ⊂ {C: C - измеримое подмножество S} {\ displaystyle {\ mathcal {C}} \ subset \ {C: C {\ t_dv {- измеримое подмножество}} {\ mathcal {S}} \}}
и класс функций
- F ⊂ {f: S → R, f измеримо} {\ displaystyle {\ mathcal {F}} \ subset \ {f: {\ mathcal {S}} \ to \ mathbb {R}, f {\ t_dv {измеримо}} \, \}}
определяют случайные величины
- ‖ P n - P ‖ C = sup C ∈ C | P n (C) - P (C) | {\ displaystyle \ | P_ {n} -P \ | _ {\ mathcal {C}} = \ sup _ {C \ in {\ mathcal {C}}} | P_ {n} (C) -P (C) |}
- ‖ P n - P ‖ F = sup f ∈ F | P n f - P f | {\ displaystyle \ | P_ {n} -P \ | _ {\ mathcal {F}} = \ sup _ {f \ in {\ mathcal {F}}} | P_ {n} f-Pf |}
где P n (C) {\ displaystyle P_ {n} (C)}- эмпирическая мера, P nf {\ displaystyle P_ {n} f}- соответствующая карта, а
- E f = ∫ S fd P = P f {\ displaystyle \ mathbb {E} f = \ int _ {\ mathcal {S}} f \, dP = Pf}, при условии, что он существует.
Определения
- Класс C {\ displaystyle {\ mathcal {C}}}называется классом Гливенко – Кантелли (или класс GC) по отношению к вероятностной мере P, если верно любое из следующих эквивалентных утверждений.
- 1. ‖ P n - P ‖ C → 0 {\ displaystyle \ | P_ {n} -P \ | _ {\ mathcal {C}} \ to 0}почти наверняка как n → ∞ {\ Displaystyle п \ к \ infty}.
- 2. ‖ P n - P ‖ C → 0 {\ displaystyle \ | P_ {n} -P \ | _ {\ mathcal {C}} \ to 0}с вероятностью как n → ∞ {\ Displaystyle п \ к \ infty}.
- 3. E ‖ P n - P ‖ C → 0 {\ displaystyle \ mathbb {E} \ | P_ {n} -P \ | _ {\ mathcal {C}} \ to 0}, как n → ∞ {\ displaystyle n \ to \ infty}(сходимость в среднем).
- Классы функций Гливенко – Кантелли определяются аналогично.
- Класс называется универсальный класс Гливенко – Кантелли, если он является классом GC относительно любой вероятностной меры P на (S, A).
- Класс называется равномерно Гливенко – Кантелли, если сходимость происходит равномерно по всем вероятностным мерам P на (S, A):
- sup P ∈ P (S, A) E ‖ P n - P ‖ C → 0; {\ displaystyle \ sup _ {P \ in {\ mathcal {P}} (S, A)} \ mathbb {E} \ | P_ {n} -P \ | _ {\ mathcal {C}} \ to 0; }
- sup P ∈ P (S, A) E ‖ P n - P ‖ F → 0. {\ displaystyle \ sup _ {P \ in {\ mathcal {P}} (S, A)} \ mathbb { E} \ | P_ {n} -P \ | _ {\ mathcal {F}} \ to 0.}
Теорема (Вапник и Червоненкис, 1968 г.)
- Класс наборов C {\ displaystyle {\ mathcal {C}}}является однородно GC тогда и только тогда, когда это класс Вапника – Червоненкиса.
Примеры
- Пусть S = R {\ displaystyle S = \ mathbb {R}}и C = {(- ∞, t]: t ∈ R} {\ displaystyle {\ mathcal {C}} = \ {(- \ infty, t]: t \ in {\ mathbb {R}} \}}. Классическая теорема Гливенко – Кантелли означает, что этот класс является универсальным GC Кроме того, по теореме Колмогорова,
- sup P ∈ P (S, A) ‖ P n - P ‖ C ∼ n - 1/2 {\ displaystyle \ sup _ {P \ in {\ mathcal {P }} (S, A)} \ | P_ {n} -P \ | _ {\ mathcal {C}} \ sim n ^ {- 1/2}}, то есть C {\ displaystyle {\ mathcal {C}}}является равномерно классом Гливенко – Кантелли.
- Пусть P неатомарная вероятностная мера на S и C {\ displaystyle {\ mathcal {C}}}класс всех конечных подмножеств в S. Поскольку A п = {Икс 1,…, Икс n} ∈ С {\ Displaystyle A_ {n} = \ {X_ {1}, \ ldots, X_ {n} \} \ in {\ mathcal {C}}}, П (A n) знак равно 0 {\ displaystyle P (A_ {n}) = 0}, P n (A n) = 1 {\ displaystyle P_ {n} (A_ {n}) = 1}, мы имеем, что ‖ P n - P ‖ C = 1 {\ displaystyle \ | P_ {n} -P \ | _ {\ mathcal {C}} = 1}и поэтому C {\ displaystyle {\ mathcal {C}}}не является классом GC по отношению к P.
См. также
- теорема Донскера
- Дворецкого – Кифера – Вольфовица неравенство - усиливает теорему Гливенко – Кантелли путем количественной оценки скорости сходимости.
Ссылки
Дополнительная литература
- Дадли, Р.М. (1999). Равномерные центральные предельные теоремы. Издательство Кембриджского университета. ISBN 0-521-46102-2.
- Питман, Э. Дж. Г. (1979). «Функция распределения выборки». Некоторая основная теория статистических выводов. Лондон: Чепмен и Холл. п. 79–97. ISBN 0-470-26554-X.
- Shorack, G.R.; Веллнер, Дж. А. (1986). Эмпирические процессы с приложениями к статистике. Вайли. ISBN 0-471-86725-X.
- ван дер Ваарт, А. В. ; Веллнер, Дж. А. (1996). Слабая конвергенция и эмпирические процессы. Springer. ISBN 0-387-94640-3.
- van der Vaart, Aad W.; Веллнер, Джон А. (1996). Теоремы Гливенко-Кантелли. Springer
- van der Vaart, Aad W.; Веллнер, Джон А. (2000). Теоремы сохранения для классов Гливенко-Кантелли и равномерных классов Гливенко-Кантелли. Springer.