Неравенство Чебышева

редактировать
По поводу одноименного неравенства, включающего ряды, см. Неравенство сумм Чебышева.

Не в теории вероятностей, неравенство Чебышева (также называется неравенство Bienaymé-Чебышева) гарантирует, что для широкого класса распределений вероятностей, не более определенной доли значений может быть больше, чем на некотором расстоянии от среднего. В частности, не более 1 / k 2 значений распределения могут отличаться от среднего на k или более стандартных отклонений (или, что то же самое, более 1 - 1 / k 2 значений распределения меньше kстандартные отклонения от среднего). В статистике это правило часто называют теоремой Чебышева о диапазоне стандартных отклонений от среднего. Неравенство имеет большую полезность, поскольку его можно применить к любому распределению вероятностей, в котором определены среднее значение и дисперсия. Например, его можно использовать для доказательства слабого закона больших чисел.

Его практическое использование аналогично правилу 68–95–99,7, которое применяется только к нормальным распределениям. Неравенство Чебышева является более общим, утверждая, что минимум 75% значений должны находиться в пределах двух стандартных отклонений от среднего и 88,89% в пределах трех стандартных отклонений для широкого диапазона различных распределений вероятностей.

Термин неравенство Чебышева может также относиться к неравенству Маркова, особенно в контексте анализа. Они тесно связаны, и некоторые авторы называют неравенство Маркова «первым неравенством Чебышева», а подобное неравенство на этой странице - «вторым неравенством Чебышева».

СОДЕРЖАНИЕ

  • 1 История
  • 2 Заявление
    • 2.1 Вероятностное утверждение
    • 2.2 Теоретико-мерное утверждение
  • 3 Пример
  • 4 Четкость границ
  • 5 Доказательство (двусторонней версии)
    • 5.1 Вероятностное доказательство
    • 5.2 Теоретико-мерное доказательство
    • 5.3 Доказательство в предположении, что случайная величина X непрерывна
  • 6 расширений
    • 6.1 Асимметричный двусторонний
      • 6.1.1 Двумерное обобщение
    • 6.2 Двумерная известная корреляция
    • 6.3 Многовариантный
    • 6.4 Конечномерный вектор
    • 6.5 Бесконечные измерения
    • 6.6 Высшие моменты
    • 6.7 Экспоненциальный момент
    • 6.8 Ограниченные переменные
  • 7 Конечные образцы
    • 7.1 Одномерный случай
      • 7.1.1 Зависимость от размера выборки
      • 7.1.2 Неравенство Самуэльсона
    • 7.2 Многомерный случай
      • 7.2.1 Примечания
  • 8 заостренных границ
    • 8.1 Стандартизированные переменные
    • 8.2 полуварианты
    • 8.3 Неравенство Сельберга
    • 8.4 Неравенство Кантелли
      • 8.4.1 Приложение: расстояние между средним и медианным значением
    • 8.5 Неравенство Бхаттачарьи
    • 8.6 Неравенство Митценмахера и Упфала
  • 9 Связанные неравенства
    • 9.1 Неравенство Зелена
    • 9.2 Неравенство Хэ, Чжана и Чжана
    • 9.3 Лемма Хёффдинга
    • 9.4 Граница Ван Зуйлена
  • 10 Унимодальные распределения
    • 10.1 Унимодальные симметричные распределения
    • 10.2 Примечания
      • 10.2.1 Эффекты симметрии и унимодальности
      • 10.2.2 Симметричные унимодальные распределения
      • 10.2.3 Нормальные распределения
  • 11 Границы для конкретных дистрибутивов
  • 12 Нулевые средние
    • 12.1 Отклонение от единицы
  • 13 Интегральное неравенство Чебышева
    • 13.1 Другое неравенство
  • 14 трансформация Холдейна
  • 15 заметок
  • 16 См. Также
  • 17 Ссылки
  • 18 Дополнительная литература
  • 19 Внешние ссылки

История

Теорема названа в честь русского математика Пафнутия Чебышева, хотя впервые ее сформулировал его друг и коллега Ирене-Жюль Бьенайме. Теорема была впервые сформулирована без доказательства Бьенайме в 1853 году, а затем доказана Чебышевым в 1867 году. Его ученик Андрей Марков представил еще одно доказательство в своей докторской диссертации 1884 года. Тезис.

Заявление

Неравенство Чебышева обычно формулируется для случайных величин, но может быть обобщено до утверждения о пространствах мер.

Вероятностное утверждение

Пусть X (интегрируемая) - случайная величина с конечным математическим ожиданием μ и конечной ненулевой дисперсией σ 2. Тогда для любого действительного числа к gt; 0,

Pr ( | Икс - μ | k σ ) 1 k 2 . {\ displaystyle \ Pr (| X- \ mu | \ geq k \ sigma) \ leq {\ frac {1} {k ^ {2}}}.}

Только случай пригодится. Когда правая часть и неравенство тривиальны, поскольку все вероятности ≤ 1. k gt; 1 {\ displaystyle kgt; 1} k 1 {\ Displaystyle к \ leq 1} 1 k 2 1 {\ displaystyle {\ frac {1} {k ^ {2}}} \ geq 1}

В качестве примера, использование показывает, что вероятность того, что значения лежат вне интервала, не превышает. k знак равно 2 {\ Displaystyle к = {\ sqrt {2}}} ( μ - 2 σ , μ + 2 σ ) {\ Displaystyle (\ му - {\ sqrt {2}} \ sigma, \ му + {\ sqrt {2}} \ sigma)} 1 2 {\ displaystyle {\ frac {1} {2}}}

Поскольку его можно применять к полностью произвольным распределениям при условии, что они имеют известное конечное среднее значение и дисперсию, неравенство обычно дает плохую оценку по сравнению с тем, что можно было бы вывести, если бы о задействованном распределении известно больше аспектов.

k Мин. % в пределах k стандартных    отклонений от среднего Максимум. % за k стандартных отклонений от среднего
1 0% 100%
√ 2 50% 50%
1.5 55,56% 44,44%
2 75% 25%
2 √ 2 87,5% 12,5%
3 88,8889% 11,1111%
4 93,75% 6,25%
5 96% 4%
6 97,2222% 2,7778%
7 97,9592% 2,0408%
8 98,4375% 1,5625%
9 98,7654% 1,2346%
10 99% 1%

Утверждение теории меры

Пусть ( X, Σ, μ) является мерой пространства, и пусть е быть расширенной реальной -значная измеримой функции, определенная на X. Тогда для любого действительного числа t gt; 0 и 0 lt; p lt;∞

μ ( { Икс Икс : | ж ( Икс ) | т } ) 1 т п | ж | т | ж | п d μ . {\ displaystyle \ mu (\ {x \ in X \,: \, \, | f (x) | \ geq t \}) ​​\ leq {1 \ над t ^ {p}} \ int _ {| f | \ geq t} | f | ^ {p} \, d \ mu.}

В более общем смысле, если g - расширенная измеримая функция с действительным знаком, неотрицательная и неубывающая, с then: грамм ( т ) 0 {\ Displaystyle г (т) \ neq 0}

μ ( { Икс Икс : ж ( Икс ) т } ) 1 грамм ( т ) Икс грамм ж d μ . {\ displaystyle \ mu (\ {x \ in X \,: \, \, f (x) \ geq t \}) ​​\ leq {1 \ над g (t)} \ int _ {X} g \ circ f \, д \ му.}

Затем следует предыдущее утверждение, определяющее « как если бы» и «в противном случае». грамм ( Икс ) {\ displaystyle g (x)} | Икс | п {\ Displaystyle | х | ^ {p}} Икс т {\ Displaystyle х \ geq т} 0 {\ displaystyle 0}

Пример

Предположим, мы случайным образом выбираем журнальную статью из источника, содержащего в среднем 1000 слов на статью, со стандартным отклонением 200 слов. Затем мы можем сделать вывод, что вероятность того, что в нем содержится от 600 до 1400 слов (т. Е. В пределах k  = 2 стандартных отклонения от среднего), должна быть не менее 75%, потому что не более 1 ⁄ k2 знак равно 1/4шанс оказаться за пределами этого диапазона по неравенству Чебышева. Но если мы дополнительно знаем, что распределение является нормальным, мы можем сказать, что существует вероятность 75%, что количество слов находится между 770 и 1230 (что является еще более жесткой границей).

Резкость границ

Как показано в приведенном выше примере, теорема обычно дает довольно слабые оценки. Однако эти оценки, как правило, не могут быть улучшены (оставаясь верными для произвольных распределений). Оценки точны для следующего примера: для любого k  ≥ 1

Икс знак равно { - 1 , с вероятностью  1 2 k 2 0 , с вероятностью  1 - 1 k 2 1 , с вероятностью  1 2 k 2 {\ displaystyle X = {\ begin {cases} -1, amp; {\ text {с вероятностью}} {\ frac {1} {2k ^ {2}}} \\ 0, amp; {\ text {с вероятностью}} 1 - {\ frac {1} {k ^ {2}}} \\ 1, amp; {\ text {с вероятностью}} {\ frac {1} {2k ^ {2}}} \ end {cases}}}

Для этого распределения среднее значение μ = 0 и стандартное отклонение σ =1/k, так

Pr ( | Икс - μ | k σ ) знак равно Pr ( | Икс | 1 ) знак равно 1 k 2 . {\ displaystyle \ Pr (| X- \ mu | \ geq k \ sigma) = \ Pr (| X | \ geq 1) = {\ frac {1} {k ^ {2}}}.}

Неравенство Чебышева является равенством как раз для тех распределений, которые являются линейным преобразованием этого примера.

Доказательство (двусторонней версии)

Вероятностное доказательство

Неравенство Маркова утверждает, что для любой вещественной случайной величины Y и любого положительного числа a имеем Pr (| Y |gt;  a) ≤ E (| Y |) / a. Один из способов доказать неравенство Чебышева - применить неравенство Маркова к случайной величине Y = ( X - μ) 2 с a = ( kσ) 2.

Это также можно доказать напрямую, используя условное ожидание :

σ 2 знак равно E [ ( Икс - μ ) 2 ] знак равно E [ ( Икс - μ ) 2 k σ | Икс - μ | ] Pr [ k σ | Икс - μ | ] + E [ ( Икс - μ ) 2 k σ gt; | Икс - μ | ] Pr [ k σ gt; | Икс - μ | ] ( k σ ) 2 Pr [ k σ | Икс - μ | ] + 0 Pr [ k σ gt; | Икс - μ | ] знак равно k 2 σ 2 Pr [ k σ | Икс - μ | ] {\ displaystyle {\ begin {align} \ sigma ^ {2} amp; = \ mathbb {E} [(X- \ mu) ^ {2}] \\ [5pt] amp; = \ mathbb {E} [(X- \ mu) ^ {2} \ mid k \ sigma \ leq | X- \ mu |] \ Pr [k \ sigma \ leq | X- \ mu |] + \ mathbb {E} [(X- \ mu) ^ {2} \ mid k \ sigmagt; | X- \ mu |] \ Pr [k \ sigmagt; | X- \ mu |] \\ [5pt] amp; \ geq (k \ sigma) ^ {2} \ Pr [ k \ sigma \ leq | X- \ mu |] +0 \ cdot \ Pr [k \ sigmagt; | X- \ mu |] \\ [5pt] amp; = k ^ {2} \ sigma ^ {2} \ Pr [к \ сигма \ leq | X- \ mu |] \ конец {выровнено}}}

Тогда неравенство Чебышева следует делением на k 2σ 2.

Это доказательство также показывает, почему оценки в типичных случаях являются довольно слабыми: условное ожидание для события, где | X  -  μ | lt;  kσ отбрасывается, и нижняя граница k 2σ 2 для события | X  -  μ | ≥  kσ может быть довольно плохим.

Теоретико-мерное доказательство

Зафиксируйте и пусть будет определено как, и пусть будет индикаторной функцией множества . Тогда легко проверить, что для любого, т {\ displaystyle t} А т {\ displaystyle A_ {t}} А т знак равно { Икс Икс ж ( Икс ) т } {\ Displaystyle A_ {T} = \ {х \ в X \ mid f (x) \ geq t \}} 1 А т {\ displaystyle 1_ {A_ {t}}} А т {\ displaystyle A_ {t}} Икс {\ displaystyle x}

грамм ( т ) 1 А т ( Икс ) грамм ( ж ( Икс ) ) 1 А т ( Икс ) , {\ displaystyle g (t) 1_ {A_ {t}} (x) \ leq g (f (x)) \, 1_ {A_ {t}} (x),}

так как g не убывает, и, следовательно,

грамм ( т ) μ ( А т ) знак равно Икс грамм ( т ) 1 А т d μ А т грамм ж d μ Икс грамм ж d μ , {\ Displaystyle {\ begin {align} g (t) \ mu (A_ {t}) amp; = \ int _ {X} g (t) 1_ {A_ {t}} \, d \ mu \\ amp; \ leq \ int _ {A_ {t}} g \ circ f \, d \ mu \\ amp; \ leq \ int _ {X} g \ circ f \, d \ mu, \ end {выровнено}}}

где последнее неравенство оправдано неотрицательностью g. Требуемое неравенство следует из деления указанного неравенства на  g ( t).

Доказательство в предположении, что случайная величина X непрерывна

Используя определение функции плотности вероятности f ( x) и стандартную характеристику дисперсии Var ( X):

Pr ( а Икс б ) знак равно а б ж Икс ( Икс ) d Икс , {\ Displaystyle \ Pr (a \ Leq X \ Leq b) = \ int _ {a} ^ {b} f_ {X} (x) \, dx,}
Вар ( Икс ) знак равно σ 2 знак равно р ( Икс - μ ) 2 ж ( Икс ) d Икс , {\ displaystyle \ operatorname {Var} (X) = \ sigma ^ {2} = \ int _ {\ mathbb {R}} (x- \ mu) ^ {2} f (x) \, dx,}

у нас есть:

Pr ( | Икс - μ | k σ ) знак равно | Икс - μ | k σ ж ( Икс ) d Икс | Икс - μ | k σ | Икс - μ | k σ ж ( Икс ) d Икс               ( | Икс - μ | k σ gt; 1     в области целостности ) | Икс - μ | k σ ( Икс - μ ) 2 k 2 σ 2 ж ( Икс ) d Икс знак равно | Икс - μ | k σ 1 k 2 σ 2 ( Икс - μ ) 2 ж ( Икс ) d Икс знак равно 1 k 2 σ 2 | Икс - μ | k σ ( Икс - μ ) 2 ж ( Икс ) d Икс 1 k 2 σ 2 - ( Икс - μ ) 2 ж ( Икс ) d Икс знак равно 1 k 2 σ 2 σ 2 знак равно 1 k 2 . {\ Displaystyle {\ begin {align} \ Pr (| X- \ mu | \ geq k \ sigma) amp; = \ int _ {| x- \ mu | \ geq k \ sigma} f (x) \, dx \ \ [5pt] amp; \ leq \ int _ {| x- \ mu | \ geq k \ sigma} {\ frac {| x- \ mu |} {k \ sigma}} f (x) \, dx \ \ \ \ \ \ \ ({\ frac {| x- \ mu |} {k \ sigma}}gt; 1 \ \ {\ text {в области целостности}}) \\ [5pt] amp; \ leq \ int _ {| x- \ mu | \ geq k \ sigma} {\ frac {(x- \ mu) ^ {2}} {k ^ {2} \ sigma ^ {2}}} f (x) \, dx \\ [ 5pt] amp; = \ int _ {| x- \ mu | \ geq k \ sigma} {\ frac {1} {k ^ {2} \ sigma ^ {2}}} (x- \ mu) ^ {2} f (x) \, dx \\ [5pt] amp; = {\ frac {1} {k ^ {2} \ sigma ^ {2}}} \ int _ {| x- \ mu | \ geq k \ sigma} (x- \ mu) ^ {2} f (x) \, dx \\ [5pt] amp; \ leq {\ frac {1} {k ^ {2} \ sigma ^ {2}}} \ int _ {- \ infty} ^ {\ infty} (x- \ mu) ^ {2} f (x) \, dx \\ [5pt] amp; = {\ frac {1} {k ^ {2} \ sigma ^ {2} }} \ sigma ^ {2} \\ [5pt] amp; = {\ frac {1} {k ^ {2}}}. \ end {align}}}

Заменяя kσ на ε, где k  =  ε / σ, мы получаем неравенство Чебышева в другой форме:

Pr ( | Икс - μ | ε ) σ 2 ε 2 , {\ Displaystyle \ Pr (| Икс- \ му | \ geq \ varepsilon) \ leq {\ frac {\ sigma ^ {2}} {\ varepsilon ^ {2}}},}

или эквивалент

Pr ( | Икс - μ | lt; ε ) gt; 1 - σ 2 ε 2 , {\ Displaystyle \ Pr (| X- \ mu | lt;\ varepsilon)gt; 1 - {\ frac {\ sigma ^ {2}} {\ varepsilon ^ {2}}},}

где ε определяется так же, как k ; любое положительное действительное число.

Расширения

Разработано несколько расширений неравенства Чебышева.

Асимметричный двусторонний

Если X имеет среднее μ и дисперсию σ 2, то

Pr ( lt; Икс lt; ты ) 4 [ ( μ - ) ( ты - μ ) - σ 2 ] ( - ты ) 2 , {\ Displaystyle \ Pr (\ ell lt;Икс lt;и) \ geq {\ гидроразрыва {4 [(\ му - \ ell) (и- \ му) - \ sigma ^ {2}]} {(\ ell -u) ^ {2}}},}

если и, где и. ( μ - ) ( час - μ ) σ 2 {\ Displaystyle (\ му - \ ell) (ч- \ му) \ geq \ sigma ^ {2}} ( μ - ) ( час - μ ) - k 2 2 σ 2 {\ Displaystyle (\ му - \ ell) (ч- \ му) -k ^ {2} \ leq 2 \ sigma ^ {2}} k знак равно мин ( μ - , час - μ ) {\ Displaystyle к = \ мин (\ му - \ ell, ч- \ му)} lt; μ lt; час {\ displaystyle \ ell lt;\ mu lt;h}

Это сводится к неравенству Чебышева в симметричном случае ( ℓ и u равноудалены от среднего).

Двумерное обобщение

Пусть X 1, X 2 - две случайные величины со средними μ 1, μ 2 и конечными дисперсиями σ 1, σ 2 соответственно. Тогда оценка объединения показывает, что

Pr ( 1 Икс 1 - μ 1 σ 1 ты 1 , 2 Икс 2 - μ 2 σ 2 ты 2 ) 1 - 4 + ( ты 1 + 1 ) 2 ( ты 1 - 1 ) 2 - 4 + ( ты 2 + 2 ) 2 ( ты 2 - 2 ) 2 {\ Displaystyle \ Pr \ left (\ ell _ {1} \ leq {\ frac {X_ {1} - \ mu _ {1}} {\ sigma _ {1}}} \ leq u_ {1}, \ ell _ {2} \ leq {\ frac {X_ {2} - \ mu _ {2}} {\ sigma _ {2}}} \ leq u_ {2} \ right) \ geq 1 - {\ frac {4+ (u_ {1} + \ ell _ {1}) ^ {2}} {(u_ {1} - \ ell _ {1}) ^ {2}}} - {\ frac {4+ (u_ {2} + \ ell _ {2}) ^ {2}} {(u_ {2} - \ ell _ {2}) ^ {2}}}}

Эта граница не требует, чтобы X 1 и X 2 были независимыми.

Двумерная известная корреляция

Берже вывел неравенство для двух коррелированных переменных X 1, X 2. Пусть ρ - коэффициент корреляции между X 1 и X 2, а σ i 2 - дисперсия X i. потом

Pr ( я знак равно 1 2 [ | Икс я - μ я | σ я lt; k ] ) 1 - 1 + 1 - ρ 2 k 2 . {\ displaystyle \ Pr \ left (\ bigcap _ {i = 1} ^ {2} \ left [{\ frac {| X_ {i} - \ mu _ {i} |} {\ sigma _ {i}}}} lt;k \ right] \ right) \ geq 1 - {\ frac {1 + {\ sqrt {1- \ rho ^ {2}}}} {k ^ {2}}}.}

Позднее Лал получил альтернативную оценку

Pr ( я знак равно 1 2 [ | Икс я - μ я | σ я k я ] ) 1 - k 1 2 + k 2 2 + ( k 1 2 + k 2 2 ) 2 - 4 k 1 2 k 2 2 ρ 2 ( k 1 k 2 ) 2 {\ displaystyle \ Pr \ left (\ bigcap _ {i = 1} ^ {2} \ left [{\ frac {| X_ {i} - \ mu _ {i} |} {\ sigma _ {i}}}} \ leq k_ {i} \ right] \ right) \ geq 1 - {\ frac {k_ {1} ^ {2} + k_ {2} ^ {2} + {\ sqrt {(k_ {1} ^ {2 } + k_ {2} ^ {2}) ^ {2} -4k_ {1} ^ {2} k_ {2} ^ {2} \ rho}}} {2 (k_ {1} k_ {2}) ^ {2}}}}

Исии сделал еще одно обобщение. Позволять

Z знак равно Pr ( ( - k 1 lt; Икс 1 lt; k 2 ) ( - k 1 lt; Икс 2 lt; k 2 ) ) , 0 lt; k 1 k 2 . {\ Displaystyle Z = \ Pr \ left (\ left (-k_ {1} lt;X_ {1} lt;k_ {2} \ right) \ cap \ left (-k_ {1} lt;X_ {2} lt;k_ {2 } \ right) \ right), \ qquad 0 lt;k_ {1} \ leq k_ {2}.}

и определите:

λ знак равно k 1 ( 1 + ρ ) + ( 1 - ρ 2 ) ( k 1 2 + ρ ) 2 k 1 - 1 + ρ {\ displaystyle \ lambda = {\ frac {k_ {1} (1+ \ rho) + {\ sqrt {(1- \ rho ^ {2}) (k_ {1} ^ {2} + \ rho)}} } {2k_ {1} -1+ \ rho}}}

Сейчас есть три случая.

  • Случай A: если и тогда 2 k 1 2 gt; 1 - ρ {\ displaystyle 2k_ {1} ^ {2}gt; 1- \ rho} k 2 - k 1 2 λ {\ displaystyle k_ {2} -k_ {1} \ geq 2 \ lambda}
Z 2 λ 2 2 λ 2 + 1 + ρ . {\ displaystyle Z \ leq {\ frac {2 \ lambda ^ {2}} {2 \ lambda ^ {2} +1+ \ rho}}.}
  • Случай B: Если условия случая A не выполняются, но k 1 k 2 ≥ 1 и
2 ( k 1 k 2 - 1 ) 2 2 ( 1 - ρ 2 ) + ( 1 - ρ ) ( k 2 - k 1 ) 2 {\ displaystyle 2 (k_ {1} k_ {2} -1) ^ {2} \ geq 2 (1- \ rho ^ {2}) + (1- \ rho) (k_ {2} -k_ {1}) ^ {2}}
тогда
Z ( k 2 - k 1 ) 2 + 4 + 16 ( 1 - ρ 2 ) + 8 ( 1 - ρ ) ( k 2 - k 1 ) ( k 1 + k 2 ) 2 . {\ Displaystyle Z \ Leq {\ frac {(k_ {2} -k_ {1}) ^ {2} +4 + {\ sqrt {16 (1- \ rho ^ {2}) + 8 (1- \ rho) (k_ {2} -k_ {1})}}} {(k_ {1} + k_ {2}) ^ {2}}}.}
  • Случай C: Если ни одно из условий в случаях A или B не выполняется, то нет универсальной границы, кроме 1.

Многомерный

Общий случай известен как неравенство Бирнбаума – Раймонда – Цукермана в честь авторов, доказавших его для двух измерений.

Pr ( я знак равно 1 п ( Икс я - μ я ) 2 σ я 2 т я 2 k 2 ) 1 k 2 я знак равно 1 п 1 т я 2 {\ displaystyle \ Pr \ left (\ sum _ {i = 1} ^ {n} {\ frac {(X_ {i} - \ mu _ {i}) ^ {2}} {\ sigma _ {i} ^ {2} t_ {i} ^ {2}}} \ geq k ^ {2} \ right) \ leq {\ frac {1} {k ^ {2}}} \ sum _ {i = 1} ^ {n } {\ frac {1} {t_ {i} ^ {2}}}}

где X i - i -я случайная величина, μ i - i-е среднее значение, а σ i 2 - i-я дисперсия.

Если переменные независимы, это неравенство можно усилить.

Pr ( я знак равно 1 п | Икс я - μ я | σ я k я ) я знак равно 1 п ( 1 - 1 k я 2 ) {\ displaystyle \ Pr \ left (\ bigcap _ {i = 1} ^ {n} {\ frac {| X_ {i} - \ mu _ {i} |} {\ sigma _ {i}}} \ leq k_ {i} \ right) \ geq \ prod _ {i = 1} ^ {n} \ left (1 - {\ frac {1} {k_ {i} ^ {2}}} \ right)}

Олкин и Пратт вывели неравенство для n коррелированных переменных.

Pr ( я знак равно 1 п | Икс я - μ я | σ я lt; k я ) 1 - 1 п 2 ( ты + п - 1 п я 1 k я 2 - ты ) 2 {\ displaystyle \ Pr \ left (\ bigcap _ {i = 1} ^ {n} {\ frac {| X_ {i} - \ mu _ {i} |} {\ sigma _ {i}}} lt;k_ { i} \ right) \ geq 1 - {\ frac {1} {n ^ {2}}} \ left ({\ sqrt {u}} + {\ sqrt {n-1}} {\ sqrt {n \ sum _ {i} {\ frac {1} {k_ {i} ^ {2}}} - u}} \ right) ^ {2}}

где сумма берется по n переменным и

ты знак равно я знак равно 1 п 1 k я 2 + 2 я знак равно 1 п j lt; я ρ я j k я k j {\ displaystyle u = \ sum _ {i = 1} ^ {n} {\ frac {1} {k_ {i} ^ {2}}} + 2 \ sum _ {i = 1} ^ {n} \ sum _ {j lt;i} {\ frac {\ rho _ {ij}} {k_ {i} k_ {j}}}}

где ρ ij - корреляция между X i и X j.

Неравенство Олкина и Пратта было впоследствии обобщено Годвином.

Конечномерный вектор

Ферентинос показал, что для вектора X = ( x 1, x 2,...) со средним μ = ( μ 1, μ 2,...) стандартное отклонение σ = ( σ 1, σ 2,...) и евклидовой нормы || ⋅ || что

Pr ( Икс - μ k σ ) 1 k 2 . {\ displaystyle \ Pr (\ | X- \ mu \ | \ geq k \ | \ sigma \ |) \ leq {\ frac {1} {k ^ {2}}}.}

Второе связанное неравенство также было выведено Ченом. Пусть п вполне размерность стохастического вектора X, и пусть Е ( X) быть среднее значение X. Пусть S - ковариационная матрица и k gt; 0. потом

Pr ( ( Икс - E ( Икс ) ) Т S - 1 ( Икс - E ( Икс ) ) lt; k ) 1 - п k {\ displaystyle \ Pr \ left ((X- \ operatorname {E} (X)) ^ {T} S ^ {- 1} (X- \ operatorname {E} (X)) lt;k \ right) \ geq 1 - {\ frac {n} {k}}}

где Y Т является транспонированной из Y. Простое доказательство было получено в Наварро следующим образом:

Z знак равно ( Икс - E ( Икс ) ) Т S - 1 ( Икс - E ( Икс ) ) знак равно ( Икс - E ( Икс ) ) Т S - 1 / 2 S - 1 / 2 ( Икс - E ( Икс ) ) знак равно Y Т Y 0 {\ displaystyle Z = (X- \ operatorname {E} (X)) ^ {T} S ^ {- 1} (X- \ operatorname {E} (X)) = (X- \ operatorname {E} (X)) ^ {T} S ^ {- 1/2} S ^ {- 1/2} (X- \ operatorname {E} (X)) = Y ^ {T} Y \ geq 0}

куда

Y знак равно ( Y 1 , . . . , Y п ) Т знак равно S - 1 / 2 ( Икс - E ( Икс ) ) {\ displaystyle Y = (Y_ {1},..., Y_ {n}) ^ {T} = S ^ {- 1/2} (X- \ operatorname {E} (X))}

и является симметричной обратимой матрицей таким образом, что:. Следовательно, и где представляет собой единичную матрицу размерности  n. Тогда и S - 1 / 2 {\ displaystyle S ^ {- 1/2}} S - 1 / 2 S - 1 / 2 знак равно S - 1 {\ Displaystyle S ^ {- 1/2} S ^ {- 1/2} = S ^ {- 1}} E ( Y ) знак равно ( 0 , , 0 ) Т {\ Displaystyle \ OperatorName {E} (Y) = (0, \ ldots, 0) ^ {T}} Cov ( Y ) знак равно я п {\ displaystyle \ operatorname {Cov} (Y) = I_ {n}} я п {\ displaystyle I_ {n}} E ( Y я 2 ) знак равно Вар ( Y я ) знак равно 1 {\ displaystyle \ operatorname {E} (Y_ {i} ^ {2}) = \ operatorname {Var} (Y_ {i}) = 1}

E ( Z ) знак равно E ( Y Т Y ) знак равно я знак равно 1 п E ( Y я 2 ) знак равно п {\ displaystyle \ operatorname {E} (Z) = \ operatorname {E} (Y ^ {T} Y) = \ sum _ {i = 1} ^ {n} \ operatorname {E} (Y_ {i} ^ { 2}) = n}

Наконец, применяя к Z неравенство Маркова, получаем

Pr ( Z k ) знак равно Pr ( ( Икс - E ( Икс ) ) Т S - 1 ( Икс - E ( Икс ) ) k ) E ( Z ) k знак равно п k {\ displaystyle \ Pr \ left (Z \ geq k \ right) = \ Pr \ left ((X- \ operatorname {E} (X)) ^ {T} S ^ {- 1} (X- \ operatorname {E } (X)) \ geq k \ right) \ leq {\ frac {\ operatorname {E} (Z)} {k}} = {\ frac {n} {k}}}

Итак, желаемое неравенство выполнено.

Неравенство можно записать в терминах расстояния Махаланобиса как

Pr ( d S 2 ( Икс , E ( Икс ) ) lt; k ) 1 - п k {\ displaystyle \ Pr \ left (d_ {S} ^ {2} (X, \ operatorname {E} (X)) lt;k \ right) \ geq 1 - {\ frac {n} {k}}}

где расстояние Махаланобиса, основанное на S, определяется как

d S ( Икс , у ) знак равно ( Икс - у ) Т S - 1 ( Икс - у ) {\ displaystyle d_ {S} (x, y) = {\ sqrt {(xy) ^ {T} S ^ {- 1} (xy)}}}

Наварро доказал, что эти границы точны, то есть они являются наилучшими возможными границами для этих регионов, когда мы просто знаем среднее значение и матрицу ковариации X.

Stellato et al. показали, что этот многомерный вариант неравенства Чебышева может быть легко выведен аналитически как частный случай Vandenberghe et al. где оценка вычисляется путем решения полуопределенной программы (SDP).

Бесконечные измерения

Существует прямое расширение векторной версии неравенства Чебышева на бесконечномерные параметры. Пусть X - случайная величина, которая принимает значения в пространстве Фреше (снабженном полунормами || ⋅ || α). Это включает в себя наиболее общие настройки векторных случайных величин, например, когда это банахово пространство (снабженное единственной нормой), гильбертово пространство или конечномерная настройка, как описано выше. Икс {\ Displaystyle {\ mathcal {X}}} Икс {\ Displaystyle {\ mathcal {X}}}

Предположим, что X имеет « сильный порядок два », что означает, что

E ( Икс α 2 ) lt; {\ Displaystyle \ OperatorName {E} \ left (\ | X \ | _ {\ alpha} ^ {2} \ right) lt;\ infty}

для каждой полунормы || ⋅ || α. Это обобщение требования конечной дисперсии X, необходимое для этой сильной формы неравенства Чебышева в бесконечных измерениях. Термин «сильный порядок два» принадлежит Вахании.

Пусть - интеграл Петтиса от X (т. Е. Векторное обобщение среднего), и пусть μ Икс {\ displaystyle \ mu \ in {\ mathcal {X}}}

σ а знак равно E Икс - μ α 2 {\ displaystyle \ sigma _ {a}: = {\ sqrt {\ operatorname {E} \ | X- \ mu \ | _ {\ alpha} ^ {2}}}}

- стандартное отклонение относительно полунормы || ⋅ || α. В этой настройке мы можем заявить следующее:

Общая версия неравенства Чебышева. k gt; 0 : Pr ( Икс - μ α k σ α ) 1 k 2 . {\ displaystyle \ forall kgt; 0: \ quad \ Pr \ left (\ | X- \ mu \ | _ {\ alpha} \ geq k \ sigma _ {\ alpha} \ right) \ leq {\ frac {1} {k ^ {2}}}.}

Доказательство. Доказательство прямое и по сути такое же, как и окончательная версия. Если σ α = 0, то X почти наверняка константа (и равна μ), поэтому неравенство тривиально.

Если

Икс - μ α k σ α 2 {\ displaystyle \ | X- \ mu \ | _ {\ alpha} \ geq k \ sigma _ {\ alpha} ^ {2}}

тогда || X - μ || α gt; 0, поэтому можно смело делить на || X - μ || α. Главный трюк в неравенстве Чебышева - признать это. 1 знак равно Икс - μ α 2 Икс - μ α 2 {\ Displaystyle 1 = {\ tfrac {\ | X- \ mu \ | _ {\ alpha} ^ {2}} {\ | X- \ mu \ | _ {\ alpha} ^ {2}}}}

Следующие вычисления завершают доказательство:

Pr ( Икс - μ α k σ α ) знак равно Ω 1 Икс - μ α k σ α d Pr знак равно Ω ( Икс - μ α 2 Икс - μ α 2 ) 1 Икс - μ α k σ α d Pr Ω ( Икс - μ α 2 ( k σ α ) 2 ) 1 Икс - μ α k σ α d Pr 1 k 2 σ α 2 Ω Икс - μ α 2 d Pr 1 Икс - μ α k σ α 1 знак равно 1 k 2 σ α 2 ( E Икс - μ α 2 ) знак равно 1 k 2 σ α 2 ( σ α 2 ) знак равно 1 k 2 {\ Displaystyle {\ begin {align} \ Pr \ left (\ | X- \ mu \ | _ {\ alpha} \ geq k \ sigma _ {\ alpha} \ right) amp; = \ int _ {\ Omega} \ mathbf {1} _ {\ | X- \ mu \ | _ {\ alpha} \ geq k \ sigma _ {\ alpha}} \, \ mathrm {d} \ Pr \\ amp; = \ int _ {\ Omega} \ left ({\ frac {\ | X- \ mu \ | _ {\ alpha} ^ {2}} {\ | X- \ mu \ | _ {\ alpha} ^ {2}}} \ right) \ cdot \ mathbf {1} _ {\ | X- \ mu \ | _ {\ alpha} \ geq k \ sigma _ {\ alpha}} \, \ mathrm {d} \ Pr \\ [6pt] amp; \ leq \ int _ {\ Omega} \ left ({\ frac {\ | X- \ mu \ | _ {\ alpha} ^ {2}} {(k \ sigma _ {\ alpha}) ^ {2}}} \ right) \ cdot \ mathbf {1} _ {\ | X- \ mu \ | _ {\ alpha} \ geq k \ sigma _ {\ alpha}} \, \ mathrm {d} \ Pr \\ [6pt] amp; \ leq {\ frac {1} {k ^ {2} \ sigma _ {\ alpha} ^ {2}}} \ int _ {\ Omega} \ | X- \ mu \ | _ {\ alpha} ^ {2} \, \ mathrm {d} \ Pr amp;amp; \ mathbf {1} _ {\ | X- \ mu \ | _ {\ alpha} \ geq k \ sigma _ {\ alpha}} \ leq 1 \\ [6pt] amp; = {\ frac {1} {k ^ {2} \ sigma _ {\ alpha} ^ {2}}} \ left (\ operatorname {E} \ | X- \ mu \ | _ {\ alpha} ^ {2} \ right) \\ [6pt] amp; = {\ frac {1} {k ^ {2} \ sigma _ {\ alpha} ^ {2}}} \ left (\ sigma _ {\ alpha} ^ {2} \ справа) \\ [6pt] amp; = {\ frac {1} {k ^ {2}}} \ end {align}}}

Высшие моменты

Также возможно расширение на высшие моменты:

Pr ( | Икс - E ( Икс ) | k E ( | Икс - E ( Икс ) | п ) 1 п ) 1 k п , k gt; 0 , п 2. {\ Displaystyle \ Pr \ left (| X- \ OperatorName {E} (X) | \ GEQ k \ OperatorName {E} (| X- \ operatorname {E} (X) | ^ {n}) ^ {\ frac {1} {n}} \ right) \ leq {\ frac {1} {k ^ {n}}}, \ qquad kgt; 0, n \ geq 2.}

Экспоненциальный момент

Связанное с этим неравенство, иногда известное как экспоненциальное неравенство Чебышева, - это неравенство

Pr ( Икс ε ) е - т ε E ( е т Икс ) , т gt; 0. {\ Displaystyle \ Pr (Икс \ geq \ varepsilon) \ leq e ^ {- t \ varepsilon} \ operatorname {E} \ left (e ^ {tX} \ right), \ qquad tgt; 0.}

Пусть K ( t) - кумулянтная производящая функция,

K ( т ) знак равно бревно ( E ( е т Икс ) ) . {\ displaystyle K (t) = \ log \ left (\ operatorname {E} \ left (e ^ {tx} \ right) \ right).}

Взяв преобразование Лежандра – Фенхеля для K ( t) и используя экспоненциальное неравенство Чебышева, имеем

- бревно ( Pr ( Икс ε ) ) Как дела т ( т ε - K ( т ) ) . {\ displaystyle - \ log (\ Pr (X \ geq \ varepsilon)) \ geq \ sup _ {t} (t \ varepsilon -K (t)).}

Это неравенство можно использовать для получения экспоненциальных неравенств для неограниченных переменных.

Ограниченные переменные

Если P ( x) имеет конечный носитель, основанный на интервале [ a, b ], пусть M = max (| a |, | b |), где | х | это абсолютное значение по х. Если среднее значение P ( x) равно нулю, то для всех k gt; 0

E ( | Икс | р ) - k р M р Pr ( | Икс | k ) E ( | Икс | р ) k р . {\ Displaystyle {\ гидроразрыва {\ OperatorName {E} (| X | ^ {r}) - k ^ {r}} {M ^ {r}}} \ leq \ Pr (| X | \ geq k) \ leq {\ frac {\ operatorname {E} (| X | ^ {r})} {k ^ {r}}}.}

Второе из этих неравенств при r = 2 - оценка Чебышева. Первый обеспечивает нижнюю границу значения P ( x).

Ниемитало предложил точные оценки для ограниченной вариации, но без доказательства.

Пусть 0 ≤ X ≤ M, где M gt; 0. потом

  • Дело 1:
Pr ( Икс lt; k ) знак равно 0 если E ( Икс ) gt; k а также E ( Икс 2 ) lt; k E ( Икс ) + M E ( Икс ) - k M {\ Displaystyle \ Pr (Икс lt;к) = 0 \ qquad {\ text {if}} \ qquad \ OperatorName {E} (X)gt; k \ quad {\ text {and}} \ quad \ operatorname {E} ( X ^ {2}) lt;k \ operatorname {E} (X) + M \ operatorname {E} (X) -kM}
  • Случай 2:
Pr ( Икс lt; k ) 1 - k E ( Икс ) + M E ( Икс ) - E ( Икс 2 ) k M если { E ( Икс ) gt; k а также E ( Икс 2 ) k E ( Икс ) + M E ( Икс ) - k M или E ( Икс ) k а также E ( Икс 2 ) k E ( Икс ) {\ Displaystyle \ Pr (Икс lt;К) \ GEQ 1 - {\ гидроразрыва {к \ OperatorName {E} (X) + M \ OperatorName {E} (X) - \ OperatorName {E} (X ^ {2}) } {kM}} \ qquad {\ text {if}} \ qquad {\ begin {cases} \ operatorname {E} (X)gt; k \ quad {\ text {and}} \ quad \ operatorname {E} (X ^ {2}) \ geq k \ operatorname {E} (X) + M \ operatorname {E} (X) -kM \\\ qquad \ qquad \ qquad {\ text {или}} \\\ operatorname {E} (X) \ leq k \ quad {\ text {and}} \ quad \ operatorname {E} (X ^ {2}) \ geq k \ operatorname {E} (X) \ end {cases}}}
  • Случай 3:
Pr ( Икс lt; k ) E ( Икс ) 2 - 2 k E ( Икс ) + k 2 E ( Икс 2 ) - 2 k E ( Икс ) + k 2 если E ( Икс ) k а также E ( Икс 2 ) lt; k E ( Икс ) {\ Displaystyle \ Pr (Икс lt;К) \ geq {\ гидроразрыва {\ OperatorName {E} (X) ^ {2} -2k \ OperatorName {E} (X) + k ^ {2}} {\ operatorname {E } (X ^ {2}) - 2k \ operatorname {E} (X) + k ^ {2}}} \ qquad {\ text {if}} \ qquad \ operatorname {E} (X) \ leq k \ quad {\ text {и}} \ quad \ operatorname {E} (X ^ {2}) lt;k \ operatorname {E} (X)}

Конечные образцы

Одномерный случай

Со и соавторы распространили неравенство Чебышева на случаи, когда среднее значение и дисперсия генеральной совокупности неизвестны и могут не существовать, но выборочное среднее и стандартное отклонение выборки от N выборок должны использоваться, чтобы ограничить ожидаемое значение нового рисунка из того же распределения..

п ( | Икс - м | k s ) грамм N + 1 ( N k 2 N - 1 + k 2 ) N + 1 ( N N + 1 ) 1 / 2 {\ Displaystyle P (| Xm | \ geq ks) \ leq {\ frac {g_ {N + 1} \ left ({\ frac {Nk ^ {2}} {N-1 + k ^ {2}}} \ right)} {N + 1}} \ left ({\ frac {N} {N + 1}} \ right) ^ {1/2}}

где X - случайная величина, из которой мы производили выборку N раз, m - среднее значение выборки, k - постоянная величина, а s - стандартное отклонение выборки. g ( x) определяется следующим образом:

Пусть x ≥ 1, Q = N + 1 и R - наибольшее целое число, меньшее Q / x. Позволять

а 2 знак равно Q ( Q - р ) 1 + р ( Q - р ) . {\ displaystyle a ^ {2} = {\ frac {Q (QR)} {1 + R (QR)}}.}.

Теперь

грамм Q ( Икс ) знак равно { р если  р  даже, р если  р  это странно и  Икс lt; а 2 , р - 1 если  р  это странно и  Икс а 2 . {\ displaystyle g_ {Q} (x) = {\ begin {case} R amp; {\ text {if}} R {\ text {равно,}} \\ R amp; {\ text {if}} R {\ text { нечетно и}} x lt;a ^ {2}, \\ R-1 amp; {\ text {if}} R {\ text {нечетно и}} x \ geq a ^ {2}. \ end {cases}} }

Это неравенство сохраняется даже тогда, когда моментов популяции не существует и когда выборка лишь слабо обменно распределена; этот критерий выполняется для рандомизированной выборки. Таблица значений неравенства Со-Янга-Мо для конечных размеров выборки ( N lt;100) была составлена ​​Konijn. Таблица позволяет рассчитывать различные доверительные интервалы для среднего, основанные на кратных C, стандартной ошибки среднего, рассчитанного по выборке. Например, Konijn показывает, что для N  = 59 95-процентный доверительный интервал для среднего m равен ( m - Cs, m + Cs), где C = 4,447 × 1,006 = 4,47 (это в 2,28 раза больше, чем значение, найденное на предположение о нормальности, показывающее потерю точности в результате незнания точного характера распределения).

Кабан дает несколько менее сложную версию этого неравенства.

п ( | Икс - м | k s ) 1 N + 1 N + 1 N ( N - 1 k 2 + 1 ) {\ displaystyle P (| Xm | \ geq ks) \ leq {\ frac {1} {N + 1}} \ left \ lfloor {\ frac {N + 1} {N}} \ left ({\ frac {N -1} {k ^ {2}}} + 1 \ right) \ right \ rfloor}

Если стандартное отклонение кратно среднему, то можно вывести дополнительное неравенство:

п ( | Икс - м | k s ) N - 1 N 1 k 2 s 2 м 2 + 1 N . {\ Displaystyle P (| Xm | \ geq ks) \ leq {\ frac {N-1} {N}} {\ frac {1} {k ^ {2}}} {\ frac {s ^ {2}} {m ^ {2}}} + {\ frac {1} {N}}.}

Таблица значений неравенства Со-Янга-Мо для конечных размеров выборки ( N lt;100) была составлена ​​Konijn.

При фиксированном N и большом m неравенство Пила – Янга – Мо приблизительно равно

п ( | Икс - м | k s ) 1 N + 1 . {\ Displaystyle P (| Xm | \ geq ks) \ leq {\ frac {1} {N + 1}}.}

Бисли и др. Предложили модификацию этого неравенства.

п ( | Икс - м | k s ) 1 k 2 ( N + 1 ) . {\ Displaystyle P (| Xm | \ geq ks) \ leq {\ frac {1} {k ^ {2} (N + 1)}}.}

При эмпирическом тестировании эта модификация консервативна, но, по-видимому, имеет низкую статистическую мощность. Его теоретическая основа в настоящее время остается неизученной.

Зависимость от размера выборки

Границы, которые эти неравенства дают для конечной выборки, менее жесткие, чем оценки, которые неравенство Чебышева дает для распределения. Чтобы проиллюстрировать это, пусть размер выборки N = 100 и пусть k = 3. Неравенство Чебышева утверждает, что самое большее приблизительно 11,11% распределения будет лежать как минимум на три стандартных отклонения от среднего. Версия неравенства Кабана для конечной выборки гласит, что самое большее примерно 12,05% выборки находится за этими пределами. Зависимость доверительных интервалов от размера выборки дополнительно проиллюстрирована ниже.

Для N = 10 95% доверительный интервал составляет приблизительно ± 13,5789 стандартных отклонений.

Для N = 100 95% доверительный интервал составляет приблизительно ± 4,9595 стандартных отклонений; доверительный интервал 99% составляет приблизительно ± 140,0 стандартного отклонения.

Для N = 500 95% доверительный интервал составляет приблизительно ± 4,5574 стандартного отклонения; 99% доверительный интервал составляет приблизительно ± 11,1620 стандартных отклонений.

Для N = 1000 доверительные интервалы 95% и 99% составляют приблизительно ± 4,5141 и приблизительно ± 10,5330 стандартных отклонений соответственно.

Неравенство Чебышева для распределения дает 95% и 99% доверительные интервалы приблизительно ± 4,472 стандартных отклонений и ± 10 стандартных отклонений соответственно.

Неравенство Самуэльсона

Хотя неравенство Чебышева является наилучшей возможной оценкой для произвольного распределения, это не обязательно верно для конечных выборок. Неравенство Самуэльсона утверждает, что все значения выборки будут лежать в пределах √ N  - 1 стандартного отклонения от среднего. Оценка Чебышева улучшается с увеличением размера выборки.

Когда N = 10, неравенство Самуэльсона утверждает, что все члены выборки находятся в пределах 3 стандартных отклонений от среднего: в отличие от Чебышева, 99,5% выборки находятся в пределах 13,5789 стандартных отклонений от среднего.

Когда N = 100, неравенство Самуэльсона утверждает, что все члены выборки находятся в пределах примерно 9,9499 стандартных отклонений от среднего: Чебышев утверждает, что 99% выборки находятся в пределах 10 стандартных отклонений от среднего.

Когда N = 500, неравенство Самуэльсона утверждает, что все члены выборки находятся в пределах примерно 22,3383 стандартных отклонений от среднего: Чебышев утверждает, что 99% выборки находятся в пределах 10 стандартных отклонений от среднего.

Многомерный случай

Stellato et al. упростили обозначения и расширили эмпирическое неравенство Чебышева из Saw et al. к многомерному случаю. Позвольте быть случайной величиной и пусть. Мы рисуем iid образцов, обозначенных как. На основе первых выборок мы определяем эмпирическое среднее значение как и несмещенную эмпирическую ковариацию как. Если неособое, то для всех то ξ р п ξ {\ textstyle \ xi \ in \ mathbb {R} ^ {п _ {\ xi}}} N Z п ξ {\ textstyle N \ in \ mathbb {Z} _ {\ geq n _ {\ xi}}} N + 1 {\ textstyle N + 1} ξ {\ textstyle \ xi} ξ ( 1 ) , , ξ ( N ) , ξ ( N + 1 ) р п ξ {\ textstyle \ xi ^ {(1)}, \ точки, \ xi ^ {(N)}, \ xi ^ {(N + 1)} \ in \ mathbb {R} ^ {n _ {\ xi}}} N {\ textstyle N} μ N знак равно 1 N я знак равно 1 N ξ ( я ) {\ textstyle \ mu _ {N} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} \ xi ^ {(i)}} Σ N знак равно 1 N я знак равно 1 N ( ξ ( я ) - μ N ) ( ξ ( я ) - μ N ) {\ textstyle \ Sigma _ {N} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} (\ xi ^ {(i)} - \ mu _ {N}) ( \ xi ^ {(i)} - \ mu _ {N}) ^ {\ top}} Σ N {\ displaystyle \ Sigma _ {N}} λ р 0 {\ displaystyle \ lambda \ in \ mathbb {R} _ {\ geq 0}}

п N + 1 ( ( ξ ( N + 1 ) - μ N ) Σ N - 1 ( ξ ( N + 1 ) - μ N ) λ 2 ) мин { 1 , 1 N + 1 п ξ ( N + 1 ) ( N 2 - 1 + N λ 2 ) N 2 λ 2 } . {\ Displaystyle {\ begin {align} amp; P ^ {N + 1} \ left ((\ xi ^ {(N + 1)} - \ mu _ {N}) ^ {\ top} \ Sigma _ {N} ^ {-1} (\ xi ^ {(N + 1)} - \ mu _ {N}) \ geq \ lambda ^ {2} \ right) \\ [8pt] \ leq {} amp; \ min \ left \ { 1, {\ frac {1} {N + 1}} \ left \ lfloor {\ frac {n _ {\ xi} (N + 1) (N ^ {2} -1 + N \ lambda ^ {2})} {N ^ {2} \ lambda ^ {2}}} \ right \ rfloor \ right \}. \ End {align}}}

Замечания

В одномерном случае, т. Е. Это неравенство соответствует неравенству из Saw et al. Более того, правую часть можно упростить, ограничив нижнюю функцию сверху ее аргументом п ξ знак равно 1 {\ textstyle п _ {\ xi} = 1}

п N + 1 ( ( ξ ( N + 1 ) - μ N ) Σ N - 1 ( ξ ( N + 1 ) - μ N ) λ 2 ) мин { 1 , п ξ ( N 2 - 1 + N λ 2 ) N 2 λ 2 } . {\ displaystyle P ^ {N + 1} \ left ((\ xi ^ {(N + 1)} - \ mu _ {N}) ^ {\ top} \ Sigma _ {N} ^ {- 1} (\ xi ^ {(N + 1)} - \ mu _ {N}) \ geq \ lambda ^ {2} \ right) \ leq \ min \ left \ {1, {\ frac {n _ {\ xi} (N ^ {2} -1 + N \ lambda ^ {2})} {N ^ {2} \ lambda ^ {2}}} \ right \}.}

As, правая часть стремится к тому, что соответствует многомерному неравенству Чебышева над эллипсоидами, имеющими форму согласно и с центром в. N {\ textstyle N \ to \ infty} мин { 1 , п ξ λ 2 } {\ textstyle \ min \ left \ {1, {\ frac {n _ {\ xi}} {\ lambda ^ {2}}} \ right \}} Σ {\ textstyle \ Sigma} μ {\ textstyle \ mu}

Заостренные границы

Неравенство Чебышева важно из-за его применимости к любому распределению. В результате своей универсальности он не может (и обычно не дает) такой четкой границы, как альтернативные методы, которые можно использовать, если известно распределение случайной величины. Для улучшения точности оценок неравенства Чебышева был разработан ряд методов; для обзора см. например.

Стандартизированные переменные

Более точные границы могут быть получены путем предварительной стандартизации случайной величины.

Пусть X - случайная величина с конечной дисперсией Var ( X). Пусть Z - стандартизованная форма, определяемая как

Z знак равно Икс - E ( Икс ) Вар ( Икс ) 1 / 2 . {\ displaystyle Z = {\ frac {X- \ operatorname {E} (X)} {\ operatorname {Var} (X) ^ {1/2}}}.}

Лемма Кантелли тогда

п ( Z k ) 1 1 + k 2 . {\ Displaystyle P (Z \ geq k) \ leq {\ frac {1} {1 + k ^ {2}}}.}

Это неравенство является точным и достигается значениями k и −1 / k с вероятностью 1 / (1 +  k 2) и k 2 / (1 +  k 2) соответственно.

Если k gt; 1 и распределение X симметрично, то имеем

п ( Z k ) 1 2 k 2 . {\ Displaystyle P (Z \ geq k) \ leq {\ frac {1} {2k ^ {2}}}.}

Равенство выполняется тогда и только тогда, когда Z = - k, 0 или k с вероятностями 1/2 k 2, 1 - 1 / k 2 и 1/2 k 2 соответственно. Также возможно расширение до двустороннего неравенства.

Пусть u, v gt; 0. Тогда имеем

п ( Z - ты  или  Z v ) 4 + ( ты - v ) 2 ( ты + v ) 2 . {\ Displaystyle P (Z \ leq -u {\ text {или}} Z \ geq v) \ leq {\ frac {4+ (uv) ^ {2}} {(u + v) ^ {2}}}.}

Полуварианты

Альтернативный способ получения более резкие границы через использование semivariances (частичные) дисперсий. Верхняя ( σ + 2) и нижняя ( σ - 2) вариации определяются как

σ + 2 знак равно Икс gt; м ( Икс - м ) 2 п - 1 , {\ displaystyle \ sigma _ {+} ^ {2} = {\ frac {\ sum _ {xgt; m} (xm) ^ {2}} {n-1}},}
σ - 2 знак равно Икс lt; м ( м - Икс ) 2 п - 1 , {\ displaystyle \ sigma _ {-} ^ {2} = {\ frac {\ sum _ {x lt;m} (mx) ^ {2}} {n-1}},}

где m - среднее арифметическое для выборки, а n - количество элементов в выборке.

Дисперсия выборки - это сумма двух вариаций:

σ 2 знак равно σ + 2 + σ - 2 . {\ displaystyle \ sigma ^ {2} = \ sigma _ {+} ^ {2} + \ sigma _ {-} ^ {2}.}

В терминах нижней полувариантности неравенство Чебышева можно записать

Pr ( Икс м - а σ - ) 1 а 2 . {\ displaystyle \ Pr (x \ leq ma \ sigma _ {-}) \ leq {\ frac {1} {a ^ {2}}}.}

Положив

а знак равно k σ σ - . {\ displaystyle a = {\ frac {k \ sigma} {\ sigma _ {-}}}.}

Неравенство Чебышева теперь можно записать

Pr ( Икс м - k σ ) 1 k 2 σ - 2 σ 2 . {\ Displaystyle \ Pr (х \ Leq mk \ sigma) \ leq {\ frac {1} {k ^ {2}}} {\ frac {\ sigma _ {-} ^ {2}} {\ sigma ^ {2 }}}.}

Аналогичный результат можно получить и для верхней полувариантности.

Если мы положим

σ ты 2 знак равно Максимум ( σ - 2 , σ + 2 ) , {\ displaystyle \ sigma _ {u} ^ {2} = \ max (\ sigma _ {-} ^ {2}, \ sigma _ {+} ^ {2}),}

Неравенство Чебышева можно записать

Pr ( | Икс м - k σ | ) 1 k 2 σ ты 2 σ 2 . {\ displaystyle \ Pr (| x \ leq mk \ sigma |) \ leq {\ frac {1} {k ^ {2}}} {\ frac {\ sigma _ {u} ^ {2}} {\ sigma ^ {2}}}.}

Поскольку σ u 2 ≤ σ 2, использование полудисперсности усиливает исходное неравенство.

Если известно, что распределение симметрично, то

σ + 2 знак равно σ - 2 знак равно 1 2 σ 2 {\ Displaystyle \ sigma _ {+} ^ {2} = \ sigma _ {-} ^ {2} = {\ frac {1} {2}} \ sigma ^ {2}}

а также

Pr ( Икс м - k σ ) 1 2 k 2 . {\ displaystyle \ Pr (x \ leq mk \ sigma) \ leq {\ frac {1} {2k ^ {2}}}.}

Этот результат согласуется с результатом, полученным с использованием стандартизованных переменных.

Примечание
Неравенство с более низкой полувариантностью оказалось полезным при оценке риска ухудшения ситуации в финансах и сельском хозяйстве.

Неравенство Сельберга

Сельберг вывел неравенство для P ( x), когда a ≤ x ≤ b. Для упрощения обозначений пусть

Y знак равно α Икс + β {\ Displaystyle Y = \ альфа X + \ бета}

куда

α знак равно 2 k б - а {\ displaystyle \ alpha = {\ frac {2k} {ba}}}

а также

β знак равно - ( б + а ) k б - а . {\ displaystyle \ beta = {\ frac {- (b + a) k} {ba}}.}

В результате этого линейного преобразования P ( a ≤ X ≤ b) становится равным P (| Y | ≤ k).

Среднее ( μ X) и дисперсия ( σ X) X связаны со средним ( μ Y) и дисперсией ( σ Y) Y:

μ Y знак равно α μ Икс + β {\ displaystyle \ mu _ {Y} = \ alpha \ mu _ {X} + \ beta}
σ Y 2 знак равно α 2 σ Икс 2 . {\ displaystyle \ sigma _ {Y} ^ {2} = \ alpha ^ {2} \ sigma _ {X} ^ {2}.}

В этих обозначениях неравенство Сельберга утверждает, что

Pr ( | Y | lt; k ) ( k - μ Y ) 2 ( k - μ Y ) 2 + σ Y 2  если  σ Y 2 μ Y ( k - μ Y ) {\ Displaystyle \ Pr (| Y | lt;k) \ geq {\ frac {(k- \ mu _ {Y}) ^ {2}} {(k- \ mu _ {Y}) ^ {2} + \ sigma _ {Y} ^ {2}}} \ quad {\ text {if}} \ quad \ sigma _ {Y} ^ {2} \ leq \ mu _ {Y} (k- \ mu _ {Y}) }
Pr ( | Y | lt; k ) 1 - σ Y 2 + μ Y 2 k 2  если  μ Y ( k - μ Y ) σ Y 2 k 2 - μ Y 2 {\ displaystyle \ Pr (| Y | lt;k) \ geq 1 - {\ frac {\ sigma _ {Y} ^ {2} + \ mu _ {Y} ^ {2}} {k ^ {2}}} \ quad {\ text {if}} \ quad \ mu _ {Y} (k- \ mu _ {Y}) \ leq \ sigma _ {Y} ^ {2} \ leq k ^ {2} - \ mu _ {Y} ^ {2}}
п ( | Y | lt; k ) 0  если  k 2 - μ Y 2 σ Y 2 . {\ Displaystyle P (| Y | lt;k) \ geq 0 \ quad {\ text {if}} \ quad k ^ {2} - \ mu _ {Y} ^ {2} \ leq \ sigma _ {Y} ^ {2}.}

Это, как известно, наилучшие возможные границы.

Неравенство Кантелли

Неравенство Кантелли из-за Франческо Паоло Кантелли утверждает, что для реальной случайной величины ( X) со средним ( μ) и дисперсией ( σ 2)

п ( Икс - μ а ) σ 2 σ 2 + а 2 {\ Displaystyle P (X- \ mu \ geq a) \ leq {\ frac {\ sigma ^ {2}} {\ sigma ^ {2} + a ^ {2}}}}

где a ≥ 0.

Это неравенство может быть использовано для доказательства одностороннего варианта неравенства Чебышева с k gt; 0

Pr ( Икс - μ k σ ) 1 1 + k 2 . {\ displaystyle \ Pr (X- \ mu \ geq k \ sigma) \ leq {\ frac {1} {1 + k ^ {2}}}.}

Граница для однохвостого варианта, как известно, резкая. Чтобы увидеть это, рассмотрим случайную величину X, которая принимает значения

Икс знак равно 1 {\ displaystyle X = 1} с вероятностью σ 2 1 + σ 2 {\ displaystyle {\ frac {\ sigma ^ {2}} {1+ \ sigma ^ {2}}}}
Икс знак равно - σ 2 {\ Displaystyle X = - \ sigma ^ {2}} с вероятностью 1 1 + σ 2 . {\ displaystyle {\ frac {1} {1+ \ sigma ^ {2}}}.}

Тогда E ( X) = 0, E ( X 2) = σ 2 и P ( X lt;1) = 1 / (1 + σ 2).

Приложение: расстояние между средним и медианным значением

Односторонний вариант может использоваться для доказательства утверждения о том, что для распределений вероятностей, имеющих ожидаемое значение и медиану, среднее и медианное никогда не могут отличаться друг от друга более чем на одно стандартное отклонение. Чтобы выразить это в символах, пусть μ, ν и σ будут соответственно средним, медианным и стандартным отклонением. потом

| μ - ν | σ . {\ displaystyle \ left | \ mu - \ nu \ right | \ leq \ sigma.}

Нет необходимости предполагать, что дисперсия конечна, потому что это неравенство тривиально верно, если дисперсия бесконечна.

Доказательство таково. Принятие k  = 1 в формулировке одностороннего неравенства дает:

Pr ( Икс - μ σ ) 1 2 Pr ( Икс μ + σ ) 1 2 . {\ displaystyle \ Pr (X- \ mu \ geq \ sigma) \ leq {\ frac {1} {2}} \ подразумевает \ Pr (X \ geq \ mu + \ sigma) \ leq {\ frac {1} { 2}}.}

Меняя знак X и μ, получаем

Pr ( Икс μ - σ ) 1 2 . {\ Displaystyle \ Pr (Икс \ leq \ mu - \ sigma) \ leq {\ frac {1} {2}}.}

Медианной по определению является любое действительное число  m, удовлетворяющее неравенствам

п ( Икс м ) 1 2  а также  п ( Икс м ) 1 2 {\ displaystyle \ operatorname {P} (X \ leq m) \ geq {\ frac {1} {2}} {\ text {and}} \ operatorname {P} (X \ geq m) \ geq {\ frac { 1} {2}}}

это означает, что медиана находится в пределах одного стандартного отклонения от среднего. Доказательство, используя неравенство Йенсена также существует.

Неравенство Бхаттачарьи

Бхаттачарья расширил неравенство Кантелли, используя третий и четвертый моменты распределения.

Пусть μ = 0 и σ 2 дисперсия. Пусть γ = E ( X 3) / σ 3 и κ = E ( X 4) / σ 4.

Если k 2 - k γ - 1gt; 0, то

п ( Икс gt; k σ ) κ - γ 2 - 1 ( κ - γ 2 - 1 ) ( 1 + k 2 ) + ( k 2 - k γ - 1 ) . {\ Displaystyle Р (Иксgt; к \ сигма) \ Leq {\ гидроразрыва {\ каппа - \ гамма ^ {2} -1} {(\ каппа - \ гамма ^ {2} -1) (1 + к ^ {2 }) + (k ^ {2} -k \ gamma -1)}}.}

Необходимость k 2 - k γ - 1gt; 0 требует, чтобы k было достаточно большим.

Неравенство Митценмахера и Упфала

Митценмахер и Упфаль отмечают, что

( Икс - E [ Икс ] ) 2 k gt; 0 {\ Displaystyle (X- \ OperatorName {E} [X]) ^ {2k}gt; 0}

для любого целого k gt; 0 и что

E [ ( Икс - E ( Икс ) ) 2 k ] {\ Displaystyle \ OperatorName {E} [(X- \ OperatorName {E} (X)) ^ {2k}]}

является 2 к й центральному моменту. Затем они показывают, что при t gt; 0

Pr ( | Икс - E [ Икс ] | gt; т E [ ( Икс - E [ Икс ] ) 2 k ] 1 / 2 k ) 1 т 2 k . {\ Displaystyle \ Pr \ left (| X- \ OperatorName {E} [X] |gt; т \ OperatorName {E} [(X- \ Operatorname {E} [X]) ^ {2k}] ^ {1 / 2k } \ right) \ leq {\ frac {1} {t ^ {2k}}}.}

При k = 1 получаем неравенство Чебышева. При t ≥ 1, k gt; 2 и в предположении, что k- й момент существует, эта оценка более жесткая, чем неравенство Чебышева.

Связанные неравенства

Известны и некоторые другие связанные с этим неравенства.

Неравенство Зелена

Зелен показал, что

Pr ( Икс - μ k σ ) [ 1 + k 2 + ( k 2 - k θ 3 - 1 ) 2 θ 4 - θ 3 2 - 1 ] - 1 {\ Displaystyle \ Pr (Икс- \ му \ geq к \ сигма) \ leq \ left [1 + k ^ {2} + {\ frac {\ left (k ^ {2} -k \ theta _ {3} - 1 \ right) ^ {2}} {\ theta _ {4} - \ theta _ {3} ^ {2} -1}} \ right] ^ {- 1}}

с участием

k θ 3 + θ 3 2 + 4 2 , θ м знак равно M м σ {\ displaystyle k \ geq {\ frac {\ theta _ {3} + {\ sqrt {\ theta _ {3} ^ {2} +4}}} {2}}, \ qquad \ theta _ {m} = {\ frac {M_ {m}} {\ sigma}}}

где M m - m -й момент, а σ - стандартное отклонение.

Неравенство Хэ, Чжана и Чжана

Для любого набора из n неотрицательных независимых случайных величин X i с математическим ожиданием 1

Pr ( я знак равно 1 п Икс я п - 1 1 п ) 7 8 . {\ displaystyle \ Pr \ left ({\ frac {\ sum _ {i = 1} ^ {n} X_ {i}} {n}} - 1 \ geq {\ frac {1} {n}} \ right) \ leq {\ frac {7} {8}}.}

Лемма Хёффдинга

Основная статья: лемма Хёффдинга

Пусть X - случайная величина с a ≤ X ≤ b и E [ X ] = 0, тогда для любого s gt; 0 имеем

E [ е s Икс ] е 1 8 s 2 ( б - а ) 2 . {\ displaystyle E \ left [e ^ {sX} \ right] \ leq e ^ {{\ frac {1} {8}} s ^ {2} (ba) ^ {2}}.}

Связь Ван Зуйлена

Пусть X i - набор независимых случайных величин Радемахера : Pr ( X i = 1) = Pr ( X i = −1) = 0,5. потом

Pr ( | я знак равно 1 п Икс я п | 1 ) 0,5. {\ displaystyle \ Pr \ left (\ left | {\ frac {\ sum _ {i = 1} ^ {n} X_ {i}} {\ sqrt {n}}} \ right | \ leq 1 \ right) \ geq 0.5.}

Оценка точна и лучше, чем та, которая может быть получена из нормального распределения (приблизительно Prgt; 0,31).

Унимодальные распределения

Функция распределения F является унимодальной в ν, если ее кумулятивная функция распределения является выпуклой на (−∞, ν) и вогнутой на ( ν, ∞). Эмпирическое распределение можно проверить на унимодальность с помощью теста наклона.

В 1823 году Гаусс показал, что для одномодального распределения с нулевой модой

п ( | Икс | k ) 4 E ( Икс 2 ) 9 k 2 если k 2 4 3 E ( Икс 2 ) , {\ displaystyle P (| X | \ geq k) \ leq {\ frac {4 \ operatorname {E} (X ^ {2})} {9k ^ {2}}} \ quad {\ text {if}} \ четырехъядерный к ^ {2} \ geq {\ frac {4} {3}} \ operatorname {E} (X ^ {2}),}
п ( | Икс | k ) 1 - k 3 E ( Икс 2 ) если k 2 4 3 E ( Икс 2 ) . {\ displaystyle P (| X | \ geq k) \ leq 1 - {\ frac {k} {{\ sqrt {3}} \ operatorname {E} (X ^ {2})}} \ quad {\ text { if}} \ quad k ^ {2} \ leq {\ frac {4} {3}} \ operatorname {E} (X ^ {2}).}

Если мода не равна нулю, а среднее ( μ) и стандартное отклонение ( σ) конечны, то, обозначая медиану как ν и среднеквадратичное отклонение от моды через ω, мы имеем

σ ω 2 σ {\ displaystyle \ sigma \ leq \ omega \ leq 2 \ sigma}

(с первым равенством, когда мода равна среднему, а вторым, когда мода составляет √3 стандартных отклонений от среднего в однородном распределении, принимая моду на одном конце) и

| ν - μ | 3 4 ω . {\ displaystyle | \ nu - \ mu | \ leq {\ sqrt {\ frac {3} {4}}} \ omega.}

Винклер в 1866 г. распространил неравенство Гаусса на r -ые моменты, когда r gt; 0 и распределение является унимодальным с нулевой модой:

п ( | Икс | k ) ( р р + 1 ) р E ( | Икс | ) р k р если k р р р ( р + 1 ) р + 1 E ( | Икс | р ) , {\ Displaystyle P (| Икс | \ GEQ К) \ Leq \ left ({\ frac {r} {r + 1}} \ right) ^ {r} {\ frac {\ operatorname {E} (| X |) ^ {r}} {k ^ {r}}} \ quad {\ text {if}} \ quad k ^ {r} \ geq {\ frac {r ^ {r}} {(r + 1) ^ {r +1}}} \ operatorname {E} (| X | ^ {r}),}
п ( | Икс | k ) ( 1 - [ k р ( р + 1 ) E ( | Икс | ) р ] 1 / р ) если k р р р ( р + 1 ) р + 1 E ( | Икс | р ) . {\ Displaystyle P (| Икс | \ GEQ К) \ Leq \ left (1- \ left [{\ гидроразрыва {k ^ {r}} {(г + 1) \ OperatorName {E} (| X |) ^ { r}}} \ right] ^ {1 / r} \ right) \ quad {\ text {if}} \ quad k ^ {r} \ leq {\ frac {r ^ {r}} {(r + 1) ^ {r + 1}}} \ operatorname {E} (| X | ^ {r}).}

Граница Гаусса была впоследствии уточнена и распространена на отклонения от среднего, а не на моду, обусловленную неравенством Высочанского – Петунина. Последний был расширен Дхармадхикари и Джоаг-Девом.

п ( | Икс | gt; k ) Максимум ( [ р ( р + 1 ) k ] р E | Икс р | , s ( s - 1 ) k р E | Икс р | - 1 s - 1 ) {\ Displaystyle P (| X |gt; к) \ Leq \ max \ left (\ left [{\ frac {r} {(r + 1) k}} \ right] ^ {r} E | X ^ {r} |, {\ frac {s} {(s-1) k ^ {r}}} E | X ^ {r} | - {\ frac {1} {s-1}} \ right)}

где s - постоянная, удовлетворяющая как s gt; r + 1, так и s ( s  -  r  - 1) =  r r и  r  gt; 0.

Можно показать, что эти неравенства являются наилучшими из возможных и что дальнейшее уточнение границ требует наложения дополнительных ограничений на распределения.

Унимодальные симметричные распределения

Границы этого неравенства также можно уточнить, если распределение является одновременно унимодальным и симметричным. Эмпирическое распределение можно проверить на симметрию с помощью ряда тестов, включая R * Маквильямса. Известно, что дисперсия одномодального симметричного распределения с конечным носителем [,  Ь ] меньше или равно ( б  -  в) 2 /12.

Пусть распределение поддерживается на конечном интервале [- N,  N ] и дисперсия конечна. Пусть режим распределения равен нулю, и измените масштаб дисперсии до 1. Пусть k  gt; 0 и предположим, что k  lt;2 N / 3. потом

п ( Икс k ) 1 2 - k 2 3 если 0 k 2 3 , {\ displaystyle P (X \ geq k) \ leq {\ frac {1} {2}} - {\ frac {k} {2 {\ sqrt {3}}}} \ quad {\ text {if}} \ quad 0 \ leq k \ leq {\ frac {2} {\ sqrt {3}}},}
п ( Икс k ) 2 9 k 2 если 2 3 k 2 N 3 . {\ displaystyle P (X \ geq k) \ leq {\ frac {2} {9k ^ {2}}} \ quad {\ text {if}} \ quad {\ frac {2} {\ sqrt {3}} } \ leq k \ leq {\ frac {2N} {3}}.}

Если 0 lt; k ≤ 2 / √ 3, границы достигаются с плотностью

ж ( Икс ) знак равно 1 2 3 если | Икс | lt; 3 {\ displaystyle f (x) = {\ frac {1} {2 {\ sqrt {3}}}} \ quad {\ text {if}} \ quad | x | lt;{\ sqrt {3}}}
ж ( Икс ) знак равно 0 если | Икс | 3 . {\ displaystyle f (x) = 0 \ quad {\ text {if}} \ quad | x | \ geq {\ sqrt {3}}.}

Если 2 / √ 3 lt; k ≤ 2 N / 3, оценки достигаются распределением

( 1 - β k ) δ 0 ( Икс ) + β k ж k ( Икс ) , {\ displaystyle (1- \ beta _ {k}) \ delta _ {0} (x) + \ beta _ {k} f_ {k} (x),}

где β k = 4/3 k 2, δ 0 - дельта-функция Дирака и где

ж k ( Икс ) знак равно 1 3 k если | Икс | lt; 3 k 2 , {\ displaystyle f_ {k} (x) = {\ frac {1} {3k}} \ quad {\ text {if}} \ quad | x | lt;{\ frac {3k} {2}},}
ж k ( Икс ) знак равно 0 если | Икс | 3 k 2 . {\ displaystyle f_ {k} (x) = 0 \ quad {\ text {if}} \ quad | x | \ geq {\ frac {3k} {2}}.}

Существование этих плотностей показывает, что оценки оптимальны. Поскольку N произвольно эти границы применимы к любому значению N.

Неравенство Кэмп-Мейделла является родственным неравенством. Для абсолютно непрерывного одномодального и симметричного распределения

п ( | Икс - μ | k σ ) 1 - k 3 если k 2 3 , {\ displaystyle P (| X- \ mu | \ geq k \ sigma) \ leq 1 - {\ frac {k} {\ sqrt {3}}} \ quad {\ text {if}} \ quad k \ leq { \ frac {2} {\ sqrt {3}}},}
п ( | Икс - μ | k σ ) 4 9 k 2 если k gt; 2 3 . {\ displaystyle P (| X- \ mu | \ geq k \ sigma) \ leq {\ frac {4} {9k ^ {2}}} \ quad {\ text {if}} \ quad kgt; {\ frac { 2} {\ sqrt {3}}}.}

DasGupta показала, что если известно, что распределение нормальное

п ( | Икс - μ | k σ ) 1 3 k 2 . {\ Displaystyle P (| X- \ mu | \ geq k \ sigma) \ leq {\ frac {1} {3k ^ {2}}}.}

Примечания

Эффекты симметрии и унимодальности

Симметрия распределения уменьшает границы неравенства в 2 раза, в то время как унимодальность уточняет границы в 4/9 раз.

Поскольку среднее значение и мода в унимодальном распределении различаются не более чем на √ 3 стандартных отклонения, не более 5% симметричного унимодального распределения лежит за пределами (2 √ 10  + 3 √ 3) / 3 стандартных отклонения среднего (приблизительно 3,840 стандартных отклонений).). Это более точно, чем оценки, обеспечиваемые неравенством Чебышева (примерно 4,472 стандартных отклонения).

Эти границы для среднего менее точны, чем те, которые могут быть получены только на основе симметрии распределения, которая показывает, что максимум 5% распределения находится за пределами приблизительно 3,162 стандартных отклонений среднего. Неравенство Vysochanskiï-Петуния дополнительно обостряет эту оценку, показав, что для такого распределения в том, что не более 5% от распределения лежит за пределами 4 √ 5 /3 (примерно 2,981) стандартных отклонений от среднего значения.

Симметричные унимодальные распределения

Для любого симметричного унимодального распределения

  • максимум приблизительно 5,784% распределения лежит за пределами 1,96 стандартных отклонений режима
  • не более 5% от распределения лежит за пределами 2 √ 10 /3 (приблизительно 2.11) стандартных отклонений от режима

Нормальные распределения

Неравенство DasGupta утверждает, что для нормального распределения не менее 95% находится в пределах примерно 2,582 стандартных отклонений от среднего. Это менее резкое, чем истинное значение (приблизительно 1,96 стандартного отклонения среднего).

Границы для конкретных дистрибутивов

Ноль означает

Когда среднее ( μ) равно нулю, неравенство Чебышева принимает простой вид. Пусть σ 2 - дисперсия. потом

п ( | Икс | 1 ) σ 2 . {\ Displaystyle Р (| Икс | \ geq 1) \ leq \ sigma ^ {2}.}

При тех же условиях неравенство Кантелли принимает вид

п ( Икс 1 ) σ 2 1 + σ 2 . {\ displaystyle P (X \ geq 1) \ leq {\ frac {\ sigma ^ {2}} {1+ \ sigma ^ {2}}}.}

Отклонение от единицы

Если при этом E ( X 2) = 1 и E ( X 4) = ψ, то для любого 0 ≤ ε ≤ 1

Pr ( | Икс | gt; ε ) ( 1 - ϵ 2 ) 2 ψ - 1 + ( 1 - ε 2 ) 2 ( 1 - ε 2 ) 2 ψ . {\ Displaystyle \ Pr (| Икс |gt; \ varepsilon) \ geq {\ frac {(1- \ epsilon ^ {2}) ^ {2}} {\ psi -1+ (1- \ varepsilon ^ {2}) ^ {2}}} \ geq {\ frac {(1- \ varepsilon ^ {2}) ^ {2}} {\ psi}}.}

Первое неравенство точное. Это известно как неравенство Пэли – Зигмунда.

Также известно, что для случайной величины, удовлетворяющей указанным выше условиям,

п ( Икс ε ) C 0 ψ - C 1 ψ ε + C 2 ψ ψ ε {\ displaystyle P (X \ geq \ varepsilon) \ geq {\ frac {C_ {0}} {\ psi}} - {\ frac {C_ {1}} {\ sqrt {\ psi}}} \ varepsilon + { \ frac {C_ {2}} {\ psi {\ sqrt {\ psi}}}} \ varepsilon}

куда

C 0 знак равно 2 3 - 3 ( 0,464 ) , {\ displaystyle C_ {0} = 2 {\ sqrt {3}} - 3 \ quad (\ приблизительно 0,464),}
C 1 знак равно 1,397 , {\ displaystyle C_ {1} = 1,397,}
C 2 знак равно 0,0231. {\ displaystyle C_ {2} = 0,0231.}

Также известно, что

Pr ( Икс gt; 0 ) C 0 ψ . {\ displaystyle \ Pr (Xgt; 0) \ geq {\ frac {C_ {0}} {\ psi}}.}

Значение C 0 является оптимальным и оценки точны, если

ψ 3 3 + 1 ( 1.098 ) . {\ displaystyle \ psi \ geq {\ frac {3} {{\ sqrt {3}} + 1}} \ quad (\ приблизительно 1.098).}

Если

ψ 3 3 + 1 {\ displaystyle \ psi \ leq {\ frac {3} {{\ sqrt {3}} + 1}}}

тогда точная оценка

п ( Икс gt; 0 ) 2 3 + ψ + ( 1 + ψ ) 2 - 4 . {\ displaystyle P (Xgt; 0) \ geq {\ frac {2} {3+ \ psi + {\ sqrt {(1+ \ psi) ^ {2} -4}}}}.}

Интегральное неравенство Чебышева

Существует второе (менее известное) неравенство, также названное именем Чебышева.

Если f, g  : [ a, b ] → R - две монотонные функции одинаковой монотонности, то

1 б - а а б ж ( Икс ) грамм ( Икс ) d Икс [ 1 б - а а б ж ( Икс ) d Икс ] [ 1 б - а а б грамм ( Икс ) d Икс ] . {\ displaystyle {\ frac {1} {ba}} \ int _ {a} ^ {b} \! f (x) g (x) \, dx \ geq \ left [{\ frac {1} {ba} } \ int _ {a} ^ {b} \! f (x) \, dx \ right] \ left [{\ frac {1} {ba}} \ int _ {a} ^ {b} \! g ( x) \, dx \ right].}

Если f и g имеют противоположную монотонность, то указанное выше неравенство работает в обратном порядке.

Это неравенство связано с неравенством Йенсена, неравенства Канторовича, в неравенстве Эрмита-Адамара и гипотезы Уолтера.

Другое неравенство

Есть также ряд других неравенств, связанных с Чебышевым:

Превращение холдейна

Одно из применений неравенства Чебышева в приложениях - создание доверительных интервалов для переменных с неизвестным распределением. Холдейн отметил, используя уравнение, полученное Кендаллом, что, если переменная ( x) имеет нулевое среднее значение, единичную дисперсию, а также конечную асимметрию ( γ) и эксцесс ( κ), тогда вариация может быть преобразована в стандартную оценку с нормальным распределением ( z):

z знак равно Икс - γ 6 ( Икс 2 - 1 ) + Икс 72 [ 2 γ 2 ( 4 Икс 2 - 7 ) - 3 κ ( Икс 2 - 3 ) ] + {\ displaystyle z = x - {\ frac {\ gamma} {6}} (x ^ {2} -1) + {\ frac {x} {72}} [2 \ gamma ^ {2} (4x ^ { 2} -7) -3 \ kappa (x ^ {2} -3)] + \ cdots}

Это преобразование может быть полезно как альтернатива неравенству Чебышева или как дополнение к нему для получения доверительных интервалов для переменных с неизвестными распределениями.

Хотя это преобразование может быть полезно для умеренно искаженных и / или куртотических распределений, оно плохо работает, когда распределение заметно искажено и / или куртотическое.

Примечания

Агентство по охране окружающей среды предложило лучшие практики использования неравенства Чебышева для оценки доверительных интервалов. lt;Исхgt; Расчет верхних доверительных пределов воздействия точечных скоплений на опасных сайтах отходов (Отчет). Управление по чрезвычайным ситуациям и восстановлению Агентства по охране окружающей среды США. Декабрь 2002. Дата обращения 5 августа 2016.

Смотрите также

использованная литература

дальнейшее чтение

  • А. Папулис (1991), Вероятность, случайные величины и случайные процессы, 3-е изд. Макгроу-Хилл. ISBN   0-07-100870-5. С. 113–114.
  • Г. Гриммет и Д. Стирзакер (2001), Вероятность и случайные процессы, 3-е изд. Оксфорд. ISBN   0-19-857222-0. Раздел 7.3.

внешние ссылки

Последняя правка сделана 2023-04-16 11:46:47
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте