Асимметрия

редактировать
мера асимметрии случайных величин

Пример распределения с ненулевой (положительной) асимметрией. Эти данные взяты из экспериментов по выращиванию ростков пшеницы.

В теории вероятностей и статистике, асимметрия является мерой асимметрии вероятности распределение реальной -значной случайной величины относительно ее среднего значения. Значение асимметрии может быть положительным, нулевым, отрицательным или неопределенным.

Для унимодального распределения отрицательный перекос обычно указывает на то, что хвост находится на левой стороне распределения, а положительный перекос указывает, что хвост находится справа. В случаях, когда один хвост длинный, а другой толстый, перекос не подчиняется простому правилу. Например, нулевое значение означает, что хвосты по обе стороны от среднего в целом уравновешиваются; это верно для симметричного распределения, но также может быть верно и для асимметричного распределения, когда один хвост длинный и тонкий, а другой короткий, но толстый.

Содержание

  • 1 Введение
  • 2 Соотношение среднего и медианы
  • 3 Определение
    • 3.1 Коэффициент асимметрии момента Пирсона
    • 3.2 Примеры
    • 3.3 Асимметрия образца
  • 4 Приложения
  • 5 Другие меры асимметрии
    • 5.1 Первый коэффициент асимметрии Пирсона (модовая асимметрия)
    • 5.2 Второй коэффициент асимметрии Пирсона (медианная асимметрия)
    • 5.3 Измерения на основе квантилей
    • 5.4 Коэффициент Греневельда и Мидена
    • 5.5 L-моменты
    • 5.6 Асимметрия расстояния
    • 5.7 Medcouple
  • 6 См. Также
  • 7 Ссылки
    • 7.1 Цитаты
    • 7.2 Источники
  • 8 Внешние ссылки

Введение

Рассмотрим два распределения на рисунке ниже. На каждом графике значения на правой стороне распределения сужаются иначе, чем значения на левой стороне. Эти сужающиеся стороны называются хвостами, и они предоставляют визуальные средства для определения, какой из двух видов асимметрии имеет распределение:

  1. отрицательный перекос: левый хвост длиннее; масса раздачи сосредоточена в правой части рисунка. Распределение называется скошенным влево, левосторонним или наклонным влево, несмотря на то, что сама кривая кажется скошенной или наклоненной вправо; left вместо этого относится к вытянутому левому хвосту и, часто, к среднему значению, которое смещено влево от типичного центра данных. Распределение с перекосом влево обычно выглядит как кривая с наклоном вправо.
  2. положительный перекос: правый хвост длиннее; масса раздачи сосредоточена в левой части рисунка. Распределение называется скошенным вправо, с правым хвостом или смещенным вправо, несмотря на то, что сама кривая кажется смещенной или наклоненной влево; Право вместо этого относится к вытянутому правому хвосту и, часто, среднему значению, смещенному вправо от типичного центра данных. Распределение со смещением вправо обычно выглядит как наклонная влево кривая.

Диаграммы отрицательного и положительного перекоса (английский).svg

Смещение в ряду данных иногда можно наблюдать не только графически, но и путем простого просмотра значений. Например, рассмотрим числовую последовательность (49, 50, 51), значения которой равномерно распределены вокруг центрального значения 50. Мы можем преобразовать эту последовательность в отрицательно искаженное распределение, добавив значение намного ниже среднего, что, вероятно, является отрицательный выброс, например (40, 49, 50, 51). Следовательно, среднее значение последовательности становится 47,5, а медиана - 49,5. На основе формулы непараметрический перекос, определенный как (μ - ν) / σ, {\ displaystyle (\ mu - \ nu) / \ sigma,}(\ mu - \ nu) / \ sigma, перекос отрицательный. Точно так же мы можем сделать последовательность положительно искаженной, добавив значение, намного превышающее среднее, что, вероятно, является положительным выбросом, например (49, 50, 51, 60), где среднее значение равно 52,5, а медиана - 50,5.

Как упоминалось ранее, унимодальное распределение с нулевым значением асимметрии не означает, что это распределение обязательно симметрично. Однако симметричное унимодальное или мультимодальное распределение всегда имеет нулевую асимметрию.

Пример асимметричного распределения с нулевой асимметрией. Этот рисунок служит контрпримером, что нулевая асимметрия не обязательно означает симметричное распределение. (Асимметрия рассчитывалась с помощью моментного коэффициента асимметрии Пирсона.)

Соотношение среднего и медианы

Асимметрия не имеет прямого отношения к соотношению между средним и медианным: распределение с отрицательным перекосом может иметь свое среднее значение. больше или меньше медианы, а также для положительного перекоса.

Общая взаимосвязь среднего и медианного значений при разном асимметричном одномодальном распределении

В старом понятии непараметрический перекос, определяемом как (μ - ν) / σ, {\ displaystyle (\ mu - \ nu) / \ sigma,}(\ mu - \ nu) / \ sigma, где μ {\ displaystyle \ mu}\ mu - это означает, ν {\ displaystyle \ nu}\ nu - это медиана, а σ {\ displaystyle \ sigma}\ sigma является стандартным отклонением, асимметрия определяется в терминах этого отношения: положительный / непараметрический перекос вправо означает, что среднее значение больше (справа от) медианы, в то время как отрицательный / непараметрический перекос влево означает среднее меньше (слева от) t он средний. Однако современное определение асимметрии и традиционное непараметрическое определение не всегда имеют один и тот же знак: хотя они совпадают для некоторых семейств распределений, они различаются в некоторых случаях, и их объединение вводит в заблуждение.

Если распределение симметрично, то среднее значение равно медиане, и распределение имеет нулевую асимметрию. Если распределение одновременно симметричное и унимодальное, то среднее = медианное = мода. Это случай подбрасывания монеты или серии 1, 2, 3, 4,... Обратите внимание, однако, что обратное неверно в целом, т.е. нулевая асимметрия не означает, что среднее значение равно медиане.

В журнальной статье 2005 г. указывается:

Многие учебники учат практическому правилу, согласно которому среднее значение находится справа от медианы при наклоне вправо и слева от медианы при наклоне слева. Это правило с удивительной частотой не работает. Он может дать сбой в мультимодальных распределениях или в распределениях, в которых один конец имеет длинный, а другой тяжелый. Однако чаще всего правило не работает в дискретных распределениях, где площади слева и справа от медианы не равны. Такое распределение не только противоречит учебным соотношениям между средним, медианным и перекосом, но и противоречит интерпретации медианы в учебниках.

Распределение взрослых жителей по домохозяйствам США

Например, в распределении взрослых жителей США домохозяйств перекос вправо. Однако, поскольку в большинстве случаев меньше или равно моду, которая также является медианной, среднее значение находится в более тяжелом левом хвосте. В результате не удалось применить эмпирическое правило, согласно которому среднее значение находится справа от медианы при правом перекосе.

Определение

моментный коэффициент асимметрии Пирсона

Асимметрия случайного переменная X является третьим стандартизированным моментом μ ~ 3 {\ displaystyle {\ tilde {\ mu}} _ {3}}{\ displaystyle { \ tilde {\ mu}} _ {3}} , определяемым как:

μ ~ 3 = E ⁡ [(X - μ σ) 3] = μ 3 σ 3 = E ⁡ [(X - μ) 3] (E ⁡ [(X - μ) 2]) 3/2 = κ 3 κ 2 3 / 2 {\ displaystyle {\ tilde {\ mu}} _ {3} = \ operatorname {E} \ left [\ left ({\ frac {X- \ mu} {\ sigma}} \ right) ^ {3} \ right] = {\ frac {\ mu _ {3}} {\ sigma ^ {3}}} = {\ frac {\ operatorname {E} \ left [(X- \ mu) ^ {3} \ right] } {(\ operatorname {E} \ left [(X- \ mu) ^ {2} \ right]) ^ {3/2}}} = {\ frac {\ kappa _ {3}} {\ kappa _ { 2} ^ {3/2}}}}{\ displaystyle {\ tilde {\ mu}} _ {3} = \ operatorname {E} \ left [\ left ({\ frac {X- \ mu} {\ sigma}} \ right) ^ {3} \ right] = {\ frac {\ mu _ {3}} {\ sigma ^ {3}}} = {\ frac {\ operatorname {E} \ left [(X- \ mu) ^ {3} \ right]} {(\ operatorname {E} \ left [(X- \ mu) ^ {2} \ right]) ^ {3 / 2}}} = {\ frac {\ kappa _ {3}} {\ kappa _ {2} ^ {3/2}}} }

где μ - среднее значение, σ - стандартное отклонение, E - оператор ожидания, μ 3 - это третий центральный момент, а κ t - t-е кумулянты. Иногда его называют моментным коэффициентом асимметрии Пирсона или просто моментным коэффициентом асимметрии, но его не следует путать с другими статистическими данными Пирсона (см. Ниже). Последнее равенство выражает асимметрию в терминах отношения третьего кумулянта κ 3 к 1,5-й степени второго кумулянта κ 2. Это аналогично определению эксцесса как четвертого кумулянта, нормализованного квадратом второго кумулянта. Асимметрию также иногда обозначают Skew [X].

Если σ конечно, μ тоже конечно, и перекос можно выразить через нецентральный момент E [X], расширив предыдущую формулу,

μ ~ 3 = E ⁡ [(X - μ σ) 3] = E ⁡ [X 3] - 3 μ E ⁡ [X 2] + 3 μ 2 E ⁡ [X] - μ 3 σ 3 = E ⁡ [X 3] - 3 μ (E ⁡ [ X 2] - μ E ⁡ [X]) - μ 3 σ 3 = E ⁡ [X 3] - 3 μ σ 2 - μ 3 σ 3. {\ displaystyle {\ begin {align} {\ tilde {\ mu}} _ {3} = \ operatorname {E} \ left [\ left ({\ frac {X- \ mu} {\ sigma}} \ right) ^ {3} \ right] \\ = {\ frac {\ operatorname {E} [X ^ {3}] - 3 \ mu \ operatorname {E} [X ^ {2}] + 3 \ mu ^ { 2} \ operatorname {E} [X] - \ mu ^ {3}} {\ sigma ^ {3}}} \\ = {\ frac {\ operatorname {E} [X ^ {3}] - 3 \ mu (\ operatorname {E} [X ^ {2}] - \ mu \ operatorname {E} [X]) - \ mu ^ {3}} {\ sigma ^ {3}}} \\ = {\ frac {\ operatorname {E} [X ^ {3}] - 3 \ mu \ sigma ^ {2} - \ mu ^ {3}} {\ sigma ^ {3}}}. \ end {align}}}{\ displaystyle {\ begin {выровнено} {\ tilde {\ mu}} _ {3} = \ operatorname {E} \ left [\ left ({\ frac {X- \ mu} {\ sigma}} \ right) ^ {3} \ right] \\ = {\ frac {\ operatorname {E} [X ^ {3}] - 3 \ mu \ operatorname {E} [X ^ {2}] + 3 \ mu ^ {2} \ operatorname {E} [X] - \ mu ^ {3}} {\ sigma ^ {3}}} \\ = {\ frac {\ operatorname {E} [X ^ {3}] - 3 \ mu (\ operatorname {E} [X ^ {2}] - \ mu \ operatorname {E} [X]) - \ mu ^ {3}} {\ sigma ^ {3}}} \\ = {\ frac {\ operatorname {E} [X ^ {3}] - 3 \ mu \ sigma ^ {2} - \ mu ^ {3} } {\ sigma ^ {3}}}. \ end {align}}}

Примеры

Асимметрия может быть бесконечной, например, когда

Pr [X>x] = x - 2 для x>1, Pr [X < 1 ] = 0 {\displaystyle \Pr \left[X>x \ right] = x ^ {- 2} {\ t_dv {for}} x>1, \ \ Pr [X <1]=0}\Pr \left[ X>x \ right] = x ^ {- 2} \ t_dv {for} x>1, \ \ Pr [X <1]=0

где третьи кумулянты бесконечны, или как когда

Pr [X < x ] = ( 1 − x) − 3 / 2 for negative x and Pr [ X>x] = (1 + x) - 3/2 для положительного x. {\ displaystyle \ Pr [X x] = (1 + x) ^ {- 3} / 2 {\ t_dv {для положительного}} x.}\Pr[X<x]=(1-x)^{-3}/2{\t_dv{ for negative }}x{\t_dv{ and }}\Pr[X>x] = (1 + x) ^ {- 3} / 2 {\ t_dv {для положительного}} x.

, где третий кумулянт не определен.

Примеры распределений с конечной асимметрией включают следующее:

асимметрия выборки

Для выборки из n значений естественный метод моментов оценка асимметрии генеральной совокупности

б 1 знак равно м 3 s 3 знак равно 1 N ∑ я знак равно 1 N (xi - x ¯) 3 [1 n - 1 ∑ я = 1 n (xi - x ¯) 2] 3/2, {\ displaystyle b_ { 1} = {\ frac {m_ {3}} {s ^ {3}}} = {\ fr ac {{\ tfrac {1} {n}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ overline {x}}) ^ {3}} {\ left [{\ tfrac {1} {n-1}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ overline {x}}) ^ {2} \ right] ^ {3/2}}},}{\ displaystyle b_ {1} = {\ frac {m_ {3}} {s ^ {3}}} = {\ frac {{\ tfrac {1} {n}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ overline {x}}) ^ {3}} {\ left [{\ tfrac {1} {n-1}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ overline {x}}) ^ {2} \ right] ^ {3/2}}},}

где x ¯ {\ displaystyle {\ overline {x}}}{\ overline {x}} - это выборочное среднее, s - стандартное отклонение выборки, а числитель m 3 - это третий центральный момент.

выборки. Другое общее определение асимметрии выборки:

G 1 = k 3 k 2 3/2 = n 2 ( n - 1) (n - 2) m 3 s 3 = n (n - 1) n - 2 1 n ∑ i = 1 n (xi - x ¯) 3 [1 n ∑ i = 1 n (xi - x ¯) 2] 3/2, {\ displaystyle {\ begin {align} G_ {1} = {\ frac {k_ {3}} {k_ {2} ^ {3/2}}} = {\ frac {n ^ {2}} {(n-1) (n-2)}} \; {\ frac {m_ {3}} {s ^ {3}}} = {\ frac {\ sqrt {n (n-1)}} {n-2}} {\ frac {{\ frac {1} {n}} \ sum \ limits _ {i = 1} ^ {n} {(x_ {i} - {\ bar {x}) })} ^ {3}} {\ left [{\ frac {1} {n}} \ sum \ limits _ {i = 1} ^ {n} (x_ {i} - {\ bar {x}}) ^ {2} \ right] ^ {3/2}}}, \\\ end {align}}}{\ displaystyle {\ begin {align} G_ {1} = {\ frac {k_ {3}} {k_ {2} ^ {3/2}}} = {\ frac {n ^ {2}} {(n-1) (n-2) }} \; {\ frac {m_ {3}} {s ^ {3}}} = {\ frac {\ sqrt {n (n-1)}} { n-2}} {\ frac {{\ frac {1} {n}} \ sum \ limits _ {i = 1} ^ {n} {(x_ {i} - {\ bar {x}})} ^ {3}} {\ left [{\ frac {1} {n}} \ sum \ limits _ {i = 1} ^ {n} (x_ {i} - {\ bar {x}}) ^ {2} \ right] ^ {3/2}}}, \\\ конец {выровнено}}}

где k 3 {\ displaystyle k_ {3}}k_ {3} - это уникальная симметричная несмещенная оценка третьего кумулянта и k 2 = s 2 {\ displaystyle k_ {2} = s ^ {2}}k_ {2} = s ^ {2} - симметричная несмещенная оценка второго кумулянта (т. Е. выборочная дисперсия ). Этот скорректированный стандартизованный коэффициент момента Фишера – Пирсона G 1 {\ displaystyle G_ {1}}G_ {1} является версией, найденной в Excel и нескольких статистических пакетах, включая Minitab, SAS и SPSS.

Как правило, отношения b 1 {\ displaystyle b_ {1}}b_ {1} и G 1 {\ displaystyle G_ {1}}G_ {1} оба являются смещенными оценками асимметрии генеральной совокупности γ 1 {\ displaystyle \ gamma _ {1}}\ gamma _ {1} ; их ожидаемые значения могут даже иметь знак, противоположный истинной асимметрии. (Например, смешанное распределение, состоящее из очень тонких гауссианов с центрами -99, 0,5 и 2 с весами 0,01, 0,66 и 0,33, имеет асимметрию примерно -9,77, но в выборке из 3 G 1 { \ displaystyle G_ {1}}G_ {1} имеет ожидаемое значение около 0,32, поскольку обычно все три выборки находятся в положительной части распределения, которое искажено в другую сторону.) Тем не менее, b 1 {\ displaystyle b_ {1}}b_ {1} и G 1 {\ displaystyle G_ {1}}G_ {1} , очевидно, имеют правильное ожидаемое значение нуля для любого симметричного распределения с конечный третий момент, включая нормальное распределение.

В предположении, что основная случайная величина X {\ displaystyle X}X нормально распределена, можно показать, что nb 1 → d N (0, 6) {\ displaystyle {\ sqrt {n}} b_ {1} {\ xrightarrow {d}} N (0,6)}{\ displaystyle {\ sqrt {n}} b_ {1} {\ xrightarrow {d}} N (0,6)} , т.е. его распределение сходится к нормальному распределению со средним 0 и дисперсией 6. Отклонение асимметрии случайной выборки размера n от нормального распределения составляет

var ⁡ (G 1) = 6 n (n - 1) (n - 2) (n + 1) (n + 3). {\ displaystyle \ operatorname {var} (G_ {1}) = {\ frac {6n (n-1)} {(n-2) (n + 1) (n + 3)}}.}\ operatorname {var} (G_ {1}) = {\ frac {6n (n-1) } {(п-2) (п + 1) (п + 3)}}.

An приблизительный вариант - 6 / n, но это неточно для небольших выборок.

В нормальных выборках b 1 {\ displaystyle b_ {1}}b_ {1} имеет меньшую дисперсию из двух оценок, с

var ⁡ (b 1) < var ⁡ ( m 3 m 2 3 / 2) < var ⁡ ( G 1), {\displaystyle \operatorname {var} (b_{1})<\operatorname {var} \left({\frac {m_{3}}{m_{2}^{3/2}}}\right)<\operatorname {var} (G_{1}),}\ operatorname {var} (b_ {1}) <\ имя оператора {var} \ left ({\ frac {m_ {3}} {m_ {2} ^ {3/2}}} \ right) <\ operatorname {var} (G_ {1}),

где в знаменателе

m 2 = 1 n ∑ i = 1 n (xi - x ¯) 2 {\ displaystyle m_ {2} = {\ frac {1} {n}} \ sum \ limits _ {i = 1} ^ {n} {(x_ {i} - {\ bar {x}})} ^ {2}}{\ displaystyle m_ {2} = {\ frac {1} {n}} \ sum \ limits _ {i = 1} ^ {n} {(x_ {i} - {\ bar {x}})} ^ {2}}

- (смещенный) выборочный второй центральный момент.

Приложения

Асимметрия - это описательная статистика, которую можно использовать в сочетании с гистограммой и нормальным графиком квантилей для характеристики данных или распределения.

Асимметрия указывает направление и относительную величину отклонения распределения от нормального распределения.

При явной асимметрии стандартные процедуры статистического вывода, такие как доверительный интервал для среднего значения, будут не только неверными в том смысле, что истинный уровень охвата будет отличаться от номинального (например, 95%), но они также приведут к неравной вероятности ошибки с каждой стороны.

Асимметрия может использоваться для получения приблизительных вероятностей и квантилей распределений (таких как значение риска в финансах) с помощью разложения Корниш-Фишера.

Многие модели предполагают нормальное распределение ; т.е. данные симметричны относительно среднего. У нормального распределения асимметрия равна нулю. Но на самом деле точки данных могут не быть идеально симметричными. Итак, понимание асимметрии набора данных указывает на то, будут ли отклонения от среднего положительными или отрицательными.

К-квадрат Д'Агостино - это критерий пригодности нормальности, основанный на асимметрии выборки и эксцессе выборки.

Другие показатели асимметрии

Сравнение среднего, медианы и режима двух логнормальных распределений с теми же медианами и разными асимметриями.

Были использованы другие меры асимметрии, включая более простые вычисления, предложенные Карлом Пирсоном (не путать с моментным коэффициентом асимметрии Пирсона, см. выше). Этими другими показателями являются:

Первый коэффициент асимметрии Пирсона (асимметрия моды)

Асимметрия режима Пирсона или первый коэффициент асимметрии определяется как

среднее значение - режим / стандартное отклонение.

Второй коэффициент асимметрии Пирсона (медианная асимметрия)

Медианная асимметрия Пирсона или второй коэффициент асимметрии определяется как

3 (среднее значение - медиана ) / стандартное отклонение.

Что является простым кратным непараметрического перекоса.

Квантильных показателей

показателя асимметрии Боули (от 1901), также называемый коэффициент Юла (с 1912 года) определяется как:

B 1 = Q 3 + Q 1 - 2 Q 2 Q 3 - Q 1 {\ displaystyle B_ {1} = { \ frac {{{Q} _ {3}} + {{Q} _ {1}} - 2 {{Q} _ {2}}} {{{Q} _ {3}} - {{Q} _ {1}}}}}{\ displaystyle B_ {1} = {\ frac {{{Q} _ {3}} + {{Q} _ {1}} -2 {{Q} _ {2}}} {{{Q} _ {3}} - {{Q} _ {1}}}}} .

При записи как Q 3 + Q 1 2 - Q 2 Q 3 - Q 1 2 {\ displaystyle {\ frac {{\ frac {{{Q} _ {3 }} + {{Q} _ {1}}} {2}} - {{Q} _ {2}}} {\ frac {{{Q} _ {3}} - {{Q} _ {1} }} {2}}}}{\ displaystyle {\ frac {{\ frac {{ {Q} _ {3}} + {{Q} _ {1}}} {2}} - {{Q} _ {2}}} {\ frac {{{Q} _ {3}} - {{ Q} _ {1}}} {2}}}} , легче увидеть, что числитель - это разница между среднее значение верхнего и нижнего квартилей (мера местоположения) и медианы (еще одна мера местоположения), а знаменателем является полумежквартильный диапазон (Q3-Q1) / 2, который для симметричных распределений является MAD мерой дисперсии.

Другие названия этой меры - мера асимметрии Гальтона, индекс Юла – Кендалла и квартиль асимметрии,

более общая формулировка функция асимметрии была описана Groeneveld, RA и Meeden, G. (1984):

γ (u) = F - 1 (u) + F - 1 (1 - u) - 2 F - 1 (1/2) F - 1 (u) - F - 1 (1 - u) {\ displaystyle \ gamma (u) = {\ frac {F ^ {- 1} (u) + F ^ {- 1} (1-u) -2F ^ {- 1} (1/2)} {F ^ {- 1} (u) -F ^ {- 1} (1-u)}}}\ gamma (u) = {\ frac {F ^ {- 1} (u) + F ^ {-1} (1-u) -2F ^ {- 1} (1/2)} {F ^ {- 1} (u) -F ^ {- 1} (1-u)}}

где F - кумулятивное распределение функция. Это приводит к соответствующей общей мере асимметрии, определяемой как супремум этого в диапазоне 1/2 ≤ u < 1. Another measure can be obtained by integrating the numerator and denominator of this expression. The function γ(u) satisfies −1 ≤ γ(u) ≤ 1 and is well defined without requiring the existence of any moments of the distribution. Quantile-based skewness measures are at first glance easy to interpret, but they often show significantly larger sample variations, than moment-based methods. This means that often samples from a symmetric distribution (like the uniform distribution) have a large quantile-based skewness, just by chance.

мера асимметрии Боули равна γ (u), оцениваемой при u = 3/4. Для меры асимметрии Келли используется u = 0,1.

Греневельд и коэффициент Медена

Греневельд и Меден предложили в качестве альтернативной меры асимметрии

B 3 = перекос (X) = ( μ - ν) E (| X - ν |), {\ displaystyle B_ {3} = \ mathrm {skew} (X) = {\ frac {(\ mu - \ nu)} {E (| X- \ nu) |)}},}{\ displaystyle B_ {3} = \ mathrm {skew} (X) = {\ frac {(\ mu - \ nu)} {E (| X- \ nu |)}},}

где μ - среднее значение, ν - медиана, |... | - абсолютное значение, а E () - это оператор ожидания. Это тесно связано по форме со вторым коэффициентом асимметрии Пирсона.

L-моментов

Использование L-моментов вместо моментов обеспечивает меру асимметрии, известную как L -scewness.

Distance skewness

Значение асимметрии, равное нулю, не означает, что распределение вероятностей является симметричным. Таким образом, существует потребность в другой мере асимметрии, обладающей этим свойством: такая мера была введена в 2000 году. Она называется асимметрия расстояния и обозначается dSkew. Если X - случайная величина, принимающая значения в d-мерном евклидовом пространстве, X имеет конечное ожидание, X 'является независимой идентично распределенной копией X и ‖ ⋅ ‖ {\ displaystyle \ | \ cdot \ |}\ | \ cdot \ | обозначает норму в евклидовом пространстве, тогда простая мера асимметрии относительно параметра местоположения θ равна

dSkew ⁡ (X): = 1 - E ⁡ ‖ X - X ′ ‖ E ⁡ ‖ X + X ′ - 2 θ ‖, если Pr (X = θ) ≠ 1 {\ displaystyle \ operatorname {dSkew} (X): = 1 - {\ frac {\ operatorname {E} \ | X-X '\ |} { \ operatorname {E} \ | X + X'-2 \ theta \ |}} {\ text {if}} \ Pr (X = \ theta) \ neq 1}{\displaystyle \operatorname {dSkew} (X):=1-{\frac {\operatorname {E} \|X-X'\|}{\operatorname {E} \|X+X'-2\theta \|}}{\text{ if }}\Pr(X=\theta)\neq 1}

и dSkew (X): = 0 для X = θ (с вероятностью 1). Асимметрия расстояния всегда находится между 0 и 1, равна 0 тогда и только тогда, когда X диагонально симметрична относительно θ (X и 2θ − X имеют одинаковое распределение вероятностей) и равна 1 тогда и только тогда, когда X является константой c (c ≠ θ {\ displaystyle c \ neq \ theta}{\ displaystyle c \ neq \ theta} ) с вероятностью единица. Таким образом, существует простой согласованный статистический тест диагональной симметрии, основанный на асимметрии выборочного расстояния :

dSkew n ⁡ (X): = 1 - ∑ i, j ‖ xi - xj ‖ ∑ i, j ‖ xi + xj - 2 θ ‖. {\ displaystyle \ operatorname {dSkew} _ {n} (X): = 1 - {\ frac {\ sum _ {i, j} \ | x_ {i} -x_ {j} \ |} {\ sum _ { i, j} \ | x_ {i} + x_ {j} -2 \ theta \ |}}.}{\ displaystyle \ operatorname {dSkew} _ {n} (X): = 1 - {\ frac {\ sum _ {i, j} \ | x_ {i} -x_ {j} \ |} {\ sum _ {i, j } \ | x_ {i} + x_ {j} -2 \ theta \ |}}.}

Medcouple

medcouple - масштабно-инвариантная надежная мера асимметрии, с точкой пробоя 25%. Это медиана значений функции ядра

h (xi, xj) = (xi - xm) - (xm - xj) xi - xj {\ displaystyle h (x_ {i}), x_ {j}) = {\ frac {(x_ {i} -x_ {m}) - (x_ {m} -x_ {j})} {x_ {i} -x_ {j}}}}h (x_ {i}, x_ {j}) = {\ frac {(x_ {i} -x_ {m}) - (x_ {m} -x_ {j})} {x_ {i} -x_ {j}}}

взяты по всем парам (xi, xj) {\ displaystyle (x_ {i}, x_ {j})}(x_ {i}, x_ {j}) такие, что xi ≥ xm ≥ xj {\ displaystyle x_ {i } \ geq x_ {m} \ geq x_ {j}}x_ {i} \ geq x_ {m} \ geq x_ {j} , где xm {\ displaystyle x_ {m}}x_ {m} - медиана выборки {x 1, x 2,…, xn} {\ displaystyle \ {x_ {1}, x_ {2}, \ ldots, x_ {n} \}}\ {x_ {1}, x_ {2}, \ ldots, x_ {n} \} . Его можно рассматривать как медианное значение всех возможных мер квантильной асимметрии.

См. Также

  • icon Портал математики

Ссылки

Цитаты

Источники

Внешние ссылки

В Викиверситете есть учебные ресурсы о Асимметрии
Викискладе есть средства массовой информации, связанные с Асимметрия ( статистика).
Последняя правка сделана 2021-06-08 04:49:43
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте