Непараметрический перекос

редактировать

статистическая величина

В статистика и теория вероятности, непараметрический перекос - это статистика , которая иногда используется с случайными величинами, которые принимают действительные значения. Это мера асимметрии распределения случайной величины, то есть тенденции распределения «наклоняться» в ту или иную сторону от среднего. Для его расчета не требуется никакого знания формы основного распределения - отсюда и название непараметрический. У него есть несколько желаемых свойств: он равен нулю для любого симметричного распределения ; на него не влияет сдвиг шкалы ; и он одинаково хорошо выявляет как левый, так и правый перекос. В некоторых статистических выборках было показано, что он менее эффективен, чем обычные меры асимметрии при обнаружении отклонений совокупности от нормальности.

Содержание

1 Свойства
- 1.1 Определение
- 1.2 Свойства
2 Более точные границы
3 Расширения
- 3.1 Конечные выборки
4 Статистические тесты
5 Связанная статистика
6 значений для индивидуальных распределений
- 6.1 Симметричные распределения
- 6.2 Асимметричные распределения
7 История
8 Взаимосвязь между средним, медианным и модой
- 8.1 Правило Пирсона
- 8.2 Унимодальные распределения
- 8.3 van Zwet условие
9 Примечания
- 9.1 Порядок асимметрии
- 9.2 Закон Бенфорда
- 9.3 Связь с коэффициентом Боули
10 Ссылки

Свойства

Определение

непараметрический перекос определяется как

S = μ - ν σ {\ displaystyle S = {\ frac {\ mu - \ nu} {\ sigma}}}

S = {\ frac {\ mu - \ nu} {\ sigma}}

, где означает (µ), медиана (ν) и стандартное отклонение (σ) совокупности имеют свои обычные значения.

Свойства

Непараметрический перекос составляет одну треть от коэффициента асимметрии Пирсона 2 и находится между -1 и +1 для любого распределения. Этот диапазон подразумевается тем фактом, что среднее значение находится в пределах одного стандартного отклонения от любой медианы.

При аффинном преобразовании переменной (X) значение S не изменяется, кроме на предмет возможного изменения знака. В символах

S (a X + b) = знак ⁡ (a) S (X) {\ displaystyle S (aX + b) = \ operatorname {sign} (a) \, S (X)}

S (aX + b) = \ operatorname {знак} (a) \, S (X)

где a ≠ 0 и b - константы, а S (X) - непараметрический перекос переменной X.

Более точные границы

Границы этой статистики (± 1) были уточнены Маджиндаром, который показал, что его абсолютное значение ограничено

2 (pq) 1/2 (p + q) 1/2 {\ displaystyle {\ frac {2 (pq) ^ {1/2}} {(p + q) ^ {1/2}}}}

{\ frac {2 (pq) ^ {{1/2}}} {(p + q) ^ {{1/2}}}}

p = Pr (X>E ⁡ (X)) {\ displaystyle p = \ Pr (X>\ operatorname {E} ( X))}

p=\Pr(X>\ operatorname {E} (X))

q = Pr (X < E ⁡ ( X)), {\displaystyle q=\Pr(X<\operatorname {E} (X)),}

q = \ Pr (X <\ operatorname {E} (X)),

, где X - случайная величина с конечной дисперсией, E () - оператор математического ожидания, а Pr () - вероятность возникновения события.

Когда p = q = 0,5, абсолютное значение этой статистики ограничено 1. При p = 0,1 и p = 0,01 статистика Абсолютное значение tic ограничено 0,6 и 0,199 соответственно.

Расширения

Также известно, что

| μ - ν 0 | ≤ E ⁡ (| X - ν 0 |) ≤ E ⁡ (| X - μ |) ≤ σ, {\ displaystyle | \ mu - \ nu _ {0} | \ leq \ operatorname {E} (| X- \ nu _ {0} |) \ leq \ operatorname {E} (| X- \ mu |) \ leq \ sigma,}

| \ mu - \ nu _ {0} | \ leq \ operatorname {E} (| X- \ nu _ {0} |) \ leq \ operatorname {E} (| X- \ mu |) \ leq \ sigma,

, где ν 0 - любая медиана, а E (.) - оператор ожидания.

Было показано, что

| μ - x q | σ ≤ макс ((1 - q) q, q (1 - q)) {\ displaystyle {\ frac {| \ mu -x_ {q} |} {\ sigma}} \ leq \ max \ left ({\ sqrt {\ frac {(1-q)} {q}}}, {\ sqrt {\ frac {q} {(1-q)}}} \ right)}

{\ frac {| \ mu -x_ {q} |} {\ sigma}} \ leq \ max \ left ({\ sqrt {{\ frac { (1-q)} {q}}}}, {\ sqrt {{\ frac {q} {(1-q)}}} \ right)

где x q - квантиль q . Квантили лежат между 0 и 1: медиана (квантиль 0,5) имеет q = 0,5. Это неравенство также использовалось для определения меры асимметрии.

Последнее неравенство было дополнительно уточнено.

μ - σ 1 - qq ≤ xq ≤ μ + σ q 1 - q {\ displaystyle \ му - \ sigma {\ sqrt {\ frac {1-q} {q}}} \ leq x_ {q} \ leq \ mu + \ sigma {\ sqrt {\ frac {q} {1-q}}}}

\ mu - \ sigma {\ sqrt {{\ frac {1-q} {q}}}} \ leq x_ {q} \ leq \ mu + \ sigma {\ sqrt {{\ frac {q} {1-q}}}}

Еще одно расширение для распределения с конечным средним было опубликовано:

μ - 1 2 q E ⁡ | X - μ | ≤ x q ≤ μ + 1 (2 - 2 q) E ⁡ | X - μ | {\ displaystyle \ mu - {\ frac {1} {2q}} \ operatorname {E} | X- \ mu | \ leq x_ {q} \ leq \ mu + {\ frac {1} {(2-2q) }} \ operatorname {E} | X- \ mu |}

\ mu - {\ frac {1} {2q}} \ operat orname {E} | X- \ mu | \ leq x_ {q} \ leq \ mu + {\ frac {1} {(2-2q)}} \ operatorname {E} | X- \ mu |

Границы в последней паре неравенств достигаются, когда $Pr (X = a) = q {\ displaystyle \ Pr (X = a) = q}$ $\ Pr (X = a) = q$ и $Pr (X = b) = 1 - q {\ displaystyle \ Pr (X = b) = 1-q}$ $\ Pr (X = b) = 1-q$ для фиксированных чисел a < b.

Конечные выборки

Для конечной выборки с размером выборки n ≥ 2 с x r - это статистика порядка r , m - среднее значение выборки и s - стандартное отклонение выборки с поправкой на степени свободы,

$| м - х г | s ≤ макс [(N - 1) (r - 1) N (N - R + 1), (N - 1) (N - R) NR] {\ Displaystyle {\ frac {| m-x_ {r} | } {s}} \ leq {\ text {max}} \ left [{\ sqrt {\ frac {(n-1) (r-1)} {n (n-r + 1)}}}, {\ sqrt {\ frac {(n-1) (nr)} {nr}}} \ right]}$ ${\ frac {| m-x_ {r} |} {s}} \ leq {\ text {max}} \ left [{\ sqrt {{ \ frac {(n-1) (r-1)} {n (n-r + 1)}}}}, {\ sqrt {{\ frac {(n-1) (nr)} {nr}}} } \ right]$

Замена r на n / 2 дает результат, подходящий для медианы выборки:

$| м - а | s ≤ n 2 - nn 2 = n - 1 n {\ displaystyle {\ frac {| ma |} {s}} \ leq {\ sqrt {\ frac {n ^ {2} -n} {n ^ {2} }}} = {\ sqrt {\ frac {n-1} {n}}}}$ ${\ frac {| ma |} {s}} \ leq {\ sqrt {{\ frac {n ^ {2} -n} {n ^ {2}}}}} = {\ sqrt {{\ frac {n-1}) {n}}}}$

где a - медиана выборки.

Статистические тесты

Хотеллинг и Соломоновы рассматривали распределение тестовой статистики

D = n (m - a) s {\ displaystyle D = {\ frac {n (ma)} {s}}}

D = {\ frac {n ( ma)} {s}}

где n - размер выборки, m - среднее значение выборки, a - медиана выборки, а s - стандартное отклонение выборки.

Статистические тесты D предполагают, что проверяемая нулевая гипотеза заключается в том, что распределение является симметричным.

Гаствирт оценил асимптотическую дисперсию nD. Если распределение является одномодальным и симметричным относительно 0, асимптотическая дисперсия находится между 1/4 и 1. Допущение консервативной оценки (приравнивание дисперсии к 1) может привести к истинному уровню значимости значительно ниже номинального уровня.

Предполагая, что основное распределение является симметричным, Кабилио и Масаро показали, что распределение S является асимптотически нормальным. Асимптотическая дисперсия зависит от основного распределения: для нормального распределения асимптотическая дисперсия S√n равна 0,5708...

Предполагая, что основное распределение является симметричным, учитывая распределение значений выше и ниже медиана Чжэн и Гаствирт утверждали, что

2 n (m - as) {\ displaystyle {\ sqrt {2n}} \ left ({\ frac {ma} {s}} \ right)}

{\ sqrt {2n}} \ left ({\ frac {ma} {s}} \ right)

где n размер выборки, распределен как t-распределение.

Связанная статистика

Мира изучила распределение разницы между средним и медианным значением.

γ 1 = 2 (m - a), {\ displaystyle \ gamma _ {1} = 2 (ma),}

\ gamma _ {1} = 2 (ma),

где m - выборочное среднее, а a - медиана. Если основное распределение является симметричным, то γ 1 само асимптотически нормально. Эта статистика была ранее предложена Бонферрони.

Предполагая симметричное основное распределение, модификация S была изучена Мяо, Гелем и Гаствиртом, которые изменили стандартное отклонение для создания своей статистики. 388>J = 1 n π 2 ∑ | X i - a | {\ displaystyle J = {\ frac {1} {n}} {\ sqrt {\ frac {\ pi} {2}}} \ sum {| X_ {i} -a |}} $J = {\ frac {1} {n}} {\ sqrt {{\ frac {\ pi} {2}}}} \ sum {| X_ {i} -a |}$

где X i - примерные значения, || - абсолютное значение, а сумма берется по всем n выборочным значениям.

Статистика теста была

T = m - a J. {\ displaystyle T = {\ frac {m-a} {J}}.}

T = {\ frac {ma} {J}}.

Масштабированная статистика T√n асимптотически нормальна со средним нулем для симметричного распределения. Его асимптотическая дисперсия зависит от основного распределения: предельные значения: для нормального распределения var (T√n) = 0,5708... и для t-распределения с тремя степенями свободы, var (T√n) = 0,9689...

Значения для отдельных распределений

Симметричные распределения

Для симметричных распределений вероятностей значение непараметрического перекоса равно 0.

Асимметричные распределения

Оно положительно для распределений с перекосом вправо и отрицательно для распределений с перекосом влево. Абсолютные значения ≥ 0,2 указывают на заметную асимметрию.

Может быть сложно определить S для некоторых распределений. Обычно это происходит потому, что закрытая форма для медианы неизвестна: примеры таких распределений включают гамма-распределение, распределение обратного хи-квадрат, обратное гамма-распределение. и масштабированное обратное распределение хи-квадрат.

Известны следующие значения S:

Бета-распределение : 1 < α < β where α and β are the parameters of the distribution, then to a good approximation

S = 1 3 (α - 2 β) (α + β + 1) 1/2 (α + β - 2/3) (α β) 1/2 {\ displaystyle S = {\ frac {1} {3}} {\ frac {(\ alpha -2 \ beta) (\ alpha + \ beta +1) ^ {1/2}} {(\ alpha + \ beta -2/3) (\ alpha \ beta) ^ {1/2}}}}

S = {\ frac {1} {3}} {\ frac {(\ alpha -2 \ beta) (\ alpha + \ beta +1) ^ {{1/2}}} {(\ alpha + \ beta - 2/3) (\ alpha \ beta) ^ {{1/2}}}}

Если 1 < β < α then the positions of α and β are reversed in the formula. S is always < 0.

Биномиальное распределение : варьируется. Если среднее значение является целым числом, тогда S = 0. Если среднее значение не является целым числом, S может иметь знак или быть нулем. Он ограничен ± min {max {p, 1 - p}, log e 2} / σ, где σ - стандартное отклонение биномиального распределения.
Распределение заусенцев :
Бирнбаума – Сондерса распределение :

S = 2 β 2 (4 + 5 α 2) {\ displaystyle S = {\ frac {2} {\ beta ^ {2} (4 + 5 \ alpha ^ {2})}}}

S = {\ frac {2} {\ beta ^ {2} (4 + 5 \ alpha ^ {2})}}

где α - параметр формы, а β - параметр местоположения.

Распределение Кантора :

- 4 3 ≤ S ≤ 4 3 {\ displaystyle {\ frac {-4} {3}} \ leq S \ leq { \ frac {4} {3}}}

{\ frac {-4} {3}} \ leq S \ leq {\ frac {4} {3}}

Распределение хи-квадрат : Хотя S ≥ 0, его значение зависит от числа степеней свободы (k).

S ≈ 1 - (1-2 к) 3 2 {\ displaystyle S \ приблизительно {\ frac {1- (1 - {\ frac {2} {k}}) ^ {3}} {2}}}

S \ приблизительно {\ frac {1- (1 - {\ frac {2} {k }}) ^ {3}} {2}}

S = 1 - log e ⁡ (2) ≈ 0,31 {\ displaystyle S = 1- \ log _ {e} (2) \ приблизительно 0,31}

S = 1- \ log _ { e} (2) \ приблизительно 0,31

Экспоненциальное распределение с двумя параметры:

S = 1 - log e ⁡ (2) ≈ 0,31 {\ displaystyle S = 1- \ log _ {e} (2) \ приблизительно 0,31}

S = 1- \ log _ { e} (2) \ приблизительно 0,31

Экспоненциально-логарифмическое распределение

S = - полилог (2, 1 - p) + ln ⁡ (1 + p) пер ⁡ п - [2 полилог (3, 1 - p) + полилог 2 (2, 1 - p)] {\ displaystyle S = - {\ frac {polylog (2,1-p) + \ ln (1 + {\ sqrt {p}}) \ ln p} {\ sqrt {- [2polylog (3,1-p) + polylog ^ {2} (2,1-p)]}}}}

S = - {\ frac {polylog (2,1-p) + \ ln (1 + {\ sqrt {p}}) \ ln p} {{\ sqrt {- [2p olylog (3,1-p) + polylog ^ {2} (2,1-p)]}}}}

Здесь S всегда>0.

Экспоненциально модифицированное распределение Гаусса :

0 ≤ S ≤ 1 - log e ⁡ (2) {\ displaystyle 0 \ leq S \ leq 1- \ log _ {e} (2) }

0 \ leq S \ leq 1 - \ log _ {e} (2)

F-распределение с n и n степенями свободы (n>4):

S = n - 3/2 n - 4 n - 2 + O (n - 5 / 2) {\ displaystyle S = n ^ {- 3/2} {\ sqrt {\ frac {n-4} {n-2}}} + O (n ^ {- 5/2})}

S = n ^ {{- 3/2}} {\ sqrt {{\ frac {n-4} {n-2}}}} + O (n ^ {{- 5/2}})

Распределение Фреше : Дисперсия этого распределения определена только для α>2.

S = Γ (1 - 1 α) - 1 α log e ⁡ (2) Γ (1-2 α) - (Γ (1-1 α)) 2 {\ Displaystyle S = {\ frac {\ Gamma \ left (1 - {\ frac {1} {\ alpha}} \ right) - {\ frac {1} {{\ sqrt { \ alpha}} \ log _ {e} (2)}}} {\ sqrt {\ Gamma \ left (1 - {\ frac {2} {\ alpha}} \ right) - \ left (\ Gamma \ left ( 1 - {\ frac {1} {\ alpha}} \ right) \ right) ^ {2}}}}}

S = {\ frac {\ Gamma \ left (1 - {\ frac {1} {\ alpha}} \ right) - {\ гидроразрыв {1} {{\ sqrt {\ alpha}} \ log _ {e} (2)}}} {\ sqrt {\ Gamma \ left (1 - {\ frac {2} {\ alpha}} \ right) - \ left (\ Gamma \ left (1 - {\ frac {1} {\ alpha}} \ right) \ right) ^ {2}}}}

Гамма-распределение : медиана может быть определена только приблизительно примерно для этой раздачи. Если параметр формы α равен ≥ 1, то

S ≈ β 3 α + 0,2 {\ displaystyle S \ приблизительно {\ frac {\ beta} {3 \ alpha +0.2}}}

S \ приблизительно {\ frac {\ beta} {3 \ alpha +0.2}}

где β>0 - параметр скорости. Здесь S всегда>0.

Обобщенное нормальное распределение версия 2

S = - exp ⁡ (- k 2 2) - 1 exp ⁡ (k 2 2) - 1 {\ displaystyle S = - { \ frac {\ exp ({\ frac {-k ^ {2}} {2}}) - 1} {\ sqrt {\ exp ({\ frac {k ^ {2}} {2}}) - 1} }}}

S = - {\ frac {\ exp ({\ frac {-k ^ {2}} {2}}) - 1} {{\ sqrt {\ exp ({ \ frac {k ^ {2}} {2}}) - 1}}}}

S всегда < 0.

Обобщенное распределение Парето : S определяется только тогда, когда параметр формы (k) равен < 1/2. S is < 0 for this distribution.

S = (2 k - 1 k - 2 k) (1-2 k) 0,5 {\ displaystyle S = \ left ({\ frac {2 ^ {k} -1} {k}} - 2 ^ {k} \ right) (1-2k) ^ {0,5}}

S = \ left ({\ frac {2 ^ {k} -1} {k}} - 2 ^ {k} \ right) (1-2k) ^ { {0.5}}

Гамбель распределение :

6 [γ + журнал е ⁡ (журнал е ⁡ (2))] π ≈ 0,1643 {\ displaystyle {\ frac {{\ sqrt {6}} [\ gamma + \ log _ {e} (\ log _ {e} (2))]} {\ pi}} \ приблизительно 0,1643}

{\ frac {{\ sqrt {6}} [\ gamma + \ log _ {e} (\ log _ {e} (2))]} {\ pi}} \ приблизительно 0,1643

где γ - постоянная Эйлера.

Полунормальное распределение :

S ≈ 2 - 0,6745 π π - 2 ≈ 0,36279 {\ displaystyle S \ приблизительно {\ frac {{\ sqrt {2}} - 0,6745 {\ sqrt {\ pi}}} {\ sqrt {\ pi -2}}} \ приблизительно 0,36279}

S \ приблизительно {\ frac {{\ sqrt {2}} - 0,6745 {\ sqrt {\ pi}}} {{\ sqrt {\ pi -2}}}} \ приблизительно 0,36279

Распределение Кумарасвами
Логико-логистическое распределение (распределение Фиска): пусть β будет параметром формы. Дисперсия и среднее значение этого распределения определяются только при β>2. Чтобы упростить запись, пусть b = β / π.

S = b - sin ⁡ (b) b tan ⁡ (b) - b 2 {\ displaystyle S = {\ frac {b- \ sin (b)} { \ sqrt {b \ tan (b) -b ^ {2}}}}}

S = {\ frac {b- \ sin (b)} {{\ sqrt {b \ tan (b) -b ^ {2}}}}}

Стандартное отклонение не существует для значений b>4,932 (приблизительно). Для значений, для которых определено стандартное отклонение, S составляет>0.

Логнормальное распределение : со средним значением (μ) и дисперсией (σ)

S = 1 (e σ 2 2 + 1) (е μ + σ 2) {\ Displaystyle S = {\ гидроразрыва {1} {(e ^ {\ frac {\ sigma ^ {2}} {2}} + 1) (e ^ {\ mu + \ sigma ^ {2}})}}}

S = {\ frac {1} {(e ^ {{{\ frac {\ sigma ^ {2}} {2}}}} + 1) (e ^ {{ \ mu + \ sigma ^ {2}}})}}

Распределение Лог-Вейбулла :

S ≈ [log e ⁡ (log e ⁡ (2)) - 0,5772] 6 π ≈ - 0,1643 {\ displaystyle S \ приблизительно {\ frac { [\ log _ {e} (\ log _ {e} (2)) - 0,5772] {\ sqrt {6}}} {\ pi}} \ приблизительно -0,1643}

S \ приблизительно {\ frac {[\ log _ {e} (\ log _ {e} (2)) - 0,5772] {\ sqrt {6}} } {\ pi}} \ приблизительно -0,1643

Распределение Lomax : S является определяется только для α>2

S = (α - 1) (α - 2) (1 - (α - 1) (2 1 / α - 1)) α 1/2 {\ displaystyle S = {\ frac {(\ alpha -1) (\ alpha -2) (1 - (\ alpha -1) (2 ^ {1 / \ alpha} -1))} {\ alpha ^ {1/2}}}}

S = {\ frac {(\ alpha -1) (\ alpha -2) (1- (\ alpha -1) (2 ^ {{1 / \ alpha}} - 1))} {\ alpha ^ {{1/2}}}}

Распределение Максвелла – Больцмана :

S ≈ 2 - 1,5382 Γ (3 2) 2 (Γ (5 2) - Γ (3 2)) ≈ 0,0854 {\ displaystyle S \ приблизительно {\ frac {{\ sqrt {2} } -1.5382 \ Gamma ({\ frac {3} {2}})} {\ sqrt {2 (\ Gamma ({\ frac {5} {2}}) - \ Gamma ({\ frac {3} {2 }}))}}} \ приблизительно 0,0854}

S \ приблизительно {\ frac {{\ sqrt {2} } -1.5382 \ Gamma ({\ frac {3} {2}})} {{\ sqrt {2 (\ Gamma ({\ frac {5} {2}}) - \ Gamma ({\ frac {3}} 2}}))}}}} \ приблизительно 0,0854

Распределение Накагами

S = - 1 {\ displaystyle S = -1}

S = -1

Парето распределение : для α>2, где α - параметр формы распределения,

S = (α - 2 1 / α [α - 1]) (α - 2 α) 1/2, {\ displaystyle S = (\ alpha -2 ^ {1 / \ alpha} [\ alpha -1]) ({\ frac {\ alpha -2} {\ alpha}}) ^ {1/2},}

S = (\ alpha -2 ^ { {1 / \ alpha}} [\ alpha -1]) ({\ frac {\ alpha -2} {\ alpha}}) ^ {{1/2}},

и S всегда>0.

Распределение Пуассона :

- log e ⁡ (2) λ 1 2 ≤ S ≤ 1 3 λ 1 2 {\ displaystyle {\ frac {- \ log _ {e} (2)} { \ lambda ^ {\ frac {1} {2}}}} \ leq S \ leq {\ frac {1} {3 \ lambda ^ {\ frac {1} {2}}}}}

{\ frac {- \ log _ {e} (2)} {\ lambda ^ {{\ frac {1} {2}}}}} \ leq S \ leq {\ frac {1} {3 \ lambda ^ {{\ frac {1} {2}}}}}

где λ параметр распределения.

Распределение Рэлея :

S = 2 4 - π [(π 2) 0,5 - log e ⁡ (4)] ≈ 0,1251 {\ displaystyle S = {\ sqrt {\ frac {2} {4- \ pi}}} [({\ frac {\ pi} {2}}) ^ {0.5} - \ log _ {e} (4)] \ приблизительно 0,1251}

S = {\ sqrt {{\ frac {2} {4- \ pi}}}} [({\ frac {\ pi} {2}}) ^ {{0.5}} - \ log _ {e} (4)] \ приблизительно 0,1251

Распределение Вейбулла :

S Знак равно Γ (1 + 1 / k) - журнал е ⁡ (2) 1 / k (Γ (1 + 2 / k) - Γ (1 + 1 / k)) 1/2, {\ displaystyle S = {\ frac {\ Gamma (1 + 1 / k) - \ log _ {e} (2) ^ {1 / k}} {(\ Gamma (1 + 2 / k) - \ Gamma (1 + 1 / k)) ^ {1/2}}},}

S = {\ frac {\ Гамма (1 + 1 / k) - \ log _ {e} (2) ^ {{1 / k}}} {(\ Gamma (1 + 2 / k) - \ Gamma (1 + 1 / k)) ^ {{1/2}}}},

где k - параметр формы распределения. Здесь S всегда>0.

История

В 1895 г. Пирсон впервые предложил измерять асимметрию путем стандартизации разницы между средним значением и модой, давая

μ - θ σ, {\ displaystyle {\ frac {\ mu - \ theta} {\ sigma}},}

{\ frac {\ mu - \ theta } {\ sigma}},

где μ, θ и σ - среднее значение, мода и стандартное отклонение распределения соответственно. Оценки режима генеральной совокупности на основе данных выборки могут быть трудными, но разница между средним значением и модой для многих распределений примерно в три раза превышает разницу между средним и медианным значением, которое предложило Пирсону второй коэффициент асимметрии:

3 ( μ - ν) σ, {\ displaystyle {\ frac {3 (\ mu - \ nu)} {\ sigma}},}

{\ frac {3 (\ mu - \ nu)} { \ sigma}},

, где ν - медиана распределения. Боули исключил множитель 3 из этой формулы в 1901 году, что привело к непараметрической статистике перекоса.

Взаимосвязь между медианой, средним значением и модой была впервые отмечена Пирсоном, когда он исследовал свои распределения типа III.

Взаимосвязь между средним, медианным и модой

Для произвольного распределения мода, медиана и среднее значение могут появляться в любом порядке.

Был проведен анализ некоторых из отношения между средним значением, медианой, модой и стандартным отклонением. и эти отношения накладывают некоторые ограничения на знак и величину непараметрического перекоса.

Простым примером, иллюстрирующим эти отношения, является биномиальное распределение с n = 10 и p = 0,09. На графике это распределение имеет длинный правый хвост. Среднее значение (0,9) находится слева от медианы (1), но перекос (0,906), определенный третьим стандартизированным моментом, положительный. Напротив, непараметрический перекос составляет -0,110.

Правило Пирсона

Правило, согласно которому для некоторых распределений разница между средним и модой в три раза больше, чем между средним и медианой, принадлежит Пирсону, который обнаружил его при исследовании своего Типа 3. раздачи. Его часто применяют к слегка асимметричным распределениям, которые напоминают нормальное распределение, но это не всегда верно.

В 1895 году Пирсон отметил, что для того, что сейчас известно как гамма-распределение, соотношение

ν - θ = 2 (μ - ν) {\ displaystyle \ nu - \ theta = 2 (\ mu - \ nu)}

\ nu - \ theta = 2 (\ му - \ nu)

где θ, ν и µ - мода, медиана и среднее значение распределения, соответственно, было приблизительно верно для распределений с большим параметром формы.

Дудсон в 1917 году доказал, что медиана лежит между модой и средним значением для умеренно искаженных распределений с конечными четвертыми моментами. Это соотношение сохраняется для всех распределений Пирсона, и все эти распределения имеют положительный непараметрический перекос.

Дудсон также отметил, что для этого семейства распределений с хорошим приближением

θ = 3 ν - 2 μ, {\ displaystyle \ theta = 3 \ nu -2 \ mu,}

\ theta = 3 \ nu -2 \ mu,

где θ, ν и µ - мода, медиана и среднее значение распределения соответственно. Приближение Дудсона было дополнительно исследовано и подтверждено Haldane. Холдейн отметил, что выборки с идентичными и независимыми переменными с третьим кумулянтом имели выборочные средства, которые подчинялись соотношению Пирсона для больших размеров выборки. Холдейн требовал выполнения ряда условий для этого отношения, включая существование расширения Эджворта и уникальность как медианы, так и моды. В этих условиях он обнаружил, что мода и медиана сходятся к 1/2 и 1/6 третьего момента соответственно. Этот результат был подтвержден Холлом в более слабых условиях с использованием характеристических функций..

Отношение Дудсона было изучено Кендаллом и Стюартом в логнормальном распределении, для которого они нашли близкое к нему точное соотношение. 252>

Холл также показал, что для распределения с правильно меняющимися хвостами и показателем α

μ - θ = α (μ - ν) {\ displaystyle \ mu - \ theta = \ alpha (\ mu - \ nu)}

\ mu - \ theta = \ alpha (\ mu - \ nu)

Унимодальные распределения

В 1823 году Гаусс показал, что для унимодального распределения

σ ≤ ω ≤ 2 σ {\ displaystyle \ sigma \ leq \ omega \ leq 2 \ sigma}

\ sigma \ leq \ omega \ leq 2 \ sigma

| ν - μ | ≤ 3 4 ω, {\ displaystyle | \ nu - \ mu | \ leq {\ sqrt {\ frac {3} {4}}} \ omega,}

| \ nu - \ mu | \ leq {\ sqrt { {\ frac {3} {4}}}} \ omega,

, где ω - среднеквадратичное отклонение от режима.

Для большого класса унимодальных распределений, которые имеют положительный перекос, мода, медиана и среднее падают в указанном порядке. И наоборот, для большого класса унимодальных распределений, которые имеют отрицательный перекос, среднее значение меньше медианы, которое, в свою очередь, меньше, чем мода. В символах этих положительно скошенных одномодальных распределений

θ ≤ ν ≤ μ {\ displaystyle \ theta \ leq \ nu \ leq \ mu}

\ theta \ leq \ nu \ leq \ mu

и для этих отрицательно скошенных одномодальных распределений

μ ≤ ν ≤ θ {\ displaystyle \ mu \ leq \ nu \ leq \ theta}

\ mu \ leq \ nu \ leq \ theta

Этот класс включает важные распределения F, бета и гамма.

Это правило не выполняется для унимодального распределения Вейбулла.

Для унимодального распределения известны следующие точные границы:

| θ - μ | σ ≤ 3, {\ displaystyle {\ frac {| \ theta - \ mu |} {\ sigma}} \ leq {\ sqrt {3}},}

{\ frac {| \ theta - \ mu |} {\ sigma}} \ leq {\ sqrt {3}},

| ν - μ | σ ≤ 0,6, {\ displaystyle {\ frac {| \ nu - \ mu |} {\ sigma}} \ leq {\ sqrt {0,6}},}

{\ frac {| \ nu - \ mu |} {\ sigma}} \ leq {\ sqrt {0.6}},

| θ - ν | σ ≤ 3, {\ displaystyle {\ frac {| \ theta - \ nu |} {\ sigma}} \ leq {\ sqrt {3}},}

{\ frac {| \ theta - \ nu |} {\ sigma}} \ leq {\ sqrt {3}},

где μ, ν и θ - среднее значение, медиана и режим соответственно.

Средняя граница ограничивает непараметрический перекос унимодального распределения примерно до ± 0,775.

условие Ван Звета

Следующее неравенство,

θ ≤ ν ≤ μ, {\ displaystyle \ theta \ leq \ nu \ leq \ mu,}

\ theta \ leq \ nu \ leq \ mu,

где θ, ν а µ - мода, медиана и среднее значение распределения соответственно, выполняется, если

F (ν - x) + F (ν + x) ≥ 1 для всех x, {\ displaystyle F (\ nu -x) + F (\ nu + x) \ geq 1 {\ text {для всех}} x,}

F (\ nu -x) + F (\ nu + x) \ geq 1 {\ text {для всех}} x,

где F - кумулятивная функция распределения распределения. С тех пор эти условия были обобщены и распространены на дискретные распределения. Любое распределение, для которого это верно, имеет либо нулевой, либо положительный непараметрический перекос.

Примечания

Упорядочивание асимметрии

В 1964 году ван Цвет предложил ряд аксиом для упорядочивания мер асимметрии. Непараметрический перекос не удовлетворяет этим аксиомам.

Закон Бенфорда

Закон Бенфорда - это эмпирический закон, касающийся распределения цифр в списке чисел. Было высказано предположение, что случайные вариации из распределений с положительным непараметрическим перекосом будут подчиняться этому закону.

Отношение к коэффициенту Боули

Эту статистику можно получить из коэффициента асимметрии Боули

SK 2 = Q 3 + Q 1 - 2 Q 2 Q 3 - Q 1 {\ displaystyle SK_ {2} = {\ frac {Q_ {3} + Q_ {1} -2Q_ {2}} {Q_ {3} -Q_ { 1}}}}

SK_ {2} = {\ frac {Q_ {3} + Q_ {1} -2Q_ {2}} {Q_ {3} -Q_ {1} }}

где Q i - i-й квартиль распределения.

Хинкли обобщил это

SK = F - 1 (1 - α) + F - 1 (α) - 2 Q 2 Q 3 - Q 1 {\ displaystyle SK = {\ frac {F ^ { -1} (1- \ альфа) + F ^ {- 1} (\ alpha) -2Q_ {2}} {Q_ {3} -Q_ {1}}}}

SK = {\ frac {F ^ {{- 1}} (1- \ alpha) + F ^ {{- 1}} (\ alpha) -2Q_ {2}} {Q_ {3} -Q_ {1}}}

где $α {\ displaystyle \ alpha}$ $\ alpha$ находится в диапазоне от 0 до 0,5. Коэффициент Боули - это особый случай, когда $α {\ displaystyle \ alpha}$ $\ alpha$ равняется 0,25.

Греневельд и Миден устранили зависимость от, интегрировав по ней.

S K 3 = μ - Q 2 E | y - Q 2 | {\ displaystyle SK_ {3} = {\ frac {\ mu -Q_ {2}} {E | y-Q_ {2} |}}}

SK_ {3} = {\ frac {\ mu -Q_ {2}} {E | y-Q_ {2} |}}

Знаменатель является мерой дисперсии. Заменяя знаменатель на стандартное отклонение, мы получаем непараметрический перекос.

Ссылки