эксцесс

редактировать
четвертый стандартизованный момент в статистике

В теории вероятностей и статистике, эксцесс (от греческого : κυρτός, kyrtos или kurtos, что означает «изогнутый, изогнутый») - это мера «хвостичности» распределения вероятностей вещественная -значная случайная величина. Как и асимметрия, эксцесс описывает форму распределения вероятностей, и существуют различные способы его количественной оценки для теоретического распределения и соответствующие способы его оценки по выборке из генеральной совокупности. Различные меры эксцесса могут иметь разные интерпретации.

Стандартная мера эксцесса распределения, происходящая от Карла Пирсона, является масштабированной версией четвертого момента распределения.. Это число относится к хвостам распределения, а не к его пику; следовательно, иногда наблюдаемая характеристика эксцесса как «остроконечность» неверна. Для этого показателя более высокий эксцесс соответствует большей величине отклонений (или выбросов ), а не конфигурации данных около среднего.

Эксцесс любого одномерного нормального распределения равен 3. Обычно эксцесс распределения сравнивают с этим значением. Распределения с эксцессом менее 3 называются плоскостными, хотя это не означает, что распределение является «плоским», как иногда утверждают. Скорее, это означает, что распределение производит меньше и меньше выбросов, чем нормальное распределение. Примером платикуртического распределения является равномерное распределение, которое не производит выбросов. Распределения с эксцессом более 3 называются лептокуртическими. Примером лептокуртического распределения является распределение Лапласа, которое имеет хвосты, которые асимптотически приближаются к нулю медленнее, чем гауссовское, и поэтому дает больше выбросов, чем нормальное распределение. Также обычной практикой является использование скорректированной версии эксцесса Пирсона, избыточного эксцесса, который представляет собой эксцесс минус 3, для обеспечения сравнения со стандартным нормальным распределением. Некоторые авторы используют термин «эксцесс» сам по себе для обозначения избыточного эксцесса. Однако для ясности и общности эта статья следует соглашению о недопустимости эксцесса и явно указывает, где имеется в виду избыточный эксцесс.

Альтернативные меры эксцесса: L-эксцесс, который является масштабированной версией четвертого L-момента ; меры на основе четырех квантилей генеральной совокупности или выборки. Они аналогичны альтернативным мерам асимметрии, которые не основаны на обычных моментах.

Содержание

  • 1 Моменты Пирсона
    • 1.1 Интерпретация
    • 1.2 Интерпретация Мурса
  • 2 Превышение эксцесс
    • 2.1 Мезокуртик
    • 2.2 Лептокуртик
    • 2.3 Платикуртик
  • 3 Графические примеры
    • 3.1 Семейство Пирсона типа VII
    • 3.2 Другие известные распределения
  • 4 Пример эксцесса
    • 4.1 Определение
    • 4.2 Верхняя граница
    • 4.3 Дисперсия при нормальности
  • 5 Оценки эксцесса популяции
  • 6 Приложения
    • 6.1 Конвергенция эксцесса
  • 7 Другие меры
  • 8 См. Также
  • 9 Ссылки
  • 10 Дополнительная литература
  • 11 Внешние ссылки

Моменты Пирсона

Эксцесс - это четвертый стандартизованный момент, определяемый как

Курт ⁡ [X] = E ⁡ [(Икс - μ σ) 4] знак равно E ⁡ [(X - μ) 4] (E ⁡ [(X - μ) 2]) 2 = μ 4 σ 4, {\ Displaystyle \ OperatorName {Курт} [X] = \ operatorname {E} \ left [\ left ({\ frac {X- \ mu} {\ sigma}} \ right) ^ {4} \ right] = {\ frac {\ operatorname {E} \ left [(X- \ mu) ^ {4} \ right]} {\ left (\ operatorname {E} \ left [(X- \ mu) ^ {2} \ right] \ right) ^ {2}}} = {\ frac {\ mu _ {4}} {\ sigma ^ {4}}},}{\ displaystyle \ operatorname {Kurt} [X] = \ operatorname {E} \ left [\ left ({\ frac {X- \ mu} {\ sigma}} \ right) ^ {4} \ right] = {\ frac {\ operatorname {E} \ left [(X- \ mu) ^ {4} \ right]} {\ left (\ operatorname {E} \ left [(X- \ mu) ^ {2} \ right] \ right) ^ {2}}} = {\ frac {\ mu _ {4}} {\ sigma ^ {4}}},}

где μ 4 - четвертый центральный момент, а σ - стандартное отклонение. В литературе для обозначения эксцесса используются несколько букв. Очень распространенный выбор - κ, что нормально, если ясно, что он не относится к кумулянту . Другие варианты включают γ 2, чтобы быть похожим на обозначение для асимметрии, хотя иногда это вместо этого зарезервировано для избыточного эксцесса.

эксцесс ограничен снизу квадратом асимметрии плюс 1:

μ 4 σ 4 ≥ (μ 3 σ 3) 2 + 1, {\ displaystyle {\ frac {\ му _ {4}} {\ sigma ^ {4}}} \ geq \ left ({\ frac {\ mu _ {3}} {\ sigma ^ {3}}} \ right) ^ {2} +1, }\ frac {\ mu_4} {\ sigma ^ 4} \ geq \ left (\ frac {\ mu_3} {\ sigma ^ 3} \ right) ^ 2 + 1,

где μ 3 - третий центральный момент. Нижняя граница реализуется с помощью распределения Бернулли. Верхнего предела эксцесса общего распределения вероятностей нет, и он может быть бесконечным.

Причина, по которой некоторые авторы отдают предпочтение избыточному эксцессу, заключается в том, что кумулянты обширны. Формулы, относящиеся к экстенсивному свойству, более естественно выражаются в терминах избыточного эксцесса. Например, пусть X 1,..., X n будут независимыми случайными величинами, для которых существует четвертый момент, и пусть Y будет случайной величиной, определяемой суммой X я. Избыточный эксцесс Y равен

Курт ⁡ [Y] - 3 = 1 (∑ j = 1 n σ j 2) 2 ∑ i = 1 n σ i 4 ⋅ (Kurt ⁡ [X i] - 3), { \ displaystyle \ operatorname {Kurt} [Y] -3 = {\ frac {1} {\ left (\ sum _ {j = 1} ^ {n} \ sigma _ {j} ^ {\, 2} \ right) ^ {2}}} \ sum _ {i = 1} ^ {n} \ sigma _ {i} ^ {\, 4} \ cdot \ left (\ operatorname {Kurt} \ left [X_ {i} \ right] -3 \ right),}{\ displaystyle \ ope ratorname {Курт} [Y] -3 = {\ frac {1} {\ left (\ sum _ {j = 1} ^ {n} \ sigma _ {j} ^ {\, 2} \ right) ^ {2 }}} \ sum _ {i = 1} ^ {n} \ sigma _ {i} ^ {\, 4} \ cdot \ left (\ operatorname {Kurt} \ left [X_ {i} \ right] -3 \ вправо),}

где σ i {\ displaystyle \ sigma _ {i}}\ sigma _ {i} - стандартное отклонение X i {\ displaystyle X_ {i}}X_ {i} . В частности, если все X i имеют одинаковую дисперсию, то это упрощается до

Kurt ⁡ [Y] - 3 = 1 n 2 ∑ i = 1 n (Kurt ⁡ [X i] - 3). {\ displaystyle \ operatorname {Kurt} [Y] -3 = {1 \ over n ^ {2}} \ sum _ {i = 1} ^ {n} \ left (\ operatorname {Kurt} \ left [X_ {i } \ right] -3 \ right).}{\displaystyle \operatorname {Kurt} [Y]-3={1 \over n^{2}}\sum _{i=1}^{n} \left(\operatorname {Kurt} \left[X_{i}\right]-3\right).}

Причина, по которой не следует вычитать 3, состоит в том, что самое лучшее обобщается на многомерные распределения, особенно когда независимость не предполагается. кокуртоз между парами переменных - это тензор четвертого порядка. Для двумерного нормального распределения тензор кокуртоза имеет недиагональные члены, которые в целом не равны ни 0, ни 3, поэтому попытка "исправить" избыток становится запутанной. Однако верно, что совместные кумулянты степени больше двух для любого многомерного нормального распределения равны нулю.

Для двух случайных величин X и Y, не обязательно независимых, эксцесс суммы X + Y равен

Курт ⁡ [X + Y] = 1 σ X + Y 4 (σ X 4 Курт ⁡ [X] + 4 σ X 3 σ Y Кокурт ⁡ [X, X, X, Y] + 6 σ X 2 σ Y 2 Кокурт ⁡ [X, X, Y, Y] + 4 σ X σ Y 3 Кокурт ⁡ [X, Y, Y, Y] + σ Y 4 Курт ⁡ [Y]). {\ displaystyle {\ begin {align} \ operatorname {Kurt} [X + Y] = {1 \ over \ sigma _ {X + Y} ^ {4}} {\ big (} \ sigma _ {X} ^ {4} \ operatorname {Kurt} [X] +4 \ sigma _ {X} ^ {3} \ sigma _ {Y} \ operatorname {Cokurt} [X, X, X, Y] \\ {} + 6 \ sigma _ {X} ^ {2} \ sigma _ {Y} ^ {2} \ operatorname {Cokurt} [X, X, Y, Y] \\ [6pt] {} + 4 \ sigma _ {X} \ sigma _ {Y} ^ {3} \ operatorname {Cokurt} [X, Y, Y, Y] + \ sigma _ {Y} ^ {4} \ operatorname {Kurt} [Y] {\ big)}. \ end {align}}}{\ displaystyle {\ begin { выровнено} \ operatorname {Kurt} [X + Y] = {1 \ over \ sigma _ {X + Y} ^ {4}} {\ big (} \ sigma _ {X} ^ {4} \ operatorname {Kurt } [X] +4 \ sigma _ {X} ^ {3} \ sigma _ {Y} \ operatorname {Cokurt} [X, X, X, Y] \\ {} + 6 \ sigma _ {X} ^ {2} \ sigma _ {Y} ^ {2} \ operatorname {Cokurt} [X, X, Y, Y] \\ [6pt] {} + 4 \ sigma _ {X} \ sigma _ {Y} ^ {3} \ operatorname {Cokurt} [X, Y, Y, Y] + \ sigma _ {Y} ^ {4} \ operatorname {Kurt} [Y] {\ big)}. \ End {align}}}

Обратите внимание, что биномиальные коэффициенты появляются в приведенном выше уравнении.

Интерпретация

Точная интерпретация меры эксцесса (или избыточного эксцесса) Пирсона раньше оспаривалась, но теперь решена. Как отмечает Вестфолл в 2014 году, «... его единственная недвусмысленная интерпретация - это конечность хвоста; то есть либо существующие выбросы (для выборочного эксцесса), либо склонность производить выбросы (для эксцесса распределения вероятностей)». Логика проста: эксцесс - это среднее (или ожидаемое значение ), возведенное в четвертую степень. Любые стандартизованные значения меньше 1 (т. Е. Данные в пределах одного стандартного отклонения от среднего, где будет «пик») практически не влияют на эксцесс, поскольку увеличение числа, меньшего 1, до четвертой степени делает его ближе к нулю. Единственные значения данных (наблюдаемые или наблюдаемые), которые вносят какой-либо значимый вклад в эксцесс, - это значения за пределами области пика; т.е. выбросы. Следовательно, эксцесс измеряет только выбросы; он ничего не измеряет о «пике».

Было дано много неверных интерпретаций эксцесса, включающих понятие пика. Во-первых, эксцесс измеряет как «пиковость» распределения, так и тяжесть его хвоста. Были предложены различные другие неправильные интерпретации, такие как «отсутствие плеч» (где «плечо» неопределенно определяется как область между пиком и хвостом, или, более конкретно, как площадь около одного стандартного отклонения от среднего) или «бимодальность». Баланда и МакГилливрей утверждают, что стандартное определение эксцесса «является плохой мерой эксцесса, пиковости или хвостового веса распределения», и вместо этого предлагают «неопределенно определять эксцесс как локализацию и отсутствие масштаба. движение вероятностной массы от центра к ее центру и хвостам ».

Интерпретация мавров

В 1986 году мавры дали интерпретацию эксцесса. Пусть

Z = X - μ σ, {\ displaystyle Z = {\ frac {X- \ mu} {\ sigma}},}{\ displaystyle Z = {\ frac {X- \ mu} {\ sigma}},}

где X - случайная величина, μ - среднее, а σ - стандартное отклонение.

Теперь по определению эксцесса κ {\ displaystyle \ kappa}\ kappa , и по хорошо известному тождеству E [V 2] = var ⁡ [V] + [E [V]] 2, {\ displaystyle E \ left [V ^ {2} \ right] = \ operatorname {var} [V] + [E [V]] ^ {2},}{\ displaystyle E \ left [V ^ {2} \ right] = \ operatorname {var} [V] + [E [V]] ^ {2},}

κ Знак равно E [Z 4] = вар ⁡ [Z 2] + [E [Z 2]] 2 = вар ⁡ [Z 2] + [вар ⁡ [Z]] 2 = вар ⁡ [Z 2] + 1 {\ displaystyle \ kappa = E \ left [Z ^ {4} \ right] = \ operatorname {var} \ left [Z ^ {2} \ right] + \ left [E \ left [Z ^ {2} \ right] \ right] ] ^ {2} = \ operatorname {var} \ left [Z ^ {2} \ right] + [\ operatorname {var} [Z]] ^ {2} = \ operatorname {var} \ left [Z ^ {2 } \ right] +1}{\ displaystyle \ kappa = E \ left [Z ^ {4} \ right] = \ operatorname {var} \ left [Z ^ {2} \ right] + \ left [E \ left [Z ^ {2} \ right] \ right] ^ {2} = \ operatorname {var} \ left [Z ^ {2} \ right] + [\ operatorname {var} [Z]] ^ {2} = \ operatorname {var} \ left [Z ^ {2} \ right] +1} .

Эксцесс теперь можно рассматривать как меру разброса Z вокруг его ожидания. В качестве альтернативы можно увидеть меру дисперсии Z около +1 и -1. κ достигает минимального значения в симметричном двухточечном распределении. С точки зрения исходной переменной X, эксцесс - это мера разброса X вокруг двух значений μ ± σ.

Высокие значения κ возникают в двух случаях:

  • когда масса вероятности сосредоточена вокруг среднего, а процесс генерации данных дает случайные значения, далекие от среднего,
  • где вероятность масса сосредоточена в хвостах распределения.

Избыточный эксцесс

Избыточный эксцесс определяется как эксцесс минус 3. Существует 3 различных режима, как описано ниже.

Мезокуртоз

Распределения с нулевым избыточным эксцессом называются мезокуртозом или мезокуртозом. Наиболее ярким примером мезокуртического распределения является семейство нормального распределения, независимо от значений его параметров. Некоторые другие хорошо известные распределения могут быть мезокуртическими, в зависимости от значений параметров: например, биномиальное распределение является мезокуртическим для p = 1/2 ± 1/12 {\ displaystyle p = 1 / 2 \ pm {\ sqrt {1/12}}}p = 1/2 \pm \sqrt{1/12}.

Лептокуртоз

Распределение с положительным избыточным эксцессом называется лептокуртическим, или лептокуртотическим. «Лепто-» означает «стройный». Что касается формы, лептокуртическое распределение имеет более толстые хвосты. Примеры лептокуртических распределений включают t-распределение Стьюдента, распределение Рэлея, распределение Лапласа, экспоненциальное распределение, распределение Пуассона и логистическое распределение. Такие распределения иногда называют супергауссами.

Платикуртика

подбрасывание монеты является наиболее платикуртическим распределением

Распределение с отрицательным избыточным эксцессом называется платикуртоз, или платикуртоз. «Platy-» означает «широкий». По форме у платикуртика хвосты более тонкие. Примеры платикуртических распределений включают непрерывное и дискретные равномерные распределения и распределение с приподнятым косинусом. Наиболее распространенным из всех распределений является распределение Бернулли с p = 1/2 (например, сколько раз выпадал орел при подбрасывании монеты один раз, подбрасывание монеты ), для которого избыточный эксцесс равен −2. Такие распределения иногда называют субгауссовым распределением, первоначально предложенным Жан-Пьером Каханом и далее описанным Булдыгиным и Козаченко.

Графические примеры

Пирсон семейство типа VII

pdf для распределения типа VII Пирсона с избыточным эксцессом бесконечности (красный); 2 (синий); и 0 (черный) log-pdf для распределения типа VII Пирсона с избыточным эксцессом бесконечности (красный); 2 (синий); 1, 1/2, 1/4, 1/8 и 1/16 (серый); и 0 (черный)

Эффекты эксцесса проиллюстрированы с помощью параметрического семейства распределений, эксцесс которых можно регулировать, в то время как их моменты нижнего порядка и кумулянты остаются постоянными. Рассмотрим семейство типа VII Пирсона, которое является частным случаем семейства типа IV Пирсона, ограниченное симметричной плотностью. Функция плотности вероятности определяется выражением

f (x; a, m) = Γ (m) a π Γ (m - 1/2) [1 + (xa) 2] - m, {\ displaystyle f (x; a, m) = {\ frac {\ Gamma (m)} {a \, {\ sqrt {\ pi}} \, \ Gamma (m-1/2)}} \ left [ 1+ \ left ({\ frac {x} {a}} \ right) ^ {2} \ right] ^ {- m}, \!}f (x; a, m) = \ frac {\ Gamma (m)} {a \, \ sqrt {\ pi} \, \ Gamma (m-1/2)} \ left [1+ \ left (\ frac {x} { a} \ right) ^ 2 \ right] ^ {- m}, \!

, где a - параметр масштаба и m - параметр формы ..

Все плотности в этом семействе симметричны. K-й момент существует, если m>(k + 1) / 2. Для существования эксцесса нам требуется m>5/2. Тогда существуют среднее значение и асимметрия, и оба они равны нулю. Установка a = 2m - 3 делает дисперсию равной единице. Тогда единственным свободным параметром является m, который управляет четвертым моментом (и кумулянтом) и, следовательно, эксцессом. Можно изменить параметры с помощью m = 5/2 + 3 / γ 2 {\ displaystyle m = 5/2 + 3 / \ gamma _ {2}}m = 5/2 + 3 / \ gamma_2 , где γ 2 {\ displaystyle \ gamma _ {2}}\ gamma _ {2} - это избыточный эксцесс, как определено выше. Это дает однопараметрическое лептокуртическое семейство с нулевым средним, единичной дисперсией, нулевой асимметрией и произвольным неотрицательным избыточным эксцессом. Повторно параметризованная плотность равна

g (x; γ 2) = f (x; a = 2 + 6 γ 2, m = 5 2 + 3 γ 2). {\ displaystyle g (x; \ gamma _ {2}) = f \ left (x; \; a = {\ sqrt {2 + {\ frac {6} {\ gamma _ {2}}}}}, \ ; m = {\ frac {5} {2}} + {\ frac {3} {\ gamma _ {2}}} \ right). \!}{\ displaystyle g (x; \ gamma _ {2}) = f \ left (x; \; a = { \ sqrt {2 + {\ frac {6} {\ gamma _ {2}}}}}, \; m = {\ frac {5} {2}} + {\ frac {3} {\ gamma _ {2 }}} \ right). \!}

В пределе γ 2 → ∞ {\ displaystyle \ gamma _ {2} \ to \ infty}\ gamma_2 \ to \ infty получается плотность

g (x) = 3 (2 + x 2) - 5 2, {\ displaystyle g (x) = 3 \ left (2 + x ^ {2} \ right) ^ {- {\ frac {5} {2}}}, \!}{\ displaystyle g (x) = 3 \ left (2 + x ^ {2} \ right) ^ {- {\ frac {5} {2}}}, \!}

, что показано красной кривой на изображениях справа.

В другом направлении, как γ 2 → 0 {\ displaystyle \ gamma _ {2} \ to 0}\ gamma_2 \ to 0 , получается стандартная нормальная плотность как предельное распределение, показанное черной кривой.

На изображениях справа синяя кривая представляет плотность x ↦ g (x; 2) {\ displaystyle x \ mapsto g (x; 2)}x \mapsto g(x; 2)с избыточный эксцесс, равный 2. Верхнее изображение показывает, что лептокуртические плотности в этом семействе имеют более высокий пик, чем мезокуртическая нормальная плотность, хотя этот вывод действителен только для этого избранного семейства распределений. Сравнительно более толстые хвосты лептокуртических плотностей проиллюстрированы на втором изображении, на котором изображен натуральный логарифм плотностей Пирсона типа VII: черная кривая - это логарифм стандартной нормальной плотности, которая является параболой . Можно видеть, что нормальная плотность наделяет небольшую вероятностную массу областям, далеким от среднего («имеет тонкие хвосты»), по сравнению с синей кривой лептокуртической плотности Пирсона типа VII с избыточным эксцессом, равным 2. Между синей кривой и черные - другие плотности типа VII Пирсона с γ 2 = 1, 1/2, 1/4, 1/8 и 1/16. Красная кривая снова показывает верхний предел семейства Пирсона типа VII, с γ 2 = ∞ {\ displaystyle \ gamma _ {2} = \ infty}\ gamma_2 = \ infty (что, строго говоря, означает, что четвертого момента не существует). Красная кривая уменьшается медленнее всего по мере движения наружу от начала координат («имеет толстые хвосты»).

Другие известные распределения

Функции плотности вероятности для выбранных распределений с средним 0, дисперсией 1 и различным избыточным эксцессом Логарифмы функции плотности вероятности для выбранных распределений с средним 0, дисперсией 1 и различным избыточным эксцессом

Несколько хорошо известных унимодальных и симметричных распределений из разных параметрических семейств сравниваются здесь. Каждый имеет нулевое среднее значение и асимметрию. Параметры были выбраны так, чтобы в каждом случае дисперсия была равна 1. На изображениях справа показаны кривые для следующих семи плотностей в линейной шкале и логарифмической шкале :

Обратите внимание, что в В этих случаях пластические плотности имеют ограниченный носитель, тогда как плотности с положительными или нулевой избыточный эксцесс поддерживается на всей действительной прямой.

Нельзя сделать вывод, что распределения с высоким или низким эксцессом имеют характеристики, указанные в этих примерах. Существуют пластинчатые плотности с бесконечной опорой,

, и существуют лептокуртические плотности с конечной опорой.

  • например, распределение, которое является однородным между -3 и -0,3, между -0,3 и 0,3 и между 0,3 и 3, с одинаковой плотностью в интервалах (-3, -0,3) и (0,3, 3), но с 20-кратной плотностью в интервале (-0,3, 0,3)

Также существуют платикуртические плотности с бесконечной остротой,

и существуют лептокуртические плотности, которые кажутся плоскими,

  • например, смесь распределения, которая является однородной между -1 и 1 с T (4.0000001) t-распределение Стьюдента, с вероятностями смешения 0,999 и 0,001.

Выборочный эксцесс

Определение

Для выборки из n значений эксцесс выборки равно

g 2 = m 4 m 2 2 - 3 = 1 n ∑ i = 1 n (xi - x ¯) 4 [1 n ∑ i = 1 n (xi - x ¯) 2] 2 - 3 { \ displaystyle g_ {2} = {\ frac {m_ {4}} {m_ {2} ^ {2}}} - 3 = {\ frac {{\ tfrac {1} {n}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ overline {x}}) ^ {4}} {\ left [{\ tfra c {1} {n}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ overline {x}}) ^ {2} \ right] ^ {2}}} - 3}{\ displaystyle g_ {2} = {\ frac {m_ {4}} {m_ {2} ^ {2}}} - 3 = {\ frac {{\ tfrac {1} {n}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ overline {x}}) ^ {4}} {\ left [{\ tfrac {1} {n}} \ sum _ {i = 1} ^ {n} (x_ {i} - {\ overline {x}}) ^ {2} \ right] ^ {2}}} - 3}

где m 4 - момент четвертой выборки около среднего, m 2 - второй момент выборки около среднего (то есть выборочная дисперсия ), x i - это значение i, а x ¯ {\ displaystyle {\ overline {x}}}{\ overline {x}} - выборка среднее.

Эта формула имеет более простое представление:

g 2 = 1 n ∑ i = 1 nzi 4 - 3 {\ displaystyle g_ {2} = {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} z_ {i} ^ {4} -3}{\displaystyle g_{2}={\frac {1}{n}}\sum _{i=1}^{n}z_{i }^{4}-3}

где значения zi {\ displaystyle z_ {i}}{\displaystyle z_{i}}представляют собой стандартизованные значения данных с использованием стандартных отклонение определяется с помощью n, а не n - 1 в знаменателе.

Например, предположим, что значениями данных являются 0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999.

Тогда значения zi {\ displaystyle z_ {i}}{\displaystyle z_{i}}равны -0,239, -0,225, -0,221, -0,234, -0,230, -0,225, −0,239, −0,230, −0,234, −0,225, −0,230, −0,239, −0,230, −0,230, −0,225, −0,230, −0,216, −0,230, −0,225, 4,359

и zi 4 {\ displaystyle z_ {i} ^ {4}}{\ displaystyle z_ {я} ^ {4}} значения: 0.003, 0.003, 0.002, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0.003, 0,003, 0,003, 0,002, 0,003, 0,003, 360,976.

Среднее значение этих значений составляет 18,05, и, таким образом, избыточный эксцесс составляет 18,05 - 3 = 15,05. Этот пример проясняет, что данные около «середины» или «пика» распределения не влияют на статистику эксцесса, следовательно, эксцесс не измеряет «пиковость». Это просто показатель выброса, 999 в этом примере.

Верхняя граница

Верхняя граница для выборочного эксцесса n (n>2) действительных чисел составляет

g 2 ≤ 1 2 n - 3 n - 2 g 1 2 + n 2–3. {\ Displaystyle g_ {2} \ leq {\ frac {1} {2}} {\ frac {n-3} {n-2}} g_ {1} ^ {2} + {\ frac { n} {2}} - 3.}{\displaystyle g_{2}\leq {\frac {1}{2}} {\frac {n-3}{n-2}}g_{1}^{2}+{\frac {n}{2}}-3.}

где g 1 {\ displaystyle g_ {1}}g_ {1} - выборочная асимметрия м 3 / м 2 3/2 {\ displaystyle m_ {3} / m_ {2} ^ {3/2}}{\ displaystyle m_ {3} / m_ {2} ^ {3/2}} .

Дисперсия при нормальности

Дисперсия эксцесса выборки для выборки размера n от нормального распределения is

вар ⁡ (г 2) знак равно 24 N (N - 1) 2 (N - 3) (N - 2) (N + 3) (N + 5) {\ Displaystyle \ OperatorName {var} (g_ {2}) = {\ frac {24n (n-1) ^ {2}} {(n-3) (n-2) (n + 3) (n + 5)}}}{\ displaystyle \ operatorname {var} (g_ {2}) = {\ frac {24n (n-1) ^ {2} } {(п-3) (п-2) (п + 3) (п + 5)}}}

Другими словами, в предположении, что базовая случайная величина X {\ displaystyle X}X нормально распределена, можно показать, что ng 2 → d N (0, 24) {\ displaystyle {\ sqrt {n} } g_ {2} {\ xrightarrow {d}} {\ mathcal {N}} (0,24)}{\ displaystyle {\ sqrt {n}} g_ {2} {\ xrightarrow {d }} {\ mathcal {N}} (0,24)} .

Оценки эксцесса совокупности

Дан подмножество выборок из в популяции, приведенный выше выборочный эксцесс является смещенной оценкой избыточного эксцесса в популяции. Альтернативная оценка эксцесса эксцесса популяции определяется следующим образом:

G 2 = k 4 k 2 2 = n 2 [(n + 1) m 4 - 3 (n - 1) m 2 2] (n - 1) (n - 2) (n - 3) (n - 1) 2 n 2 m 2 2 = n - 1 (n - 2) (n - 3) [(n + 1) m 4 m 2 2 - 3 ( n - 1)] = n - 1 (n - 2) (n - 3) [(n + 1) g 2 + 6] = (n + 1) n (n - 1) (n - 2) (n - 3) ∑ i = 1 n (xi - x ¯) 4 [∑ i = 1 n (xi - x ¯) 2] 2 - 3 (n - 1) 2 (n - 2) (n - 3) = (n + 1) n (n - 1) (n - 2) (n - 3) ∑ i = 1 n (xi - x ¯) 4 k 2 2 - 3 (n - 1) 2 (n - 2) (n - 3) {\ displaystyle {\ begin {align} G_ {2} = {\ frac {k_ {4}} {k_ {2} ^ {2}}} \\ [6pt] = {\ frac {n ^ {2} \, [(n + 1) \, m_ {4} -3 \, (n-1) \, m_ {2} ^ {2}]} {(n-1) \, (n-2) \, (n-3)}} \; {\ frac {(n-1) ^ {2}} {n ^ {2} \, m_ {2} ^ {2}}} \\ [6pt] = {\ frac {n-1} {(n-2) \, (n-3)}} \ left [(n + 1) \, {\ frac {m_ {4}} {m_ {2} ^ { 2}}} - 3 \, (n-1) \ right] \\ [6pt] = {\ frac {n-1} {(n-2) \, (n-3)}} \ left [( n + 1) \, g_ {2} +6 \ right] \\ [6pt] = {\ frac {(n + 1) \, n \, (n-1)} {(n-2) \, (n-3)}} \; {\ frac {\ sum _ {i = 1} ^ {n} (x_ {i} - {\ bar {x}}) ^ {4}} { \ left [\ sum _ {i = 1} ^ {n} (x_ {i} - {\ bar {x}}) ^ {2} \ right] ^ {2}}} - 3 \, {\ frac { (n-1) ^ {2}} {(n-2) \, (n-3)}} \\ [6pt] = {\ frac {(n + 1) \, n} {(n-1)) \, (n-2) \, (n-3)}} \; {\ frac {\ sum _ {i = 1} ^ {n} (x_ {i} - {\ bar {x}}) ^ {4}} {k_ {2} ^ {2}}} - 3 \, {\ frac {(n-1) ^ {2}} {(n-2) (n-3)}} \ end {выровнено }}}{\ displaystyle {\ begin {align} G_ {2} = {\ frac {k_ {4}} {k_ {2} ^ {2}} } \\ [6pt] = {\ frac {n ^ {2} \, [(n + 1) \, m_ {4} -3 \, (n-1) \, m_ {2} ^ {2}] ]} {(n-1) \, (n-2) \, (n-3)}} \; {\ frac {(n-1) ^ {2}} {n ^ {2} \, m_ { 2} ^ {2}}} \\ [6pt] = {\ frac {n-1} {(n-2) \, (n-3)}} \ left [(n + 1) \, {\ frac {m_ {4}} {m_ {2} ^ {2}}} - 3 \, (n-1) \ right] \\ [6pt] = {\ frac {n-1} {(n-2) \, (n-3)}} \ left [(n + 1) \, g_ {2} +6 \ right] \\ [6pt] = {\ frac {(n + 1) \, n \, (n-1)} {(n-2) \, (n-3)}} \; {\ frac {\ sum _ {i = 1} ^ {n} (x_ {i} - {\ bar {x }}) ^ {4}} {\ left [\ sum _ {i = 1} ^ {n} (x_ {i} - {\ bar {x}}) ^ {2} \ right] ^ {2}} } -3 \, {\ frac {(n-1) ^ {2}} {(n-2) \, (n-3)}} \\ [6pt] = {\ frac {(n + 1) \, n} {(n-1) \, (n-2) \, (n-3)}} \; {\ frac {\ sum _ {i = 1} ^ {n} (x_ {i} - {\ bar {x}}) ^ {4}} {k_ {2} ^ {2}}} - 3 \, {\ frac {(n-1) ^ {2}} {(n-2) (n -3)}} \ end {align}}}

где k 4 - уникальная симметричная несмещенная оценка четвертого кумулянта, k 2 - несмещенная оценка второго кумулянта (идентично несмещенной оценке выборочной дисперсии), m 4 - это четвертый момент выборки относительно среднего, m 2 - второй выборочный момент относительно среднего, x i - это значение i, а x ¯ {\ displaystyle {\ bar {x}}}{\ bar {x}} - выборочное среднее. К сожалению, G 2 {\ displaystyle G_ {2}}G_ {2} сам по себе обычно предвзят. Для нормального распределения оно несмещено.

Приложения

Примерный эксцесс - полезная мера того, есть ли проблема с выбросами в наборе данных. Большой эксцесс указывает на более серьезную проблему с выбросами и может побудить исследователя выбрать альтернативные статистические методы.

К-квадрат Д'Агостино - это критерий пригодности нормальности, основанный на комбинации асимметрии выборки и эксцесса выборки, как и Тест Жарка – Бера на нормальность.

Для нестандартных выборок дисперсия выборочной дисперсии зависит от эксцесса; подробнее см. дисперсия.

Определение эксцесса, данное Пирсоном, используется в качестве индикатора перемежаемости в турбулентности.

Конкретным примером является следующая лемма Хэ, Чжана и Чжана: Предположим случайную величину X {\ displaystyle X}X имеет ожидание E [X] = μ {\ displaystyle E [X] = \ mu}{\ displaystyle E [X] = \ mu} , дисперсия E [ (X - μ) 2] = σ 2 {\ Displaystyle E \ left [(X- \ mu) ^ {2} \ right] = \ sigma ^ {2}}{\ displaystyle E \ left [(X- \ mu) ^ {2} \ right] = \ sigma ^ {2}} и эксцесс κ Знак равно 1 σ 4 E [(X - μ) 4] {\ displaystyle \ kappa = {\ tfrac {1} {\ sigma ^ {4}}} E \ left [(X- \ mu) ^ {4} \ right ]}{\ displaystyle \ kappa = {\ tfrac {1} {\ sigma ^ {4 }}} E \ left [(X- \ mu) ^ {4} \ right]} . Предположим, мы выбираем n = 2 3 + 3 3 κ log ⁡ 1 δ {\ displaystyle n = {\ tfrac {2 {\ sqrt {3}} + 3} {3}} \ kappa \ log {\ tfrac { 1} {\ delta}}}{\ displaystyle n = {\ tfrac {2 {\ sqrt {3}} + 3} {3}} \ kappa \ log {\ tfrac {1} {\ delta}}} много независимых копий. Тогда

Pr [max i = 1 n X i ≤ μ] ≤ δ и Pr [min i = 1 n X i ≥ μ] ≤ δ {\ displaystyle \ Pr \ left [\ max _ {i = 1} ^ {n} X_ {i} \ leq \ mu \ right] \ leq \ delta \ quad {\ text {and}} \ quad \ Pr \ left [\ min _ {i = 1} ^ {n} X_ {i} \ geq \ mu \ right] \ leq \ delta}{\ displaystyle \ Pr \ left [\ max _ {i = 1} ^ {n} X_ {i} \ leq \ mu \ right] \ leq \ delta \ quad {\ text {and}} \ quad \ Pr \ left [\ min _ {i = 1} ^ {n} X_ {i} \ geq \ mu \ right] \ leq \ delta } .

Это показывает, что с Θ (κ log ⁡ 1 δ) {\ displaystyle \ Theta (\ kappa \ log {\ tfrac {1} {\ delta} })}{\ displaystyle \ Theta (\ kappa \ log {\ tfrac {1} {\ delta }})} много выборок, мы увидим тот, который превосходит ожидания с вероятностью не менее 1 - δ {\ displaystyle 1- \ delta}1- \ delta . Другими словами: если эксцесс большой, мы можем увидеть много значений либо ниже, либо выше среднего.

Конвергенция эксцесса

При применении полосовых фильтров к цифровым изображениям значения эксцесса имеют тенденцию быть однородными, независимо от диапазона фильтра. Это поведение, называемое конвергенцией эксцесса, может быть использовано для обнаружения сращивания изображений в судебном анализе.

Другие меры

Другая мера «эксцесса» обеспечивается с помощью L-моментов вместо обычных моментов.

См. также

Викискладе есть материалы, связанные с эксцессом.

Ссылки

Дополнительная литература

Внешние ссылки

Викиверситет содержит обучающие ресурсы по Kurtosis
Последняя правка сделана 2021-05-26 03:46:03
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте