Распределение Парето

редактировать
Тип Парето I
Функция плотности вероятности Функции плотности вероятности Парето типа I для различных α Функции плотности вероятности Парето типа I для различных с При приближении распределения где - дельта-функция Дирака. α {\ displaystyle \ alpha} Икс м знак равно 1. {\ displaystyle x _ {\ mathrm {m}} = 1.} α , {\ displaystyle \ alpha \ rightarrow \ infty,} δ ( Икс - Икс м ) , {\ Displaystyle \ дельта (х-х _ {\ mathrm {m}}),} δ {\ displaystyle \ delta}
Кумулятивная функция распределения Кумулятивные функции распределения Парето типа I для различных α Функции кумулятивного распределения Парето типа I для различных с α {\ displaystyle \ alpha} Икс м знак равно 1. {\ displaystyle x _ {\ mathrm {m}} = 1.}
Параметры Икс м gt; 0 {\ displaystyle x _ {\ mathrm {m}}gt; 0} масштаб ( реальная ) форма (реальная) α gt; 0 {\ displaystyle \ alphagt; 0}
Служба поддержки Икс [ Икс м , ) {\ Displaystyle х \ в [х _ {\ mathrm {m}}, \ infty)}
PDF α Икс м α Икс α + 1 {\ displaystyle {\ frac {\ alpha x _ {\ mathrm {m}} ^ {\ alpha}} {x ^ {\ alpha +1}}}}
CDF 1 - ( Икс м Икс ) α {\ displaystyle 1- \ left ({\ frac {x _ {\ mathrm {m}}} {x}} \ right) ^ {\ alpha}}
Квантиль Икс м ( 1 - п ) - 1 α {\ displaystyle x _ {\ mathrm {m}} {(1-p)} ^ {- {\ frac {1} {\ alpha}}}}
Иметь в виду { для  α 1 α Икс м α - 1 для  α gt; 1 {\ displaystyle {\ begin {cases} \ infty amp; {\ text {for}} \ alpha \ leq 1 \\ {\ dfrac {\ alpha x _ {\ mathrm {m}}} {\ alpha -1}} amp; { \ text {for}} \ alphagt; 1 \ end {case}}}
Медиана Икс м 2 α {\ Displaystyle х _ {\ mathrm {m}} {\ sqrt [{\ alpha}] {2}}}
Режим Икс м {\ Displaystyle х _ {\ mathrm {m}}}
Дисперсия { для  α 2 Икс м 2 α ( α - 1 ) 2 ( α - 2 ) для  α gt; 2 {\ displaystyle {\ begin {cases} \ infty amp; {\ text {for}} \ alpha \ leq 2 \\ {\ dfrac {x _ {\ mathrm {m}} ^ {2} \ alpha} {(\ alpha - 1) ^ {2} (\ alpha -2)}} amp; {\ text {for}} \ alphagt; 2 \ end {case}}}
Асимметрия 2 ( 1 + α ) α - 3 α - 2 α  для  α gt; 3 {\ displaystyle {\ frac {2 (1+ \ alpha)} {\ alpha -3}} {\ sqrt {\ frac {\ alpha -2} {\ alpha}}} {\ text {for}} \ alphagt; 3}
Бывший. эксцесс 6 ( α 3 + α 2 - 6 α - 2 ) α ( α - 3 ) ( α - 4 )  для  α gt; 4 {\ Displaystyle {\ гидроразрыва {6 (\ альфа ^ {3} + \ альфа ^ {2} -6 \ альфа -2)} {\ альфа (\ альфа-3) (\ альфа -4)}} {\ текст {for}} \ alphagt; 4}
Энтропия бревно ( ( Икс м α ) е 1 + 1 α ) {\ displaystyle \ log \ left (\ left ({\ frac {x _ {\ mathrm {m}}} {\ alpha}} \ right) \, e ^ {1 + {\ tfrac {1} {\ alpha}} }\Правильно)}
MGF не существует
CF α ( - я Икс м т ) α Γ ( - α , - я Икс м т ) {\ Displaystyle \ альфа (-ix _ {\ mathrm {m}} t) ^ {\ alpha} \ Gamma (- \ alpha, -ix _ {\ mathrm {m}} t)}
Информация Fisher

я ( Икс м , α ) знак равно [ α Икс м 2 - 1 Икс м - 1 Икс м 1 α 2 ] {\ Displaystyle {\ mathcal {I}} (х _ {\ mathrm {m}}, \ alpha) = {\ begin {bmatrix} {\ dfrac {\ alpha} {x _ {\ mathrm {m}} ^ {2} }} amp; - {\ dfrac {1} {x _ {\ mathrm {m}}}} \\ - {\ dfrac {1} {x _ {\ mathrm {m}}}} amp; {\ dfrac {1} {\ альфа ^ {2}}} \ конец {bmatrix}}}

Верно: я ( Икс м , α ) знак равно [ α 2 Икс м 2 0 0 1 α 2 ] {\ Displaystyle {\ mathcal {I}} (х _ {\ mathrm {m}}, \ alpha) = {\ begin {bmatrix} {\ dfrac {\ alpha ^ {2}} {x _ {\ mathrm {m}} ^ {2}}} amp; 0 \\ 0 amp; {\ dfrac {1} {\ alpha ^ {2}}} \ end {bmatrix}}}

Распределение Парето, названный в честь итальянского инженера, экономиста и социолога Вильфредо Парето ( итал  [ р т е ː т о ] США : / р ə г eɪ т oʊ / pə- RAY -toh ), является степенное распределение вероятностей, которое используется в описании социального, контроля качества, научных, геофизических, актуарных и многих других видов наблюдаемых явлений. Первоначально применялся для описания распределения богатства в обществе, соответствуя тенденции, согласно которой большая часть богатства принадлежит небольшой части населения. Принцип Парето или «правило 80-20», утверждающий, что 80% результатов обусловлены 20% причин, был назван в честь Парето, но концепции различны, и только распределения Парето со значением формы ( α) log 4 5 ≈ 1.16 это точно отражает. Эмпирические наблюдения показали, что это распределение 80-20 подходит для широкого круга случаев, включая природные явления и деятельность человека.

СОДЕРЖАНИЕ

  • 1 Определения
    • 1.1 Кумулятивная функция распределения
    • 1.2 Функция плотности вероятности
  • 2 свойства
    • 2.1 Моменты и характеристическая функция
    • 2.2 Условные распределения
    • 2.3 Характеризационная теорема
    • 2.4 Среднее геометрическое
    • 2.5 Гармоническое среднее
    • 2.6 Графическое представление
  • 3 Связанные дистрибутивы
    • 3.1 Обобщенные распределения Парето
      • 3.1.1 Типы Парето I – IV
      • 3.1.2 Распределение Феллера – Парето
    • 3.2 Связь с экспоненциальным распределением
    • 3.3 Связь с логнормальным распределением
    • 3.4 Связь с обобщенным распределением Парето
    • 3.5 Ограниченное распределение Парето
      • 3.5.1 Генерация ограниченных случайных величин Парето
    • 3.6 Симметричное распределение Парето
    • 3.7 Многомерное распределение Парето
  • 4 Статистический вывод
    • 4.1 Оценка параметров
    • 4.2 Доверительные интервалы
  • 5 Возникновение и применение
    • 5.1 Общие
    • 5.2 Связь с законом Ципфа
    • 5.3 Связь с «принципом Парето»
    • 5.4 Связь с законом Прайса
    • 5.5 Кривая Лоренца и коэффициент Джини
  • 6 Вычислительные методы
    • 6.1 Генерация случайной выборки
  • 7 См. Также
  • 8 ссылки
  • 9 Примечания
  • 10 Внешние ссылки

Определения

Если X - случайная величина с распределением Парето (тип I), то вероятность того, что X больше некоторого числа x, то есть функция выживания (также называемая хвостовой функцией), определяется выражением

F ¯ ( Икс ) знак равно Pr ( Икс gt; Икс ) знак равно { ( Икс м Икс ) α Икс Икс м , 1 Икс lt; Икс м , {\ displaystyle {\ overline {F}} (x) = \ Pr (Xgt; x) = {\ begin {cases} \ left ({\ frac {x _ {\ mathrm {m}}} {x}} \ right) ^ {\ alpha} amp; x \ geq x _ {\ mathrm {m}}, \\ 1 amp; x lt;x _ {\ mathrm {m}}, \ end {cases}}}

где x m - (обязательно положительное) минимально возможное значение X, а α - положительный параметр. Распределение Парето типа I характеризуется масштабным параметром x m и параметром формы α, который известен как хвостовой индекс. Когда это распределение используется для моделирования распределения богатства, параметр α называется индексом Парето.

Кумулятивная функция распределения

Согласно определению, кумулятивная функция распределения случайной величины Парето с параметрами α и x m равна

F Икс ( Икс ) знак равно { 1 - ( Икс м Икс ) α Икс Икс м , 0 Икс lt; Икс м . {\ Displaystyle F_ {X} (х) = {\ begin {case} 1- \ left ({\ frac {x _ {\ mathrm {m}}} {x}} \ right) ^ {\ alpha} amp; x \ geq x _ {\ mathrm {m}}, \\ 0 amp; x lt;x _ {\ mathrm {m}}. \ end {case}}}

Функция плотности вероятности

Отсюда (путем дифференцирования ) следует, что функция плотности вероятности равна

ж Икс ( Икс ) знак равно { α Икс м α Икс α + 1 Икс Икс м , 0 Икс lt; Икс м . {\ displaystyle f_ {X} (x) = {\ begin {cases} {\ frac {\ alpha x _ {\ mathrm {m}} ^ {\ alpha}} {x ^ {\ alpha +1}}} amp; x \ geq x _ {\ mathrm {m}}, \\ 0 amp; x lt;x _ {\ mathrm {m}}. \ end {case}}}

При нанесении на линейные оси распределение принимает знакомую J-образную кривую, которая асимптотически приближается к каждой из ортогональных осей. Все сегменты кривой самоподобны (с учетом соответствующих масштабных коэффициентов). На графике логарифмического графика распределение представлено прямой линией.

Характеристики

Моменты и характерная функция

E ( Икс ) знак равно { α 1 , α Икс м α - 1 α gt; 1. {\ displaystyle \ operatorname {E} (X) = {\ begin {case} \ infty amp; \ alpha \ leq 1, \\ {\ frac {\ alpha x _ {\ mathrm {m}}} {\ alpha -1} } amp; \ alphagt; 1. \ end {case}}}
Вар ( Икс ) знак равно { α ( 1 , 2 ] , ( Икс м α - 1 ) 2 α α - 2 α gt; 2. {\ displaystyle \ operatorname {Var} (X) = {\ begin {cases} \ infty amp; \ alpha \ in (1,2], \\\ left ({\ frac {x _ {\ mathrm {m}}} { \ alpha -1}} \ right) ^ {2} {\ frac {\ alpha} {\ alpha -2}} amp; \ alphagt; 2. \ end {ases}}}
(Если α ≤ 1, дисперсия не существует.)
μ п знак равно { α п , α Икс м п α - п α gt; п . {\ displaystyle \ mu _ {n} '= {\ begin {case} \ infty amp; \ alpha \ leq n, \\ {\ frac {\ alpha x _ {\ mathrm {m}} ^ {n}} {\ alpha -n}} amp; \ alphagt; n. \ end {case}}}
  • Функция, производящая момент, определена только для неположительных значений t  ≤ 0 как
M ( т ; α , Икс м ) знак равно E [ е т Икс ] знак равно α ( - Икс м т ) α Γ ( - α , - Икс м т ) {\ displaystyle M \ left (t; \ alpha, x _ {\ mathrm {m}} \ right) = \ operatorname {E} \ left [e ^ {tX} \ right] = \ alpha (-x _ {\ mathrm { m}} t) ^ {\ alpha} \ Gamma (- \ alpha, -x _ {\ mathrm {m}} t)}
M ( 0 , α , Икс м ) знак равно 1. {\ displaystyle M \ left (0, \ alpha, x _ {\ mathrm {m}} \ right) = 1.}

Таким образом, поскольку математическое ожидание не сходится на открытом интервале, содержащем, мы говорим, что функция, производящая момент, не существует. т знак равно 0 {\ displaystyle t = 0}

φ ( т ; α , Икс м ) знак равно α ( - я Икс м т ) α Γ ( - α , - я Икс м т ) , {\ displaystyle \ varphi (t; \ alpha, x _ {\ mathrm {m}}) = \ alpha (-ix _ {\ mathrm {m}} t) ^ {\ alpha} \ Gamma (- \ alpha, -ix_ { \ mathrm {m}} t),}
где Γ ( a,  x) - неполная гамма-функция.

Параметры могут быть решены методом моментов.

Условные распределения

Условное распределение вероятностей из Парето- распределенной случайной величины, учитывая событие, которое оно больше или равно определенный номер  превышения, является распределение Парето с тем же индексом паретовского , но с минимумом  вместо. Это означает, что условное ожидаемое значение (если оно конечно, т. Е.) Пропорционально. В случае случайных величин, которые описывают время жизни объекта, это означает, что продолжительность жизни пропорциональна возрасту и называется эффектом Линди или законом Линди. Икс 1 {\ displaystyle x_ {1}} Икс м {\ displaystyle x _ {\ text {m}}} α {\ displaystyle \ alpha} Икс 1 {\ displaystyle x_ {1}} Икс м {\ displaystyle x _ {\ text {m}}} α gt; 1 {\ displaystyle \ alphagt; 1} Икс 1 {\ displaystyle x_ {1}}

Характеризационная теорема

Предположим, что это независимые одинаково распределенные случайные величины, распределение вероятностей которых поддерживается на интервале для некоторых. Предположим, что для всех две случайные величины и независимы. Тогда обычное распределение - это распределение Парето. Икс 1 , Икс 2 , Икс 3 , {\ Displaystyle X_ {1}, X_ {2}, X_ {3}, \ dotsc} [ Икс м , ) {\ Displaystyle [х _ {\ текст {м}}, \ infty)} Икс м gt; 0 {\ displaystyle x _ {\ text {m}}gt; 0} п {\ displaystyle n} мин { Икс 1 , , Икс п } {\ displaystyle \ min \ {X_ {1}, \ dotsc, X_ {n} \}} ( Икс 1 + + Икс п ) / мин { Икс 1 , , Икс п } {\ displaystyle (X_ {1} + \ dotsb + X_ {n}) / \ min \ {X_ {1}, \ dotsc, X_ {n} \}}

Среднее геометрическое

Геометрическое среднее ( G) является

грамм знак равно Икс м exp ( 1 α ) . {\ displaystyle G = x _ {\ text {m}} \ exp \ left ({\ frac {1} {\ alpha}} \ right).}

Гармоническое среднее

Гармоническое среднее ( Н) является

ЧАС знак равно Икс м ( 1 + 1 α ) . {\ displaystyle H = x _ {\ text {m}} \ left (1 + {\ frac {1} {\ alpha}} \ right).}

Графическое представление

Характерное криволинейное распределение с `` длинным хвостом '' при построении в линейном масштабе маскирует лежащую в основе простоту функции при нанесении на логарифмический график, который затем принимает форму прямой линии с отрицательным градиентом: это следует из формулы для функция плотности вероятности, что для x ≥ x m,

бревно ж Икс ( Икс ) знак равно бревно ( α Икс м α Икс α + 1 ) знак равно бревно ( α Икс м α ) - ( α + 1 ) бревно Икс . {\ displaystyle \ log f_ {X} (x) = \ log \ left (\ alpha {\ frac {x _ {\ mathrm {m}} ^ {\ alpha}} {x ^ {\ alpha +1}}}} \ справа) = \ log (\ alpha x _ {\ mathrm {m}} ^ {\ alpha}) - (\ alpha +1) \ log x.}

Поскольку α положительно, градиент - ( α  + 1) отрицательный.

Связанные дистрибутивы

Обобщенные распределения Парето

Смотрите также: Обобщенное распределение Парето

Существует иерархия распределений Парето, известная как распределения Парето типа I, II, III, IV и распределения Феллера – Парето. Тип Парето IV содержит Типы Парето I – III как особые случаи. Распределение Феллера – Парето обобщает тип Парето IV.

Типы Парето I – IV

Иерархия распределения Парето суммирована в следующей таблице, в которой сравниваются функции выживаемости (дополнительная функция CDF).

Когда μ = 0, тип распределения Парето II также известен как распределение Ломакса.

В этом разделе символ x m, использовавшийся ранее для обозначения минимального значения x, заменен на  σ.

Распределения Парето
F ¯ ( Икс ) знак равно 1 - F ( Икс ) {\ Displaystyle {\ overline {F}} (х) = 1-F (х)} Служба поддержки Параметры
Тип I [ Икс σ ] - α {\ displaystyle \ left [{\ frac {x} {\ sigma}} \ right] ^ {- \ alpha}} Икс σ {\ Displaystyle х \ geq \ sigma} σ gt; 0 , α {\ displaystyle \ sigmagt; 0, \ альфа}
Тип II [ 1 + Икс - μ σ ] - α {\ displaystyle \ left [1 + {\ frac {x- \ mu} {\ sigma}} \ right] ^ {- \ alpha}} Икс μ {\ Displaystyle х \ geq \ mu} μ р , σ gt; 0 , α {\ displaystyle \ mu \ in \ mathbb {R}, \ sigmagt; 0, \ alpha}
Lomax [ 1 + Икс σ ] - α {\ displaystyle \ left [1 + {\ frac {x} {\ sigma}} \ right] ^ {- \ alpha}} Икс 0 {\ Displaystyle х \ geq 0} σ gt; 0 , α {\ displaystyle \ sigmagt; 0, \ альфа}
Тип III [ 1 + ( Икс - μ σ ) 1 / γ ] - 1 {\ displaystyle \ left [1+ \ left ({\ frac {x- \ mu} {\ sigma}} \ right) ^ {1 / \ gamma} \ right] ^ {- 1}} Икс μ {\ Displaystyle х \ geq \ mu} μ р , σ , γ gt; 0 {\ displaystyle \ mu \ in \ mathbb {R}, \ sigma, \ gammagt; 0}
Тип IV [ 1 + ( Икс - μ σ ) 1 / γ ] - α {\ displaystyle \ left [1+ \ left ({\ frac {x- \ mu} {\ sigma}} \ right) ^ {1 / \ gamma} \ right] ^ {- \ alpha}} Икс μ {\ Displaystyle х \ geq \ mu} μ р , σ , γ gt; 0 , α {\ displaystyle \ mu \ in \ mathbb {R}, \ sigma, \ gammagt; 0, \ alpha}

Параметр формы α - индекс хвоста, μ - местоположение, σ - масштаб, γ - параметр неравенства. Некоторые частные случаи типа Парето (IV):

п ( я V ) ( σ , σ , 1 , α ) знак равно п ( я ) ( σ , α ) , {\ Displaystyle Р (IV) (\ сигма, \ сигма, 1, \ альфа) = Р (I) (\ сигма, \ альфа),}
п ( я V ) ( μ , σ , 1 , α ) знак равно п ( я я ) ( μ , σ , α ) , {\ Displaystyle Р (IV) (\ му, \ сигма, 1, \ альфа) = Р (II) (\ му, \ сигма, \ альфа),}
п ( я V ) ( μ , σ , γ , 1 ) знак равно п ( я я я ) ( μ , σ , γ ) . {\ Displaystyle P (IV) (\ mu, \ sigma, \ gamma, 1) = P (III) (\ mu, \ sigma, \ gamma).}

Конечность среднего, а также существование и конечность дисперсии зависят от хвостового индекса α (индекса неравенства γ). В частности, дробные δ- моменты конечны для некоторого δ gt; 0, как показано в таблице ниже, где δ не обязательно является целым числом.

Моменты распределений Парето I – IV (случай μ = 0)
E [ Икс ] {\ displaystyle \ operatorname {E} [X]} Состояние E [ Икс δ ] {\ displaystyle \ operatorname {E} [X ^ {\ delta}]} Состояние
Тип I σ α α - 1 {\ displaystyle {\ frac {\ sigma \ alpha} {\ alpha -1}}} α gt; 1 {\ displaystyle \ alphagt; 1} σ δ α α - δ {\ displaystyle {\ frac {\ sigma ^ {\ delta} \ alpha} {\ alpha - \ delta}}} δ lt; α {\ Displaystyle \ дельта lt;\ альфа}
Тип II σ α - 1 + μ {\ displaystyle {\ frac {\ sigma} {\ alpha -1}} + \ mu} α gt; 1 {\ displaystyle \ alphagt; 1} σ δ Γ ( α - δ ) Γ ( 1 + δ ) Γ ( α ) {\ displaystyle {\ frac {\ sigma ^ {\ delta} \ Gamma (\ alpha - \ delta) \ Gamma (1+ \ delta)} {\ Gamma (\ alpha)}}} 0 lt; δ lt; α {\ Displaystyle 0 lt;\ дельта lt;\ альфа}
Тип III σ Γ ( 1 - γ ) Γ ( 1 + γ ) {\ Displaystyle \ сигма \ Гамма (1- \ гамма) \ Гамма (1+ \ гамма)} - 1 lt; γ lt; 1 {\ Displaystyle -1 lt;\ гамма lt;1} σ δ Γ ( 1 - γ δ ) Γ ( 1 + γ δ ) {\ displaystyle \ sigma ^ {\ delta} \ Gamma (1- \ gamma \ delta) \ Gamma (1+ \ gamma \ delta)} - γ - 1 lt; δ lt; γ - 1 {\ Displaystyle - \ гамма ^ {- 1} lt;\ дельта lt;\ гамма ^ {- 1}}
Тип IV σ Γ ( α - γ ) Γ ( 1 + γ ) Γ ( α ) {\ Displaystyle {\ гидроразрыва {\ сигма \ Гамма (\ альфа - \ гамма) \ Гамма (1+ \ гамма)} {\ Гамма (\ альфа)}}} - 1 lt; γ lt; α {\ Displaystyle -1 lt;\ гамма lt;\ альфа} σ δ Γ ( α - γ δ ) Γ ( 1 + γ δ ) Γ ( α ) {\ displaystyle {\ frac {\ sigma ^ {\ delta} \ Gamma (\ alpha - \ gamma \ delta) \ Gamma (1+ \ gamma \ delta)} {\ Gamma (\ alpha)}}} - γ - 1 lt; δ lt; α / γ {\ Displaystyle - \ гамма ^ {- 1} lt;\ дельта lt;\ альфа / \ гамма}

Распределение Феллера – Парето

Валочно определяет переменную Парето с помощью преобразования U  =  Y -1  - 1 из в бета случайной величины Y, чья вероятность того, функция плотности

ж ( у ) знак равно у γ 1 - 1 ( 1 - у ) γ 2 - 1 B ( γ 1 , γ 2 ) , 0 lt; у lt; 1 ; γ 1 , γ 2 gt; 0 , {\ displaystyle f (y) = {\ frac {y ^ {\ gamma _ {1} -1} (1-y) ^ {\ gamma _ {2} -1}} {B (\ gamma _ {1}, \ gamma _ {2})}}, \ qquad 0 lt;y lt;1; \ gamma _ {1}, \ gamma _ {2}gt; 0,}

где B () - бета-функция. Если

W знак равно μ + σ ( Y - 1 - 1 ) γ , σ gt; 0 , γ gt; 0 , {\ Displaystyle W = \ mu + \ sigma (Y ^ {- 1} -1) ^ {\ gamma}, \ qquad \ sigmagt; 0, \ gammagt; 0,}

то W имеет распределение Феллера – Парето FP ( μ, σ, γ, γ 1, γ 2).

Если и являются независимыми гамма-переменными, другая конструкция переменной Феллера – Парето (FP): U 1 Γ ( δ 1 , 1 ) {\ Displaystyle U_ {1} \ sim \ Gamma (\ delta _ {1}, 1)} U 2 Γ ( δ 2 , 1 ) {\ Displaystyle U_ {2} \ sim \ Gamma (\ delta _ {2}, 1)}

W знак равно μ + σ ( U 1 U 2 ) γ {\ displaystyle W = \ mu + \ sigma \ left ({\ frac {U_ {1}} {U_ {2}}} \ right) ^ {\ gamma}}

и пишем W ∼ FP ( μ, σ, γ, δ 1, δ 2). Частные случаи распределения Феллера – Парето:

F п ( σ , σ , 1 , 1 , α ) знак равно п ( я ) ( σ , α ) {\ Displaystyle FP (\ sigma, \ sigma, 1,1, \ альфа) = P (I) (\ sigma, \ alpha)}
F п ( μ , σ , 1 , 1 , α ) знак равно п ( я я ) ( μ , σ , α ) {\ Displaystyle FP (\ му, \ сигма, 1,1, \ альфа) = п (II) (\ му, \ сигма, \ альфа)}
F п ( μ , σ , γ , 1 , 1 ) знак равно п ( я я я ) ( μ , σ , γ ) {\ Displaystyle FP (\ му, \ сигма, \ гамма, 1,1) = п (III) (\ му, \ сигма, \ гамма)}
F п ( μ , σ , γ , 1 , α ) знак равно п ( я V ) ( μ , σ , γ , α ) . {\ displaystyle FP (\ mu, \ sigma, \ gamma, 1, \ alpha) = P (IV) (\ mu, \ sigma, \ gamma, \ alpha).}

Связь с экспоненциальным распределением

Распределение Парето связано с экспоненциальным распределением следующим образом. Если X распределено по Парето с минимумом x m и индексом  α, то

Y знак равно бревно ( Икс Икс м ) {\ displaystyle Y = \ log \ left ({\ frac {X} {x _ {\ mathrm {m}}}} \ right)}

будет распределено экспоненциально с параметром скорости  альфа. Эквивалентно, если Y экспоненциально распределено со скоростью  α, то

Икс м е Y {\ Displaystyle х _ {\ mathrm {m}} е ^ {Y}}

распределено по Парето с минимумом x m и индексом  α.

Это можно показать, используя стандартные методы замены переменных:

Pr ( Y lt; у ) знак равно Pr ( бревно ( Икс Икс м ) lt; у ) знак равно Pr ( Икс lt; Икс м е у ) знак равно 1 - ( Икс м Икс м е у ) α знак равно 1 - е - α у . {\ Displaystyle {\ begin {align} \ Pr (Y lt;y) amp; = \ Pr \ left (\ log \ left ({\ frac {X} {x _ {\ mathrm {m}}}} \ right) lt;y \ right) \\ amp; = \ Pr (X lt;x _ {\ mathrm {m}} e ^ {y}) = 1- \ left ({\ frac {x _ {\ mathrm {m}}} {x _ {\ mathrm {m}} e ^ {y}}} \ right) ^ {\ alpha} = 1-e ^ {- \ alpha y}. \ end {выравнивается}}}

Последнее выражение представляет собой кумулятивную функцию распределения экспоненциального распределения со скоростью  α.

Распределение Парето можно построить с помощью иерархических экспоненциальных распределений. Пусть и. Тогда у нас есть и, как следствие,. ϕ | а Опыт ( а ) {\ Displaystyle \ фи | а \ сим {\ текст {Exp}} (а)} η | ϕ Опыт ( ϕ ) {\ Displaystyle \ эта | \ фи \ сим {\ текст {Exp}} (\ фи)} п ( η | а ) знак равно а ( а + η ) 2 {\ displaystyle p (\ eta | a) = {\ frac {a} {(a + \ eta) ^ {2}}}} а + η Парето ( а , 1 ) {\ displaystyle a + \ eta \ sim {\ text {Pareto}} (a, 1)}

В общем, если (параметризация скорости формы) и, то. λ Гамма ( α , β ) {\ displaystyle \ lambda \ sim {\ text {Gamma}} (\ alpha, \ beta)} η | λ Опыт ( λ ) {\ displaystyle \ eta | \ lambda \ sim {\ text {Exp}} (\ lambda)} β + η Парето ( β , α ) {\ Displaystyle \ бета + \ эта \ сим {\ текст {Парето}} (\ бета, \ альфа)}

Равнозначно, если и, то. Y Гамма ( α , 1 ) {\ displaystyle Y \ sim {\ text {Gamma}} (\ alpha, 1)} Икс Опыт ( 1 ) {\ displaystyle X \ sim {\ text {Exp}} (1)} Икс м ( 1 + Икс Y ) Парето ( Икс м , α ) {\ displaystyle x _ {\ text {m}} \! \ left (1 + {\ frac {X} {Y}} \ right) \ sim {\ text {Pareto}} (x _ {\ text {m}}, \ alpha)}

Отношение к логнормальному распределению

Распределение Парето и логнормальное распределение - это альтернативные распределения для описания одних и тех же типов величин. Одна из связей между ними заключается в том, что они оба являются распределениями экспоненты случайных величин, распределенных согласно другим общим распределениям, соответственно экспоненциальному распределению и нормальному распределению. (См. Предыдущий раздел.)

Связь с обобщенным распределением Парето

Распределение Парето - это частный случай обобщенного распределения Парето, которое представляет собой семейство распределений аналогичной формы, но содержит дополнительный параметр таким образом, что носитель распределения либо ограничен снизу (в переменной точке), либо ограничены как сверху, так и снизу (где оба являются переменными), причем распределение Ломакса является частным случаем. Это семейство также содержит экспоненциальные распределения без сдвига и со сдвигом.

Распределение Парето с масштабом и формой эквивалентно обобщенному распределению Парето с расположением, масштабом и формой. И наоборот, можно получить распределение Парето из GPD с помощью и. Икс м {\ displaystyle x_ {m}} α {\ displaystyle \ alpha} μ знак равно Икс м {\ displaystyle \ mu = x_ {m}} σ знак равно Икс м / α {\ displaystyle \ sigma = x_ {m} / \ alpha} ξ знак равно 1 / α {\ Displaystyle \ xi = 1 / \ альфа} Икс м знак равно σ / ξ {\ displaystyle x_ {m} = \ sigma / \ xi} α знак равно 1 / ξ {\ Displaystyle \ альфа = 1 / \ xi}

Ограниченное распределение Парето

См. Также: Усеченное распределение
Ограниченный Парето
Параметры

L gt; 0 {\ displaystyle Lgt; 0} местоположение ( реальное ) местоположение ( реальное ) ЧАС gt; L {\ displaystyle Hgt; L}

α gt; 0 {\ displaystyle \ alphagt; 0} форма (реальная)
Служба поддержки L Икс ЧАС {\ Displaystyle L \ leqslant x \ leqslant H}
PDF α L α Икс - α - 1 1 - ( L ЧАС ) α {\ displaystyle {\ frac {\ alpha L ^ {\ alpha} x ^ {- \ alpha -1}} {1- \ left ({\ frac {L} {H}} \ right) ^ {\ alpha}} }}
CDF 1 - L α Икс - α 1 - ( L ЧАС ) α {\ displaystyle {\ frac {1-L ^ {\ alpha} x ^ {- \ alpha}} {1- \ left ({\ frac {L} {H}} \ right) ^ {\ alpha}}}}
Иметь в виду

L α 1 - ( L ЧАС ) α ( α α - 1 ) ( 1 L α - 1 - 1 ЧАС α - 1 ) , α 1 {\ displaystyle {\ frac {L ^ {\ alpha}} {1- \ left ({\ frac {L} {H}} \ right) ^ {\ alpha}}} \ cdot \ left ({\ frac {\ alpha} {\ alpha -1}} \ right) \ cdot \ left ({\ frac {1} {L ^ {\ alpha -1}}} - {\ frac {1} {H ^ {\ alpha -1} }} \ right), \ alpha \ neq 1}

ЧАС L ЧАС - L пер ЧАС L , α знак равно 1 {\ displaystyle {\ frac {{H} {L}} {{H} - {L}}} \ ln {\ frac {H} {L}}, \ alpha = 1}
Медиана L ( 1 - 1 2 ( 1 - ( L ЧАС ) α ) ) - 1 α {\ displaystyle L \ left (1 - {\ frac {1} {2}} \ left (1- \ left ({\ frac {L} {H}} \ right) ^ {\ alpha} \ right) \ right)) ^ {- {\ frac {1} {\ alpha}}}}
Дисперсия

L α 1 - ( L ЧАС ) α ( α α - 2 ) ( 1 L α - 2 - 1 ЧАС α - 2 ) , α 2 {\ displaystyle {\ frac {L ^ {\ alpha}} {1- \ left ({\ frac {L} {H}} \ right) ^ {\ alpha}}} \ cdot \ left ({\ frac {\ альфа} {\ alpha -2}} \ right) \ cdot \ left ({\ frac {1} {L ^ {\ alpha -2}}} - {\ frac {1} {H ^ {\ alpha -2} }} \ right), \ alpha \ neq 2} 2 ЧАС 2 L 2 ЧАС 2 - L 2 пер ЧАС L , α знак равно 2 {\ displaystyle {\ frac {2 {H} ^ {2} {L} ^ {2}} {{H} ^ {2} - {L} ^ {2}}} \ ln {\ frac {H} { L}}, \ alpha = 2}

(это второй необработанный момент, а не дисперсия)
Асимметрия

L α 1 - ( L ЧАС ) α α * ( L k - α - ЧАС k - α ) ( α - k ) , α j {\ displaystyle {\ frac {L ^ {\ alpha}} {1- \ left ({\ frac {L} {H}} \ right) ^ {\ alpha}}} \ cdot {\ frac {\ alpha * ( L ^ {k- \ alpha} -H ^ {k- \ alpha})} {(\ alpha -k)}}, \ alpha \ neq j}

(это k-й необработанный момент, а не перекос)

Ограничена (или усеченный) распределение Парето имеет три параметра: α, L и H. Как и в стандартном распределении Парето, α определяет форму. L обозначает минимальное значение, а H обозначает максимальное значение.

Функция плотности вероятности :

α L α Икс - α - 1 1 - ( L ЧАС ) α {\ displaystyle {\ frac {\ alpha L ^ {\ alpha} x ^ {- \ alpha -1}} {1- \ left ({\ frac {L} {H}} \ right) ^ {\ alpha}} }},

где L  ≤  x  ≤  H и α  gt; 0.

Генерация ограниченных случайных величин Парето

Если U будет равномерно распределено на интервале (0, 1), а затем применяя метод обратного преобразования

U знак равно 1 - L α Икс - α 1 - ( L ЧАС ) α {\ Displaystyle U = {\ гидроразрыва {1-L ^ {\ alpha} x ^ {- \ alpha}} {1 - ({\ frac {L} {H}}) ^ {\ alpha}}}}
Икс знак равно ( - U ЧАС α - U L α - ЧАС α ЧАС α L α ) - 1 α {\ displaystyle x = \ left (- {\ frac {UH ^ {\ alpha} -UL ^ {\ alpha} -H ^ {\ alpha}} {H ^ {\ alpha} L ^ {\ alpha}}} \ справа) ^ {- {\ frac {1} {\ alpha}}}}

является ограниченным распределением по Парето.

Симметричное распределение Парето

Целью симметричного распределения Парето и нулевого симметричного распределения Парето является получение некоторого специального статистического распределения с острым пиком вероятности и симметричными длинными хвостами вероятности. Эти два распределения получены из распределения Парето. Длинный хвост вероятности обычно означает, что вероятность медленно убывает. Распределение Парето во многих случаях выполняет подгоночную работу. Но если распределение имеет симметричную структуру с двумя медленно затухающими хвостами, Парето не смог бы этого сделать. Тогда вместо этого применяется симметричное распределение Парето или нулевое симметричное распределение Парето.

Кумулятивная функция распределения (CDF) симметричного распределения Парето определяется следующим образом:

F ( Икс ) знак равно п ( Икс lt; Икс ) знак равно { 1 2 ( б 2 б - Икс ) а Икс lt; б 1 - 1 2 ( б Икс ) а Икс б {\ Displaystyle F (X) = P (x lt;X) = {\ begin {cases} {\ tfrac {1} {2}} ({b \ over 2b-X}) ^ {a} amp; X lt;b \\ 1 - {\ tfrac {1} {2}} ({\ tfrac {b} {X}}) ^ {a} amp; X \ geq b \ end {case}}}

Соответствующая функция плотности вероятности (PDF):

п ( Икс ) знак равно а б а 2 ( б + | Икс - б | ) а + 1 , Икс р {\ displaystyle p (x) = {ab ^ {a} \ over 2 (b + \ left \ vert xb \ right \ vert) ^ {a + 1}}, X \ in R}

Это распределение имеет два параметра: a и b. Он симметричен по b. Тогда математическое ожидание равно b. Когда он имеет следующие отклонения:

E ( ( Икс - б ) 2 ) знак равно - ( Икс - б ) 2 п ( Икс ) d Икс знак равно 2 б 2 ( а - 2 ) ( а - 1 ) {\ Displaystyle E ((xb) ^ {2}) = \ int _ {- \ infty} ^ {\ infty} (xb) ^ {2} p (x) dx = {2b ^ {2} \ over (a -2) (а-1)}}

CDF нулевого симметричного распределения Парето (ZSP) определяется следующим образом:

F ( Икс ) знак равно п ( Икс lt; Икс ) знак равно { 1 2 ( б б - Икс ) а Икс lt; 0 1 - 1 2 ( б б + Икс ) а Икс 0 {\ Displaystyle F (X) = P (x lt;X) = {\ begin {cases} {\ tfrac {1} {2}} ({b \ over bX}) ^ {a} amp; X lt;0 \\ 1- {\ tfrac {1} {2}} ({\ tfrac {b} {b + X}}) ^ {a} amp; X \ geq 0 \ end {case}}}

Соответствующий PDF-файл:

п ( Икс ) знак равно а б а 2 ( б + | Икс | ) а + 1 , Икс р {\ displaystyle p (x) = {ab ^ {a} \ over 2 (b + \ left \ vert x \ right \ vert) ^ {a + 1}}, X \ in R}

Это распределение симметрично нулю. Параметр a связан со скоростью убывания вероятности, а (a / 2b) представляет собой пиковую величину вероятности.

Многомерное распределение Парето

Одномерное распределение Парето было расширено до многомерного распределения Парето.

Статистические выводы

Оценка параметров

Функция правдоподобия для параметров распределения Парето α и x m для независимой выборки x = ( x 1,  x 2,...,  x n) равна

L ( α , Икс м ) знак равно я знак равно 1 п α Икс м α Икс я α + 1 знак равно α п Икс м п α я знак равно 1 п 1 Икс я α + 1 . {\ displaystyle L (\ alpha, x _ {\ mathrm {m}}) = \ prod _ {i = 1} ^ {n} \ alpha {\ frac {x _ {\ mathrm {m}} ^ {\ alpha}} {x_ {i} ^ {\ alpha +1}}} = \ alpha ^ {n} x _ {\ mathrm {m}} ^ {n \ alpha} \ prod _ {i = 1} ^ {n} {\ frac {1} {x_ {i} ^ {\ alpha +1}}}.}

Следовательно, функция логарифмического правдоподобия имеет вид

( α , Икс м ) знак равно п пер α + п α пер Икс м - ( α + 1 ) я знак равно 1 п пер Икс я . {\ displaystyle \ ell (\ alpha, x _ {\ mathrm {m}}) = п \ ln \ alpha + n \ alpha \ ln x _ {\ mathrm {m}} - (\ alpha +1) \ sum _ {i = 1} ^ {n} \ ln x_ {i}.}

Видно, что он монотонно возрастает с увеличением x m, то есть чем больше значение x m, тем больше значение функции правдоподобия. Отсюда, поскольку x ≥ x m, заключаем, что ( α , Икс м ) {\ Displaystyle \ ell (\ альфа, х _ {\ mathrm {m}})}

Икс ^ м знак равно мин я Икс я . {\ displaystyle {\ widehat {x}} _ {\ mathrm {m}} = \ min _ {i} {x_ {i}}.}

Чтобы найти оценку для α, мы вычисляем соответствующую частную производную и определяем, где она равна нулю:

α знак равно п α + п пер Икс м - я знак равно 1 п пер Икс я знак равно 0. {\ displaystyle {\ frac {\ partial \ ell} {\ partial \ alpha}} = {\ frac {n} {\ alpha}} + n \ ln x _ {\ mathrm {m}} - \ sum _ {i = 1} ^ {n} \ ln x_ {i} = 0.}

Таким образом, оценка максимального правдоподобия для α равна:

α ^ знак равно п я пер ( Икс я / Икс ^ м ) . {\ displaystyle {\ widehat {\ alpha}} = {\ frac {n} {\ sum _ {i} \ ln (x_ {i} / {\ widehat {x}} _ {\ mathrm {m}})} }.}

Ожидаемая статистическая ошибка:

σ знак равно α ^ п . {\ displaystyle \ sigma = {\ frac {\ widehat {\ alpha}} {\ sqrt {n}}}.}

Малик (1970) дает точное совместное распределение. В частности, и являются независимыми и является Парето с параметром масштаба x m и параметром формы nα, тогда как имеет обратное гамма-распределение с параметрами формы и масштаба n  - 1 и nα, соответственно. ( Икс ^ м , α ^ ) {\ displaystyle ({\ hat {x}} _ {\ mathrm {m}}, {\ hat {\ alpha}})} Икс ^ м {\ displaystyle {\ hat {x}} _ {\ mathrm {m}}} α ^ {\ displaystyle {\ hat {\ alpha}}} Икс ^ м {\ displaystyle {\ hat {x}} _ {\ mathrm {m}}} α ^ {\ displaystyle {\ hat {\ alpha}}}

Доверительные интервалы

Рассматривая как известные (т.е.) и используя результат выше Малика (1970), CDF распределения Парето (,) можно инвертировать, чтобы сформировать доверительный интервал для, то есть CDF () =. Дополнительно возможно профилирование. То есть для каждой гипотезы производят переоценку в ограниченном нулевом пространстве и считают это известным. Нижний односторонний доверительный интервал 97,5% является гипотезой о том, что вероятность того, что верхний хвост или что-то более экстремальное, составляет 2,5%. Аналогичный подход может быть использован для получения доверительного интервала для путем инвертирования CDF обратного гамма-распределения с параметрами формы и масштаба и, соответственно, т.е. CDF () =. Двусторонние 95% доверительные интервалы - это гипотезы, согласно которым односторонняя вероятность или что-то более экстремальное составляет 2,5%. α ^ {\ displaystyle {\ hat {\ alpha}}} α знак равно α ^ {\ displaystyle \ alpha = {\ hat {\ alpha}}} Икс м {\ displaystyle x_ {m}} п α ^ {\ displaystyle n {\ hat {\ alpha}}} Икс м {\ displaystyle x_ {m}} Икс ^ м {\ displaystyle {\ hat {x}} _ {m}} 1 - ( Икс м Икс ^ м ) п α ^ {\ displaystyle 1 - {\ Bigl (} {\ frac {x_ {m}} {{\ hat {x}} _ {m}}} {\ Bigr)} ^ {n {\ hat {\ alpha}}} } α {\ displaystyle \ alpha} ЧАС 0 : Икс м Икс м 0 {\ displaystyle H_ {0}: x_ {m} \ leq x_ {m_ {0}}} α {\ displaystyle \ alpha} α ^ 0 {\ displaystyle {\ hat {\ alpha}} _ {0}} Икс м {\ displaystyle x_ {m}} Икс ^ м {\ displaystyle {\ hat {x}} _ {m}} α {\ displaystyle \ alpha} п - 1 {\ displaystyle n-1} п α {\ Displaystyle п \ альфа} α ^ {\ displaystyle {\ hat {\ alpha}}} Γ ( п - 1 , п α α ^ ) Γ ( п - 1 ) {\ displaystyle {\ frac {\ Gamma {\ Bigl (} n-1, {\ frac {n \ alpha} {\ hat {\ alpha}}} {\ Bigr)}} {\ Gamma (n-1)} }} α {\ displaystyle \ alpha} α ^ {\ displaystyle {\ hat {\ alpha}}}

Возникновение и приложения

Общий

Первоначально Вильфредо Парето использовал это распределение для описания распределения богатства между людьми, поскольку оно, казалось, довольно хорошо показывает, что большая часть богатства любого общества принадлежит меньшему проценту людей в этом обществе. Он также использовал его для описания распределения доходов. Эта идея иногда выражается проще как принцип Парето или «правило 80-20», согласно которому 20% населения контролируют 80% богатства. Однако правило 80-20 соответствует определенному значению α, и на самом деле данные Парето о британских подоходных налогах в его Cours d'économie politique показывают, что около 30% населения имели около 70% дохода. Функция плотности вероятности (PDF) график, в начале этой статьи показывает, что «вероятность» или часть населения, которой принадлежит небольшое количество богатства на человека достаточно высока, а затем постепенно уменьшается по мере увеличения благосостояния. (Однако распределение Парето нереально для богатства на нижнем уровне. Фактически, чистая стоимость может быть даже отрицательной.) Это распределение не ограничивается описанием богатства или дохода, но во многих ситуациях, в которых равновесие находится в распределение от «малого» к «большому». Следующие примеры иногда рассматриваются как приблизительно распределенные по Парето:

  • Размеры населенных пунктов (несколько городов, много деревень / деревень)
  • Распределение размера файлов интернет-трафика, использующего протокол TCP (много файлов меньшего размера, несколько файлов большего размера)
  • Частота ошибок жесткого диска
  • Кластеры конденсата Бозе – Эйнштейна вблизи абсолютного нуля
Подгонка кумулятивного распределения Парето (Lomax) к максимальным однодневным осадкам с использованием CumFreq, см. Также подгонку распределения
  • Значения запасов нефти на нефтяных месторождениях (несколько крупных месторождений, много мелких месторождений )
  • Распределение длин в заданиях суперкомпьютеров (несколько крупных, много мелких)
  • Стандартизированная доходность по отдельным акциям
  • Размеры песчинок
  • Размер метеоритов
  • Серьезность крупных потерь в результате несчастных случаев для определенных сфер деятельности, таких как общая ответственность, коммерческие автомобили и компенсация рабочим.
  • Количество времени, которое пользователь Steam будет проводить, играя в разные игры. (В некоторые игры играют много, но в большинство почти никогда не играют.) [2]
  • В гидрологии распределение Парето применяется к экстремальным явлениям, таким как годовые максимальные однодневные осадки и сток рек. На синем рисунке показан пример подгонки распределения Парето к ранжированным годовым максимальным однодневным осадкам, показывающий также пояс уверенности 90%, основанный на биномиальном распределении. Данные об осадках представлены в виде точек на графике как часть кумулятивного частотного анализа.
  • В отношении надежности распределения электроэнергии (80% минут, в течение которых клиент прерывает работу, происходит примерно в 20% дней в году).

Связь с законом Ципфа

Распределение Парето - это непрерывное распределение вероятностей. Закон Ципфа, также иногда называемый дзета-распределением, представляет собой дискретное распределение, разделяющее значения на простое ранжирование. Оба представляют собой простой степенной закон с отрицательной экспонентой, масштабированный таким образом, чтобы их кумулятивные распределения равнялись 1. Коэффициенты Ципфа можно получить из распределения Парето, если значения (доходы) разделены на ранги, так что количество людей в каждой ячейке соответствует единице. / шаблон ранга. Распределение нормализуется путем определения так, что где - обобщенный номер гармоники. Это делает функцию плотности вероятности Ципфа выводимой из функции Парето. Икс {\ displaystyle x} N {\ displaystyle N} Икс м {\ displaystyle x_ {m}} α Икс м α знак равно 1 ЧАС ( N , α - 1 ) {\ displaystyle \ alpha x _ {\ mathrm {m}} ^ {\ alpha} = {\ frac {1} {H (N, \ alpha -1)}}} ЧАС ( N , α - 1 ) {\ Displaystyle Н (N, \ альфа -1)}

ж ( Икс ) знак равно α Икс м α Икс α + 1 знак равно 1 Икс s ЧАС ( N , s ) {\ displaystyle f (x) = {\ frac {\ alpha x _ {\ mathrm {m}} ^ {\ alpha}} {x ^ {\ alpha +1}}} = {\ frac {1} {x ^ { s} H (N, s)}}}

где и - целое число, представляющее ранг от 1 до N, где N - категория с наивысшим доходом. Таким образом, случайно выбранный человек (или слово, ссылка на веб-сайт или город) из населения (или языка, Интернета или страны) имеет вероятность ранжирования. s знак равно α - 1 {\ displaystyle s = \ alpha -1} Икс {\ displaystyle x} ж ( Икс ) {\ displaystyle f (x)} Икс {\ displaystyle x}

Отношение к «принципу Парето»

« Закон 80–20 », согласно которому 20% всех людей получают 80% всего дохода, а 20% наиболее богатых 20% получают 80% этих 80%, и так далее, выполняется именно тогда, когда индекс Парето есть. Этот результат может быть получен из формулы кривой Лоренца, приведенной ниже. Более того, было показано, что следующее математически эквивалентно: α знак равно бревно 4 5 знак равно бревно 10 5 бревно 10 4 1,161 {\ displaystyle \ alpha = \ log _ {4} 5 = {\ cfrac {\ log _ {10} 5} {\ log _ {10} 4}} \ приблизительно 1,161}

  • Доход распределяется по распределению Парето с индексом α  gt; 1.
  • Существует некоторое число 0 ≤  p  ≤ 1/2 такое, что 100 p  % всех людей получают 100 (1 -  p)% всего дохода, и аналогично для каждого действительного (не обязательно целого) n  gt; 0, 100 p n  % от общего дохода. все люди получают 100 (1 -  p) n процентов от всех доходов. α и p связаны соотношением
1 - 1 α знак равно пер ( 1 - п ) пер ( п ) знак равно пер ( ( 1 - п ) п ) пер ( п п ) {\ displaystyle 1 - {\ frac {1} {\ alpha}} = {\ frac {\ ln (1-p)} {\ ln (p)}} = {\ frac {\ ln ((1-p) ^ {n})} {\ ln (p ^ {n})}}}

Это относится не только к доходу, но и к богатству или ко всему, что можно смоделировать с помощью этого распределения.

Это исключает распределения Парето, в которых 0 lt;  α  ≤ 1, которые, как отмечалось выше, имеют бесконечное ожидаемое значение и поэтому не могут разумно моделировать распределение доходов.

Связь с законом Прайса

Закон квадратного корня Прайса иногда предлагается как свойство или аналогично распределению Парето. Однако закон действует только в том случае, если это. Обратите внимание, что в этом случае общая и ожидаемая сумма богатства не определены, и правило применяется только асимптотически к случайным выборкам. Упомянутый выше расширенный принцип Парето является гораздо более общим правилом. α знак равно 1 {\ Displaystyle \ альфа = 1}

Кривая Лоренца и коэффициент Джини

Кривые Лоренца для ряда распределений Парето. Случай α  = ∞ соответствует идеально равному распределению ( G  = 0), а линия α  = 1 соответствует полному неравенству ( G  = 1)

Кривая Лоренца часто используется для характеристики распределения доходов и богатства. Для любого распределения кривая Лоренца L ( F) записывается в терминах PDF f или CDF F как

L ( F ) знак равно Икс м Икс ( F ) Икс ж ( Икс ) d Икс Икс м Икс ж ( Икс ) d Икс знак равно 0 F Икс ( F ) d F 0 1 Икс ( F ) d F {\ Displaystyle L (F) = {\ гидроразрыва {\ int _ {x _ {\ mathrm {m}}} ^ {x (F)} xf (x) \, dx} {\ int _ {x _ {\ mathrm { m}}} ^ {\ infty} xf (x) \, dx}} = {\ frac {\ int _ {0} ^ {F} x (F ') \, dF'} {\ int _ {0} ^ {1} х (F ') \, dF'}}}

где x ( F) - обратная функция CDF. Для распределения Парето

Икс ( F ) знак равно Икс м ( 1 - F ) 1 α {\ displaystyle x (F) = {\ frac {x _ {\ mathrm {m}}} {(1-F) ^ {\ frac {1} {\ alpha}}}}}

а кривая Лоренца рассчитывается как

L ( F ) знак равно 1 - ( 1 - F ) 1 - 1 α , {\ Displaystyle L (F) = 1- (1-F) ^ {1 - {\ frac {1} {\ alpha}}},}

Поскольку знаменатель бесконечен, получаем L = 0. Примеры кривой Лоренца для ряда распределений Парето показаны на графике справа. 0 lt; α 1 {\ Displaystyle 0 lt;\ альфа \ leq 1}

По данным Oxfam (2016) 62 самых богатых человека имеют такое же состояние, как и беднейшая половина населения мира. Мы можем оценить индекс Парето, который применим к этой ситуации. Приравнивая ε, имеем: 62 / ( 7 × 10 9 ) {\ displaystyle 62 / (7 \ times 10 ^ {9})}

L ( 1 / 2 ) знак равно 1 - L ( 1 - ε ) {\ Displaystyle L (1/2) = 1-L (1- \ varepsilon)}

или

1 - ( 1 / 2 ) 1 - 1 α знак равно ε 1 - 1 α {\ displaystyle 1- (1/2) ^ {1 - {\ frac {1} {\ alpha}}} = \ varepsilon ^ {1 - {\ frac {1} {\ alpha}}}}

Решение состоит в том, что α равно примерно 1,15, и около 9% богатства принадлежит каждой из двух групп. Но на самом деле 69% беднейшего взрослого населения мира владеют лишь 3% богатства.

Коэффициент Джини - это мера отклонения кривой Лоренца от линии равнораспределения, которая представляет собой линию, соединяющую [0, 0] и [1, 1], которая показана черным ( α  = ∞) на графике Лоренца на Правильно. В частности, коэффициент Джини в два раза больше площади между кривой Лоренца и линией равнораспределения. Затем рассчитывается коэффициент Джини для распределения Парето (для) α 1 {\ displaystyle \ alpha \ geq 1}

грамм знак равно 1 - 2 ( 0 1 L ( F ) d F ) знак равно 1 2 α - 1 {\ displaystyle G = 1-2 \ left (\ int _ {0} ^ {1} L (F) \, dF \ right) = {\ frac {1} {2 \ alpha -1}}}

(см. Aaberge 2005).

Вычислительные методы

Генерация случайной выборки

Случайные выборки могут быть сгенерированы с использованием выборки с обратным преобразованием. Для случайной переменной U, взятой из равномерного распределения на единичном интервале (0, 1], переменная T, заданная формулой

Т знак равно Икс м U 1 / α {\ Displaystyle Т = {\ гидроразрыва {х _ {\ mathrm {m}}} {U ^ {1 / \ alpha}}}}

распределено по Парето. Если U равномерно распределен на [0, 1), его можно заменить на (1 -  U).

Смотрите также

использованная литература

Примечания

  • Парето, Вильфредо (1895). "La legge della domanda". Giornale Degli Economisti. 10: 59–68.
  • Парето, Вильфредо (1896). "Cours d'économie politique". DOI : 10,1177 / 000271629700900314. S2CID   143528002. Цитировать журнал требует |journal=( помощь )

внешние ссылки

  • syntraf1.c - это программа на языке C для генерации синтетического пакетного трафика с ограниченным размером пакета Парето и экспоненциальным временем между пакетами.
Последняя правка сделана 2023-03-20 03:03:13
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте