Индекс Тейла

редактировать
Индекс для измерения экономического неравенства

Индекс Тейла - это статистика, в основном используемая для измерения экономическое неравенство и другие экономические явления, хотя его также использовали для измерения расовой сегрегации.

Индекс Тейла T T аналогичен избыточности в теории информации, которая представляет собой максимально возможную энтропию данных за вычетом наблюдаемой энтропии. Это частный случай обобщенного индекса энтропии. Его можно рассматривать как меру избыточности, отсутствия разнообразия, изоляции, сегрегации, неравенства, неслучайности и сжимаемости. Он был предложен эконометчиком Анри Тейлом в Университете Эразма в Роттердаме.

Содержание
  • 1 Формула
    • 1.1 Связь с индексом Аткинсона
  • 2 Вывод из энтропия
  • 3 Разложимость
    • 3.1 Т Тейла по сравнению с L Тейла
  • 4 Приложения
  • 5 См. также
  • 6 Примечания
  • 7 Ссылки
  • 8 Внешние ссылки
Формула

Для группы из N «агентов», каждый с характеристикой x, ситуация может быть представлена ​​списком x i (i = 1,..., N), где x i - характеристика агента i. Например, если характеристика - доход, то x i - это доход агента i.

Индекс Тейла T определяется как

TT = T α = 1 = 1 N ∑ i = 1 N xi μ ln ⁡ (xi μ) {\ displaystyle T_ {T} = T _ {\ alpha = 1} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} {\ frac {x_ {i}} {\ mu}} \ ln \ left ({\ frac {x_ {i}} {\ mu}} \ right)}{\ displaystyle T_ {T} = T _ {\ alpha = 1} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} {\ frac {x_ {i}} {\ mu}} \ ln \ left ({\ frac { x_ {i}} {\ mu}} \ right)}

и индекс Тейла L определяется как

TL = T α = 0 = 1 N ∑ i = 1 N ln ⁡ (μ xi) {\ displaystyle T_ {L} = T _ {\ alpha = 0} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} \ ln \ left ({\ frac {\ mu} {x_ { i}}} \ right)}{\ displaystyle T_ {L} = T _ {\ alp ha = 0} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} \ ln \ left ({\ frac {\ mu} {x_ {i}}} \ right)}

где μ {\ displaystyle \ mu}\ mu - средний доход:

μ = 1 N ∑ i = 1 N xi {\ displaystyle \ mu = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} x_ {i}}{\ displaystyle \ mu = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} x_ {i}}

Эквивалентно, если ситуация характеризуется дискретной функцией распределения f k (k = 0,..., W), где f k - доля населения с доходом k, а W = Nμ - общий доход, тогда ∑ k = 0 W fk = 1 {\ displaystyle \ sum _ {k = 0} ^ {W} f_ {k} = 1}{\ displaystyle \ sum _ {k = 0} ^ {W} f_ {k} = 1} , а индекс Тейла:

TT = ∑ k = 0 W fkk μ ln (К μ) {\ Displaystyle T_ {T} = \ sum _ {k = 0} ^ {W} \, f_ {k} \, {\ frac {k} {\ mu}} \ ln \ left ({\ fr ac {k} {\ mu}} \ right)}{\ displaystyle T_ { T} = \ sum _ {k = 0} ^ {W} \, f_ {k} \, {\ frac {k} {\ mu}} \ ln \ left ({\ frac {k} {\ mu}} \ right)}

где μ {\ displaystyle \ mu}\ mu снова средний доход:

μ = ∑ k = 0 W kfk {\ displaystyle \ mu = \ sum _ {k = 0} ^ {W} kf_ {k}}{\ displaystyle \ mu = \ sum _ {k = 0} ^ {W} kf_ {k}}

Обратите внимание, что в этом случае доход k является целым числом, а k = 1 представляет наименьшее возможное приращение дохода (например, центов).

если ситуация характеризуется непрерывной функцией распределения f (k) (поддерживаемой от 0 до бесконечности), где f (k) dk - доля населения с доходом от k до k + dk, то тейл индекс:

TT = ∫ 0 ∞ е (k) k μ ln ⁡ (k μ) dk {\ displaystyle T_ {T} = \ int _ {0} ^ {\ infty} f (k) {\ frac {k} {\ mu}} \ ln \ left ({\ frac {k} {\ mu}} \ right) dk}{\ displaystyle T_ {T} = \ int _ {0 } ^ {\ infty} f (k) {\ frac {k} {\ mu}} \ ln \ left ({\ frac {k} {\ mu}} \ right) dk}

где среднее значение:

μ = ∫ 0 ∞ kf (k) dk {\ displaystyle \ mu = \ int _ {0} ^ {\ infty} kf (k) \, dk}{\ displaystyle \ mu = \ int _ {0} ^ {\ infty} kf (k) \, dk}

Индексы Тейла для некоторых распространенных непрерывных распределений вероятностей приведены в таблице ниже:

Функция распределения доходовPDF (x) (x ≥ 0)Коэффициент Тейла (nats)
дельта-функция Дирака δ (x - x 0), x 0>0 {\ displaystyle \ delta (x-x_ {0}), \, x_ {0}>0}{\displaystyle \delta (x-x_{0}),\,x_{0}>0} 0
Равномерное распределение {1 b - aa ≤ x ≤ b 0 в противном случае {\ displaystyle {\ begin {case s} {\ frac {1} {ba}} a \ leq x \ leq b \\ 0 {\ text {else}} \ end {cases}}}{\ displaystyle {\ begin {case} {\ frac {1} {ba}} a \ leq x \ leq b \\ 0 {\ text {иначе}} \ end {case}}} ln ⁡ (2 a (a + b) e) + b 2 b 2 - a 2 пер ⁡ (b / a) {\ displaystyle \ ln \ left ({\ frac {2a} {(a + b) {\ sqrt {e}}}} \ right) + { \ frac {b ^ {2}} {b ^ {2} -a ^ {2}}} \ ln (b / a)}{\ displaystyle \ ln \ left ({\ frac { 2a} {(a + b) {\ sqrt {e}}}} \ right) + {\ frac {b ^ {2}} {b ^ {2} -a ^ {2}}} \ ln (b / а)}
Экспоненциальное распределение λ e - x λ, x>0 {\ displaystyle \ lambda e ^ {- x \ lambda}, \, \, x>0}\lambda e^{-x\lambda },\,\,x>0 1 - {\ displaystyle 1-}{\ displaystyle 1-} γ {\ displaystyle \ gamma}\ gamma
Логнормальное распределение 1 σ 2 π е (- (пер ⁡ (x) - μ) 2) / σ 2 {\ displaystyle {\ frac {1} {\ sigma {\ sqrt {2 \ pi}}}} e ^ {(- (\ пер (х) - \ му) ^ {2}) / \ sigma ^ {2}}}{\ displaystyle {\ frac {1} {\ sigma {\ sqrt {2 \ pi}}}} e ^ {(- (\ ln (x) - \ mu) ^ {2}) / \ sigma ^ {2}}} σ 2 2 {\ displaystyle {\ frac {\ sigma ^ {2}} {2}}}{ \ displaystyle {\ frac {\ sigma ^ {2}} {2}}}
Распределение Парето {α К α Икс α + 1 Икс ≥ К 0 Икс < k {\displaystyle {\begin{cases}{\frac {\alpha k^{\alpha }}{x^{\alpha +1}}}x\geq k\\0x{\ begin { case} {\ frac {\ alpha k ^ {\ alpha}} {x ^ {\ alpha +1}}} x \ geq k \\ 0 х <k \ end {case}} ln ⁡ (1 - 1 / α) + 1 α - 1 {\ Displaystyle \ ln (1 \! - \! 1 / \ alpha) + {\ frac {1} {\ alpha -1}}}{\ displaystyle \ ln (1 \! - \! 1 / \ alpha) + {\ frac {1} {\ alpha -1}}} (α>1)
Распределение хи-квадрат 2 - k / 2 e - x / 2 xk / 2 - 1 Γ (k / 2) {\ displaystyle {\ frac {2 ^ {- k / 2} e ^ {- x / 2} x ^ {k / 2-1}} {\ Gamma (k / 2)}}}{\ frac {2 ^ {- k / 2} e ^ {- x / 2} x ^ {k / 2 -1}} {\ Gamma (k / 2)}} ln ⁡ (2 / к) + {\ displaystyle \ ln (2 / k) +}{\ displaystyle \ ln (2 / k) +} ψ (0) {\ displaystyle \ psi ^ {(0)}}\ psi ^ {{(0)}} (1 + k / 2) {\ displaystyle (1 \! + \! K / 2)}{\ displaystyle (1 \! + \! K / 2)}
Гамма-распределение e - x / θ xk - 1 θ - k Γ (k) {\ displaystyle {\ frac {e ^ {- x / \ theta } x ^ {k-1} \ theta ^ {- k}} {\ Gamma (k)}}}{\ frac {e ^ {- x / \ theta} x ^ { k-1} \ theta ^ {- k}} {\ Gamma (k)}} ψ (0) {\ displaystyle \ psi ^ {(0)}}\ psi ^ {{(0)}} (1 + к) - пер ⁡ (к) {\ displaystyle (1 + k) - \ ln (k)}{\ displaystyle (1 + k) - \ ln (k)}
распределение Вейбулла k λ (x λ) k - 1 e - (x / λ) k {\ displaystyle {\ frac {k} {\ lambda}} \ left ({\ frac {x} {\ lambda}} \ right) ^ {k-1} e ^ {- (x / \ lambda) ^ {k}} }{\ displaystyle {\ frac {k} {\ lambda}} \ left ({\ frac {x} { \ lambda}} \ right) ^ {k-1} e ^ {- (x / \ lambda) ^ {k}}} 1 к {\ displaystyle {\ frac {1} {k}}}{\ frac {1} {k}} ψ (0) {\ displaystyle \ psi ^ {(0)}}\ psi ^ {{(0)}} (1 + 1 / k) - пер ⁡ (Γ (1 + 1 / k)) {\ displaystyle (1 + 1 / k) - \ ln \ left (\ Gamma (1 + 1 / k) \ right)}{\ displaystyle (1 + 1 / k) - \ ln \ left (\ Gamma (1 + 1 / k) \ right)}

Если у всех одинаковый доход, то T T равно 0. Если один человек имеет весь доход, то T T дает результат ln ⁡ N {\ displaystyle \ ln N}\ ln N , что является максимальным неравенством. Разделив T T на ln ⁡ N {\ displaystyle \ ln N}\ ln N , можно нормализовать уравнение до диапазона от 0 до 1, но тогда аксиома независимости нарушено: T [x ∪ x] ≠ T [x] {\ displaystyle T [x \ cup x] \ neq T [x]}{\ displaystyle T [x \ cup x] \ neq T [x]} и не квалифицируется как показатель неравенства.

Индекс Тейла измеряет энтропийную «дистанцию», на которой население находится от эгалитарного государства с одинаковым доходом. Численный результат выражается в отрицательной энтропии, так что большее число указывает на больший порядок, который дальше от полного равенства. Формулировка индекса для представления отрицательной энтропии вместо энтропии позволяет ему быть мерой неравенства, а не равенства.

Связь с индексом Аткинсона

Индекс Тейла может быть преобразован в индекс Аткинсона, который имеет диапазон от 0 до 1 (от 0% до 100%), где 0 указывает на полное равенство, а 1 (100%) указывает на максимальное неравенство. (См. Преобразование Обобщенный индекс энтропии.)

.

Вывод из энтропии

Индекс Тейла выводится из меры Шеннона информационной энтропии S {\ displaystyle S}S, где энтропия - это мера случайности в заданном наборе информации. В теории информации, физике и индексе Тейла общая форма энтропии имеет вид

S = k ∑ i = 1 N (pi log a ⁡ (1 pi)) = - k ∑ i = 1 N (pi log a ⁡ (пи)) {\ Displaystyle S = к \ сумма _ {я = 1} ^ {N} \ left (p_ {i} \ log _ {a} \ left ({\ frac {1} {p_ {i}) }} \ right) \ right) = - k \ sum _ {i = 1} ^ {N} \ left (p_ {i} \ log _ {a} \ left ({p_ {i}} \ right) \ right)}{\ displaystyle S = k \ sum _ {i = 1} ^ { N} \ left (p_ {i} \ log _ {a} \ left ({\ frac {1} {p_ {i}}} \ right) \ right) = - k \ sum _ {i = 1} ^ { N} \ left (p_ {i} \ log _ {a} \ left ({p_ {i}} \ right) \ right)}
где
  • i {\ displaystyle i}я - отдельный элемент из набора (например, отдельный член из совокупности или отдельный байт из компьютерного файла).
  • pi {\ displaystyle p_ {i}}p_ {i} - вероятность найти i {\ displaystyle i}я из случайной выборки из набора.
  • k {\ displaystyle k}k - константа.
  • log a ⁡ (x) {\ displaystyle \ log _ {a} \ left ({x} \ right)}{\ displaystyle \ log _ {a} \ left ({x} \ right)} is a логарифм с основанием, равным a {\ displaystyle a}a .

Если смотреть на распределение доходов населения, pi {\ displaystyle p_ {i}}p_ {i} равно отношению дохода конкретного человека к общий доход всего населения. Это дает наблюдаемую энтропию S Theil {\ displaystyle S _ {\ text {Theil}}}S _ {\ text {Theil}} популяции как:

S Theil = ∑ i = 1 N (xi N x ¯ пер ⁡ (N x ¯ xi)) {\ displaystyle S _ {\ text {Theil}} = \ sum _ {i = 1} ^ {N} \ left ({\ frac {x_ {i}} {N {\ bar {x}}}} \ ln \ left ({\ frac {N {\ bar {x}}} {x_ {i}}} \ right) \ right)}{\ displaystyle S _ {\ text {Theil}} = \ sum _ {i = 1} ^ {N} \ left ({\ frac {x_ {i}} {N {\ bar {x}}}) } \ ln \ left ({\ frac {N {\ bar {x}}} {x_ {i}}} \ right) \ right)}
где
  • xi {\ displaystyle x_ {i}}x_ {i} - доход конкретного человека.
  • (N x ¯) {\ displaystyle \ left (N {\ bar {x}} \ right)}{\ displaystyle \ left (N {\ bar {x}} \ right)} - общий доход всего населения, где
  • N {\ displaystyle N}N - количество особей в популяции.
  • x ¯ {\ displaystyle {\ bar {x}}}{\ bar {x} } («столбик x») - средний доход населения.
  • ln ⁡ (x) {\ displaystyle \ ln \ left (x \ right)}{\ displaystyle \ ln \ left (x \ right)} - натуральный логарифм из x {\ displaystyle x}x: (log e ⁡ (x)) {\ displaystyle \ left (\ log _ {e} \ left (x \ right) \ right) }{\ displaystyle \ left (\ log _ {e} \ left (x \ right) \ right)} .

Индекс Тейла TT {\ displaystyle T_ {T}}T_ {T} измеряет, насколько далеко наблюдаемая энтропия (S Theil {\ displaystyle S _ {\ text {Theil}}}S _ {\ text {Theil}} , который представляет, как случайным образом распределяется доход) происходит от максимально возможной энтропии (S max = ln ⁡ (N) {\ displaystyle S_ {\ text {max}} = \ ln \ left ({N} \ right)}{\ displaystyle S _ {\ text {max}} = \ ln \ left ({N} \ right)} , который представляет доход, максимально распределяемый среди людей в популяции - распределение, аналогичное [наиболее вероятному] результату бесконечное количество случайных подбрасываний монет: равное распределение орлов и решек). Следовательно, индекс Тейла - это разница между теоретической максимальной энтропией (которая была бы достигнута, если бы доходы всех людей были равны) минус наблюдаемая энтропия:

TT = S max - S Theil = ln ⁡ (N) - S Тейл {\ Displaystyle T_ {T} = S _ {\ text {max}} - S _ {\ text {Theil}} = \ ln \ left ({N} \ right) -S _ {\ text {Theil}}}{\ displaystyle T_ {T} = S _ {\ text {max}} - S _ {\ text {Theil}} = \ пер \ left ({N} \ right) -S _ {\ text {Theil}}}

. Когда x {\ displaystyle x}xвыражается в единицах населения / вида, S Theil {\ displaystyle S _ {\ text {Theil}}}S _ {\ text {Theil}} является мера биоразнообразия и называется индексом Шеннона. Если индекс Тейла используется с x = популяция / вид, это мера неравенства населения среди набора видов или «биоизоляция» в отличие от «изоляции богатства».

Индекс Тейла измеряет то, что в теории информации называется избыточностью. Это оставшееся «информационное пространство», которое не было использовано для передачи информации, что снижает эффективность ценового сигнала . Индекс Тейла - это показатель избыточности дохода (или другого показателя богатства) у некоторых людей. Избыточность у одних подразумевает дефицит у других. Высокий индекс Тейла указывает на то, что общий доход неравномерно распределяется между людьми, так же как несжатый текстовый файл не имеет аналогичного количества байтовых ячеек, назначенных доступным уникальным байтовым символам.

НотацияТеория информацииИндекс Тейла T T
N {\ displaystyle N}N количество уникальных символовколичество лиц
i {\ displaystyle i}я конкретный персонажконкретное лицо
xi {\ displaystyle x_ {i}}x_ {i} количество i-го символадоход i-го человека
N x ¯ {\ displaystyle N {\ bar {x}}}{\ displaystyle N {\ bar {x}}} общее количество символов в документеобщий доход населения
TT {\ displaystyle T_ {T}}T_ {T} неиспользуемые информационное пространствонеиспользованный потенциал в механизме ценообразования
сжатие данныхпрогрессивный налог

.

разложимость

Согласно Всемирному банку,

«Лучшее -известными мерами энтропии являются T Тейла (TT {\ displaystyle T_ {T}}T_ {T} ) и L Тейла (TL {\ displaystyle T_ {L}}T_ {L } ), оба из которых позволяют разложить неравенство на часть, обусловленную неравенством внутри районов (например, город, сельская местность), и часть, обусловленную различиями между районами (например, сельская местность). -городской разрыв в доходах). Обычно не менее трех четвертей неравенства в стране обусловлено внутригрупповым неравенством, а оставшаяся четверть - межгрупповыми различиями ".

Если население разделено на m {\ displaystyle m}m подгруппы и

  • si {\ displaystyle s_ {i}}s_ {i} - доля дохода группы i {\ displaystyle i}я ,
  • N {\ displaystyle N}N - общая численность населения, а N i {\ displaystyle N_ {i}}N_ {i} - численность группы i {\ displaystyle i}я ,
  • T i {\ displaystyle T_ {i}}T_ {i} - индекс Тейла для этой подгруппы,
  • x ¯ i {\ displaystyle {\ overline {x}} _ {i}}{\ overline {x}} _ {i} - средний доход в группе i {\ displaystyle i}я , а
  • μ {\ displaystyle \ mu}\ mu - средний доход населения,

затем T-индекс Тейла равно

TT = ∑ я = 1 msi T i + ∑ i = 1 msi ln ⁡ x ¯ i μ {\ displaystyle T_ {T} = \ sum _ {i = 1} ^ {m} s_ {i} T_ {i} + \ sum _ {i = 1} ^ {m} s_ {i} \ ln {\ frac {{\ overline {x}} _ {i}} {\ mu}}}{\ displaystyle T_ {T} = \ sum _ {i = 1} ^ {m} s_ {i} T_ {i} + \ sum _ {i = 1} ^ {m} s_ {i} \ ln {\ frac {{\ overline {x}} _ {i}} {\ mu}}} для si = N i N x ¯ я μ {\ displaystyle s_ {i} = {\ frac {N_ {i}} {N}} {\ frac {{\ overline {x}} _ {i}} {\ mu}}}{\ displaystyle s_ {i} = {\ frac {N_ {i}} {N}} {\ frac {{\ overline {x}} _ {i }} {\ mu}}}

Для Например, неравенство в Соединенных Штатах - это среднее неравенство в каждом штате, взвешенное по доходу штата, плюс неравенство между штатами.

Карта ec экономическое неравенство в США с использованием индекса Тейла. Высокий положительный индекс тейла указывает на больший доход, чем численность населения, в то время как отрицательное значение показывает, что население больше, чем доход. Нулевое значение показывает равенство между населением и доходом.
Примечание : Это изображение не является индексом Тейла в каждой области США, а представляет собой вклад в индекс Тейла для США по каждой области. Индекс Тейла всегда положительный, хотя индивидуальный вклад в индекс Тейла может быть отрицательным или положительным.

Декомпозиция индекса Тейла, которая определяет долю, приходящуюся на межрегиональный компонент, становится полезным инструментом для положительного анализа регионального неравенство, поскольку оно предполагает относительную важность пространственного измерения неравенства.

Т Тейла против Тейла L

И Т Тейла, и Тейла L разложимы. Разница между ними основана на той части распределения результатов, для которой каждый используется. Индексы неравенства в семействе обобщенной энтропии (GE) более чувствительны к различиям в долях доходов бедных или богатых, в зависимости от параметра, определяющего индекс GE. Чем меньше значение параметра для GE, тем больше он чувствителен к различиям в нижней части распределения.

GE (0) = L Тейла и более чувствителен к различиям в нижней части распределения. Его также называют мерой среднего логарифмического отклонения.
GE (1) = T Тейла и он более чувствителен к различиям в верхней части распределения.

Разложимость - это свойство индекс Тейла, который не предлагает более популярный коэффициент Джини. Коэффициент Джини более интуитивно понятен для многих людей, поскольку он основан на кривой Лоренца. Однако его нелегко разложить, как Тейла.

Приложения

Помимо множества экономических приложений, индекс Тейла применялся для оценки эффективности ирригационных систем и распределения программных показателей.

.

См. Также
Примечания
Ссылки
Внешние ссылки
  • Программное обеспечение:
    • Бесплатный онлайн-калькулятор вычисляет коэффициент Джини, строит кривую Лоренца и вычисляет многие другие меры концентрации для любого набора данных
    • Бесплатный калькулятор: Онлайн и загружаемые скрипты (Python и Lua ) для неравенств Аткинсона, Джини и Гувера
    • Пользователи программного обеспечения для анализа данных R могут установить пакет "ineq", который позволяет вычислять различные индексы неравенства, включая Gini, Atkinson, Theil.
    • A MATLAB Inequality Package, включая g код для вычисления индексов Джини, Аткинсона, Тейла и построения кривой Лоренца. Доступно множество примеров.
Последняя правка сделана 2021-06-11 07:53:48
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте