Индекс несходства - это демографический показатель равномерности, с которой два группы распределены по составляющим географическим областям, составляющим большую территорию. Показатель индекса также можно интерпретировать как процент одной из двух групп, включенных в расчет, которые должны были бы переместиться в разные географические области, чтобы получить распределение, соответствующее распределению в большей области. Индекс несходства может использоваться как показатель сегрегации.
Содержание
- 1 Базовая формула
- 2 Перспектива линейной алгебры
- 2.1 Числовой пример
- 2.2 Эквивалентность формул
- 2.3 Нулевое разделение
- 3 См. Также
- 4 Ссылки
- 5 Внешние ссылки
Основная формула
Основная формула для индекса несходства:
где (например, сравнивая черно-белое население):
- ai= население группы A в i области, например участок переписи
- A = общая численность населения в группе A в крупном географическом объекте, для которого рассчитывается индекс несходства.
- bi= население группы B в i-м районе
- B = общая популяция в группе B в крупном географическом объекте, для которого рассчитывается индекс несходства.
Индекс несходства применим к любой категориальной переменной (демографической или нет) и потому что Его простых свойств полезны для ввода в программы многомерного масштабирования и кластеризации. Он широко использовался в исследовании социальной мобильности для сравнения распределения профессиональных категорий происхождения (или назначения).
Перспектива линейной алгебры
Формулу для индекса несходства можно сделать гораздо более компактной и содержательной, если рассматривать ее с точки зрения линейной алгебры. Предположим, мы изучаем распределение богатых и бедных людей в городе (например, Лондон ). Предположим, наш город содержит блоков:
Давайте создадим вектор который показывает количество богатых людей в каждом квартале нашего города:
Аналогично, давайте создадим вектор , который показывает количество бедных в каждом квартале нашего города. :
Теперь -норма вектора - это просто сумма (величина) каждой записи в этом векторе. То есть для вектора , у нас есть -norm:
Если мы обозначим как общее количество богатых людей в нашем городе, чем компактный способ вычислить - использовать -норма:
Аналогично, если мы обозначим как общее количество бедных в нашем городе, тогда:
Когда мы делим вектор по его норме, мы получаем так называемый нормализованный вектор или Единичный вектор :
Давайте нормализуем богатый вектор и плохой вектор :
Наконец, мы возвращаемся к формуле для индекса несходства (); оно просто равно половине -нормы разности векторов и :
Индекс несходства . (в линейной алгебраической обозначение)
Числовой пример
Рассмотрим город, состоящий из четырех кварталов по 2 человека в каждом. Один блок состоит из 2 богатых людей. Один блок состоит из 2 бедняков. Два блока состоят из 1 богатого и 1 бедного человека. Каков показатель непохожести этого города?
В нашем вымышленном городе 4 квартала: в одном - 2 богатых человека; в другом 2 бедных человека; и два блока, содержащие 1 богатый и 1 бедный.
Во-первых, давайте найдем богатый вектор и бедный вектор :
Затем давайте посчитаем общее количество богатых и бедных людей в нашем городе:
Затем нормализуем векторы богатых и бедных:
Теперь мы можем вычислить разница :
Наконец, давайте найдем индекс несходства ():
Эквивалентность формул
Мы можем доказать, что формула линейной алгебры для идентична базовой формуле для . Начнем с формулы линейной алгебры:
Давайте замените нормализованные векторы и на:
Наконец, из определения -нормы мы знаем, что можем заменить ее суммированием:
Таким образом, мы доказываем, что формула линейной алгебры для индекса несходства эквивалентна основной формуле для него:
Нулевая сегрегация
Когда индекс несходства равен нулю, это означает, что в изучаемом нами сообществе отсутствует сегрегация. Например, если мы изучаем разделение богатых и бедных в городе, то если , это означает, что:
- Нет кварталы в городе, которые являются «богатыми кварталами», и в городе нет кварталов, которые являются «бедными кварталами»
- Существует однородное распределение богатых и бедных людей по всему городу
Если мы установим в линейной алгебраической формуле, мы получаем необходимое условие для нулевой сегрегации:
Например, предположим, что у вас есть город с двумя кварталами. В каждом блоке 4 богатых и 100 бедных:
Тогда общее количество богатых людей будет , и общее количество бедных составляет . Таким образом:
Поскольку , поэтому в этом городе нет сегрегации.
В качестве другого примера предположим, что у вас есть город из 3 кварталов:
Тогда мы имеем богатые люди в нашем городе и бедные люди. Таким образом:
Опять же, потому что , таким образом, в этом городе также отсутствует сегрегация.
См. Также
Ссылки
Внешние ссылки