Межквартильное среднее

редактировать

Межквартильное среднее (IQM) (или среднее значение ) - это статистический показатель центральная тенденция на основе усеченного среднего межквартильного диапазона. IQM очень похож на метод подсчета очков, используемый в видах спорта, которые оцениваются судейской коллегией: отбрасываются самые низкие и самые высокие оценки; вычислить среднее значение оставшихся оценок.

Содержание

  • 1 Расчет
  • 2 Примеры
    • 2.1 Размер набора данных, делимый на четыре
    • 2.2 Размер набора данных, не делимый на четыре
  • 3 Сравнение со средним и медианным значением
  • 4 См. Также
    • 4.1 Связанная статистика
    • 4.2 Приложения

Расчет

При вычислении IQM используются только данные между первым и третьим квартилями, а самые низкие 25% и самые высокие 25% данных отбрасываются.

х IQM = 2 N ∑ я знак равно N 4 + 1 3 n 4 xi {\ displaystyle x _ {\ mathrm {IQM}} = {2 \ over n} \ sum _ {i = {\ frac {n} { 4}} + 1} ^ {\ frac {3n} {4}} {x_ {i}}}x _ {{\ mathrm {IQM}}} = {2 \ over n} \ sum _ {{i = {\ frac {n} {4}} + 1}} ^ {{{\ frac {3n} {4 }}}} {x_ {i}}

при условии, что значения упорядочены.

Примеры

Размер набора данных делится на четыре

Метод лучше всего пояснить на примере. Рассмотрим следующий набор данных:

5, 8, 4, 38, 8, 6, 9, 7, 7, 3, 1, 6

Сначала отсортируйте список от самого низкого до самого высокого:

1, 3, 4, 5, 6, 6, 7, 7, 8, 8, 9, 38

В наборе данных 12 наблюдений (точек данных), поэтому у нас есть 4 квартиля из 3 чисел. Отбросьте 3 наименьших и высших 3 значения:

1, 3, 4, 5, 6, 6, 7, 7, 8, 8, 9, 38

Теперь у нас есть 6 из Осталось 12 наблюдений; Затем мы вычисляем среднее арифметическое среднее этих чисел:

xIQM = (5 + 6 + 6 + 7 + 7 + 8) / 6 = 6.5

Это межквартильное среднее.

Для сравнения, среднее арифметическое исходного набора данных равно

(5 + 8 + 4 + 38 + 8 + 6 + 9 + 7 + 7 + 3 + 1 + 6) / 12 = 8.5

из-за сильного влияния выброса, 38.

Размер набора данных не делится на четыре

Приведенный выше пример состоял из 12 наблюдений в наборе данных, что сделало определение квартилей очень легко. Конечно, не во всех наборах данных есть количество наблюдений, которое делится на 4. Мы можем скорректировать метод расчета IQM, чтобы учесть это. Итак, в идеале мы хотим, чтобы IQM был равен mean для симметричных распределений, например:

1, 2, 3, 4, 5

имеет среднее значение x mean = 3, и поскольку это симметричное распределение, было бы желательно x IQM = 3.

Мы можем решить эту проблему, используя средневзвешенное значение квартилей и межквартильного набора данных:

Рассмотрим следующий набор данных из 9 наблюдений:

1, 3, 5, 7, 9, 11, 13, 15, 17

9/4 = 2,25 наблюдения в каждом квартиле и 4,5 наблюдения в межквартильном диапазоне. Усеките дробный размер квартиля и удалите это число из 1-го и 4-го квартилей (2,25 наблюдения в каждом квартиле, таким образом, два самых низких и самые высокие 2 удаляются).

1, 3, (5), 7, 9, 11, (13), 15, 17

Таким образом, имеется 3 полных наблюдения в межквартильном диапазоне и 2 частичных наблюдения. Поскольку у нас всего 4,5 наблюдения в межквартильном диапазоне, каждое из двух дробных наблюдений составляет 0,75 (и, таким образом, 3 × 1 + 2 × 0,75 = 4,5 наблюдения).

Теперь IQM рассчитывается следующим образом:

xIQM = {(7 + 9 + 11) + 0,75 × (5 + 13)} / 4,5 = 9

В приведенном выше примере, среднее значение имеет значение x mean = 9. То же, что и IQM, как и ожидалось. Аналогичен метод расчета IQM для любого количества наблюдений; дробные вклады в IQM могут быть 0, 0,25, 0,50 или 0,75.

Сравнение со средним значением и медианой

Межквартильное среднее разделяет некоторые свойства как среднего, так и медианы :

  • Как и медиана, IQM нечувствителен к выбросам ; в приведенном примере наибольшее значение (38) было очевидным выбросом из набора данных, но его значение не используется при вычислении IQM. С другой стороны, общее среднее (среднее арифметическое ) чувствительно к этим выбросам: x среднее = 8,5.
  • Как и среднее, IQM является отдельным параметром, основанным на большом количестве наблюдений из набора данных. Медиана всегда равна одному из наблюдений в наборе данных (при условии нечетного числа наблюдений). Среднее значение может быть равно любому значению между самым низким и самым высоким наблюдением, в зависимости от значения всех других наблюдений. IQM может быть равно любому значению между первым и третьим квартилями, в зависимости от всех наблюдений в межквартильном диапазоне.

См. Также

Связанная статистика

Applications

  • Лондонская межбанковская ставка предложения оценивает эталонную процентную ставку как межквартильное среднее из ставок, предлагаемых несколькими банками.
  • Everything2 использует межквартильное среднее репутаций пользователей для определения качества вклада пользователя. [1]
Последняя правка сделана 2021-05-24 05:05:13
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте