Межквартильное среднее (IQM) (или среднее значение ) - это статистический показатель центральная тенденция на основе усеченного среднего межквартильного диапазона. IQM очень похож на метод подсчета очков, используемый в видах спорта, которые оцениваются судейской коллегией: отбрасываются самые низкие и самые высокие оценки; вычислить среднее значение оставшихся оценок.
При вычислении IQM используются только данные между первым и третьим квартилями, а самые низкие 25% и самые высокие 25% данных отбрасываются.
при условии, что значения упорядочены.
Метод лучше всего пояснить на примере. Рассмотрим следующий набор данных:
Сначала отсортируйте список от самого низкого до самого высокого:
В наборе данных 12 наблюдений (точек данных), поэтому у нас есть 4 квартиля из 3 чисел. Отбросьте 3 наименьших и высших 3 значения:
Теперь у нас есть 6 из Осталось 12 наблюдений; Затем мы вычисляем среднее арифметическое среднее этих чисел:
Это межквартильное среднее.
Для сравнения, среднее арифметическое исходного набора данных равно
из-за сильного влияния выброса, 38.
Приведенный выше пример состоял из 12 наблюдений в наборе данных, что сделало определение квартилей очень легко. Конечно, не во всех наборах данных есть количество наблюдений, которое делится на 4. Мы можем скорректировать метод расчета IQM, чтобы учесть это. Итак, в идеале мы хотим, чтобы IQM был равен mean для симметричных распределений, например:
имеет среднее значение x mean = 3, и поскольку это симметричное распределение, было бы желательно x IQM = 3.
Мы можем решить эту проблему, используя средневзвешенное значение квартилей и межквартильного набора данных:
Рассмотрим следующий набор данных из 9 наблюдений:
9/4 = 2,25 наблюдения в каждом квартиле и 4,5 наблюдения в межквартильном диапазоне. Усеките дробный размер квартиля и удалите это число из 1-го и 4-го квартилей (2,25 наблюдения в каждом квартиле, таким образом, два самых низких и самые высокие 2 удаляются).
Таким образом, имеется 3 полных наблюдения в межквартильном диапазоне и 2 частичных наблюдения. Поскольку у нас всего 4,5 наблюдения в межквартильном диапазоне, каждое из двух дробных наблюдений составляет 0,75 (и, таким образом, 3 × 1 + 2 × 0,75 = 4,5 наблюдения).
Теперь IQM рассчитывается следующим образом:
В приведенном выше примере, среднее значение имеет значение x mean = 9. То же, что и IQM, как и ожидалось. Аналогичен метод расчета IQM для любого количества наблюдений; дробные вклады в IQM могут быть 0, 0,25, 0,50 или 0,75.
Межквартильное среднее разделяет некоторые свойства как среднего, так и медианы :