Усеченное среднее

редактировать
Статистическая мера центральной тенденции

A усеченное среднее или усеченное среднее - это статистическая мера центральной тенденции, очень похожая на среднее и медианное. Он включает в себя вычисление среднего после отбрасывания заданных частей распределения вероятностей или выборки на верхнем и нижнем конце, и обычно отбрасывает равное количество обоих. Это количество отбрасываемых баллов обычно указывается в процентах от общего количества баллов, но также может быть дано как фиксированное количество баллов.

Для большинства статистических приложений отбрасывается от 5 до 25 процентов концов. Например, для набора из 8 точек при обрезке на 12,5% будут отброшены минимальное и максимальное значение в выборке: наименьшее и наибольшее значения, а также будет вычислено среднее значение оставшихся 6 точек. 25% усеченное среднее (когда отброшены самые низкие 25% и самые высокие 25%) известно как межквартильное среднее.

Медиана может рассматриваться как полностью усеченное среднее и является наиболее устойчивой. Как и в случае других усеченных оценок, основным преимуществом усеченного среднего является надежность и более высокая эффективность для смешанных распределений и распределения с тяжелыми хвостами (например, распределение Коши ), за счет более низкой эффективности для некоторых других распределений с меньшими хвостами (например, нормального распределения). Для промежуточных распределений разница между эффективностью среднего и медианы не очень велика, например для распределения Стьюдента с 2 степенями свободы дисперсии для среднего и медианного значения почти равны.

Содержание
  • 1 Терминология
  • 2 Интерполяция
  • 3 Преимущества
  • 4 Недостатки
  • 5 Статистические тесты
  • 6 Примеры
  • 7 См. Также
  • 8 Ссылки
Терминология

В некоторых регионах Центральной Европы оно также известно как Виндзорское среднее, но это имя не следует путать со Винсоризованным средним : в последнем случае наблюдения, которые отбрасывается усеченным средним, вместо этого заменяются наибольшим / наименьшим из оставшихся значений.

Отбрасывание только максимума и минимума известно как модифицированное среднее, особенно в статистике управления. Это также известно как олимпийский средний (например, в сельском хозяйстве США, как Выбор среднего дохода от урожая ) из-за его использования в олимпийских соревнованиях, таких как ISU Система судейства в фигурном катании, чтобы сделать оценку устойчивой к одному судье с отклонением.

Интерполяция

Когда процент отбрасываемых очков не дает целое число, усеченное среднее значение может быть определено путем интерполяции, обычно линейной интерполяции, между ближайшими целыми числами. Например, если вам нужно вычислить 15% усеченное среднее для выборки, содержащей 10 записей, строго это будет означать отбрасывание по одной точке с каждого конца (что эквивалентно 10% усеченному среднему). При интерполяции можно было бы вместо этого вычислить 10% усеченное среднее (отбрасывая по 1 точке с каждого конца) и 20% усеченное среднее (отбрасывая 2 точки с каждого конца), а затем интерполировать, в данном случае усредняя эти два значения. Точно так же, если интерполировать 12% усеченное среднее, нужно взять средневзвешенное : 10% усеченное среднее значение взвешено на 0,8, а 20% усеченное среднее - на 0,2.

Преимущества

Усеченное среднее является полезным средством оценки, поскольку оно менее чувствительно к выбросам, чем среднее, но все же дает разумную оценку центральной тенденции или среднего для многих статистические модели. В этом отношении он упоминается как надежный блок оценки. Например, при использовании в олимпийском судействе усечение максимума и минимума не позволяет единоличному судье увеличивать или понижать общую оценку, выставляя исключительно высокую или низкую оценку.

Одной из ситуаций, в которой может быть выгодно использовать усеченное среднее значение, является оценка параметра местоположения из распределения Коши, колоколообразного распределения вероятностей с (много) более толстые хвосты, чем у нормального распределения. Можно показать, что усеченное среднее среднего 24% выборки статистика порядка (т. Е. Усечение выборки на 38% на каждом конце) дает оценку для параметра местоположения населения, которая более эффективна, чем использование любого медиана выборки или среднее значение полной выборки. Однако из-за толстых хвостов распределения Коши эффективность средства оценки снижается по мере того, как в оценке используется больше выборки. Обратите внимание, что для распределения Коши ни усеченное среднее, ни среднее значение полной выборки, ни медиана выборки не представляют собой оценку максимального правдоподобия и не являются столь же асимптотически эффективными, как оценка максимального правдоподобия; однако оценку максимального правдоподобия труднее вычислить, поэтому в качестве полезной альтернативы остается усеченное среднее значение.

Недостатки

Усеченное среднее использует больше информации из распределения или выборки, чем медиана, но если базовое распределение не является симметричным, усеченное среднее значение выборки вряд ли даст несмещенную оценку либо для среднего, либо для медиана.

Статистические тесты

Можно выполнить t-критерий Стьюдента на основе усеченного среднего, который называется t-критерием Юэна, который также имеет несколько реализаций в R.

Примеры

Метод подсчета очков, используемый во многих видах спорта, которые оцениваются судейской коллегией, представляет собой усеченное среднее значение: отбрасывать самые низкие и самые высокие оценки; рассчитать среднее значение оставшихся оценок.

Контрольная процентная ставка Libor рассчитана как усеченное среднее значение: при 18 ответах верхние 4 и нижние 4 являются отбрасываются, а оставшиеся 10 усредняются (коэффициент обрезки составляет 4/18 ≈ 22%).

Рассмотрим набор данных, состоящий из:

{92, 19, 101, 58, 1053, 91, 26, 78, 10, 13, -40, 101, 86, 85, 15, 89, 89, 28, −5, 41} (N = 20, среднее значение = 101,5)

5-й процентиль (-6,75) находится между -40 и -5, а 95-й процентиль (148,6) находится между 101 и 1053 ( значения выделены жирным шрифтом). Тогда усеченное на 5% среднее приведет к следующему:

{92, 19, 101, 58, 91, 26, 78, 10, 13, 101, 86, 85, 15, 89, 89, 28, - 5, 41} (N = 18, среднее = 56,5)

Этот пример можно сравнить с примером, использующим процедуру Winsorising.

См. Также
Ссылки
=== !!! == html
Последняя правка сделана 2021-06-11 12:56:32
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте