Среднее абсолютное отклонение

редактировать
Для более широкого освещения этой темы см. Среднее абсолютное отклонение.

В статистике, то среднее абсолютное отклонение ( MAD) является надежной мерой изменчивости в виде однофакторного выборки количественных данных. Он также может относиться к параметру совокупности, который оценивается с помощью MAD, рассчитанного на основе выборки.

Для однофакторного набора данных X 1,  X 2,...,  Х п, СУМАШЕДШАЯ определяется как медиана из абсолютных отклонений от данных Медиана - х: Икс ~ знак равно медиана ( Икс ) {\ Displaystyle {\ тильда {X}} = \ operatorname {median} (X)}

БЕЗ УМА знак равно медиана ( | Икс я - Икс ~ | ) {\ displaystyle \ operatorname {MAD} = \ operatorname {median} (| X_ {i} - {\ tilde {X}} |)}

то есть, начиная с остатков (отклонений) от медианы данных, MAD - это медиана их абсолютных значений.

СОДЕРЖАНИЕ
  • 1 Пример
  • 2 использования
  • 3 Отношение к стандартному отклонению
  • 4 Абсолютное отклонение геометрической медианы
  • 5 Население MAD
  • 6 См. Также
  • 7 Примечания
  • 8 ссылки
Пример

Рассмотрим данные (1, 1, 2, 2, 4, 6, 9). Он имеет медианное значение 2. Абсолютные отклонения около 2 равны (1, 1, 0, 0, 2, 4, 7), которые, в свою очередь, имеют среднее значение 1 (поскольку отсортированные абсолютные отклонения равны (0, 0, 1, 1, 2, 4, 7)). Таким образом, среднее абсолютное отклонение для этих данных равно 1.

Использует

Среднее абсолютное отклонение является мерой статистической дисперсии. Более того, MAD является надежной статистикой, более устойчивой к выбросам в наборе данных, чем стандартное отклонение. В стандартном отклонении расстояния от среднего возводятся в квадрат, поэтому большие отклонения имеют больший вес, и поэтому выбросы могут сильно влиять на него. В MAD отклонения небольшого количества выбросов не имеют значения.

Поскольку MAD является более надежной оценкой масштаба, чем выборочная дисперсия или стандартное отклонение, она лучше работает с распределениями без среднего или дисперсии, такими как распределение Коши.

Отношение к стандартному отклонению

MAD можно использовать аналогично тому, как можно использовать отклонение для среднего. Для того, чтобы использовать в качестве MAD последовательной оценки для оценки от стандартного отклонения, один принимает σ {\ displaystyle \ sigma}

σ ^ знак равно k БЕЗ УМА , {\ displaystyle {\ hat {\ sigma}} = k \ cdot \ operatorname {MAD},}

где - постоянный масштабный коэффициент, который зависит от распределения. k {\ displaystyle k}

Для нормально распределенных данных принято k {\ displaystyle k}

k знак равно 1 / ( Φ - 1 ( 3 / 4 ) ) 1,4826 , {\ Displaystyle к = 1 / \ влево (\ Phi ^ {- 1} (3/4) \ вправо) \ приблизительно 1,4826,}

то есть, обратная часть функции квантиля (также известная как обратная величина интегральной функции распределения ) для стандартного нормального распределения. Аргумент 3/4 таков, что покрывает 50% (от 1/4 до 3/4) стандартной нормальной кумулятивной функции распределения, т. Е. Φ - 1 {\ displaystyle \ Phi ^ {- 1}} Z знак равно ( Икс - μ ) / σ {\ Displaystyle Z = (X- \ mu) / \ sigma} ± БЕЗ УМА {\ displaystyle \ pm \ operatorname {MAD}}

1 2 знак равно п ( | Икс - μ | БЕЗ УМА ) знак равно п ( | Икс - μ σ | БЕЗ УМА σ ) знак равно п ( | Z | БЕЗ УМА σ ) . {\ Displaystyle {\ frac {1} {2}} = P (| X- \ mu | \ leq \ operatorname {MAD}) = P \ left (\ left | {\ frac {X- \ mu} {\ sigma }} \ right | \ leq {\ frac {\ operatorname {MAD}} {\ sigma}} \ right) = P \ left (| Z | \ leq {\ frac {\ operatorname {MAD}} {\ sigma}} \верно).}

Следовательно, мы должны иметь это

Φ ( БЕЗ УМА / σ ) - Φ ( - БЕЗ УМА / σ ) знак равно 1 / 2. {\ displaystyle \ Phi \ left (\ operatorname {MAD} / \ sigma \ right) - \ Phi \ left (- \ operatorname {MAD} / \ sigma \ right) = 1/2.}

Заметив, что

Φ ( - БЕЗ УМА / σ ) знак равно 1 - Φ ( БЕЗ УМА / σ ) , {\ Displaystyle \ Phi \ left (- \ OperatorName {MAD} / \ sigma \ right) = 1- \ Phi \ left (\ Operatorname {MAD} / \ sigma \ right),}

у нас есть то, из чего мы получаем масштабный коэффициент. БЕЗ УМА / σ знак равно Φ - 1 ( 3 / 4 ) знак равно 0,67449 {\ Displaystyle \ OperatorName {MAD} / \ sigma = \ Phi ^ {- 1} (3/4) = 0,67449} k знак равно 1 / Φ - 1 ( 3 / 4 ) знак равно 1,4826 {\ Displaystyle к = 1 / \ Phi ^ {- 1} (3/4) = 1,4826}

Другой способ установить связь - отметить, что MAD равно медиане полунормального распределения :

БЕЗ УМА знак равно σ 2 Эрф - 1 ( 1 / 2 ) 0,67449 σ . {\ displaystyle \ operatorname {MAD} = \ sigma {\ sqrt {2}} \ operatorname {erf} ^ {- 1} (1/2) \ приблизительно 0,67449 \ sigma.}

Эта форма используется, например, для определения вероятной ошибки.

Абсолютное отклонение геометрической медианы

Подобно тому, как медиана обобщается на геометрическую медиану в многомерных данных, может быть построено геометрическое MAD, которое обобщает MAD. Учитывая двумерный парный набор данных (X 1, Y 1), (X 2, Y 2),..., (X n, Y n) и соответствующим образом рассчитанную геометрическую медиану, геометрическое медианное абсолютное отклонение определяется выражением: ( Икс ~ , Y ~ ) {\ Displaystyle ({\ тильда {X}}, {\ тильда {Y}})}

БЕЗ УМА знак равно ( медиана ( | Икс я - Икс ~ | ) 2 + медиана ( | Y я - Y ~ | ) 2 ) 1 / 2 {\ displaystyle \ operatorname {MAD} = {\ Bigl (} \ operatorname {median} (| X_ {i} - {\ tilde {X}} |) ^ {2} + \ operatorname {median} (| Y_ {i } - {\ tilde {Y}} |) ^ {2} {\ Bigr)} ^ {1/2}}

Это дает тот же результат, что и одномерное MAD в одном измерении, и легко распространяется на более высокие измерения. В случае комплексных значений ( X + i Y) отношение MAD к стандартному отклонению не изменяется для нормально распределенных данных.

Население MAD

MAD совокупности определяется аналогично MAD выборки, но основывается на полном распределении, а не на выборке. Для симметричного распределения с нулевым средним значением MAD населения является 75-й процентиль распределения.

В отличие от дисперсии, которая может быть бесконечной или неопределенной, MAD совокупности всегда является конечным числом. Например, стандартное распределение Коши имеет неопределенную дисперсию, но его MAD равно 1.

Самое раннее известное упоминание о концепции MAD произошло в 1816 году в статье Карла Фридриха Гаусса об определении точности численных наблюдений.

Смотрите также
Заметки
Рекомендации
  • Хоглин, Дэвид С.; Фредерик Мостеллер; Джон У. Тьюки (1983). Понимание надежного и исследовательского анализа данных. Джон Вили и сыновья. С. 404–414. ISBN   978-0-471-09777-8.
  • Russell, Roberta S.; Бернард В. Тейлор III (2006). Операционный менеджмент. Джон Вили и сыновья. С.  497–498. ISBN   978-0-471-69209-6.
  • Venables, WN; Б.Д. Рипли (1999). Современная прикладная статистика с S-PLUS. Springer. п. 128. ISBN   978-0-387-98825-2.
Последняя правка сделана 2024-01-02 04:36:48
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте