Среднее абсолютное отклонение

редактировать

Для более широкого освещения этой темы см. Среднее абсолютное отклонение.

В статистике, то среднее абсолютное отклонение ( MAD) является надежной мерой изменчивости в виде однофакторного выборки количественных данных. Он также может относиться к параметру совокупности, который оценивается с помощью MAD, рассчитанного на основе выборки.

Для однофакторного набора данных X 1, X 2,..., Х п, СУМАШЕДШАЯ определяется как медиана из абсолютных отклонений от данных Медиана - х: ${\ Displaystyle {\ тильда {X}} = \ operatorname {median} (X)}$ ${\ Displaystyle {\ тильда {X}} = \ operatorname {median} (X)}$

{\ displaystyle \ operatorname {MAD} = \ operatorname {median} (| X_ {i} - {\ tilde {X}} |)}

{\ displaystyle \ operatorname {MAD} = \ operatorname {median} (| X_ {i} - {\ tilde {X}} |)}

то есть, начиная с остатков (отклонений) от медианы данных, MAD - это медиана их абсолютных значений.

СОДЕРЖАНИЕ

1 Пример
2 использования
3 Отношение к стандартному отклонению
4 Абсолютное отклонение геометрической медианы
5 Население MAD
6 См. Также
7 Примечания
8 ссылки

Пример

Рассмотрим данные (1, 1, 2, 2, 4, 6, 9). Он имеет медианное значение 2. Абсолютные отклонения около 2 равны (1, 1, 0, 0, 2, 4, 7), которые, в свою очередь, имеют среднее значение 1 (поскольку отсортированные абсолютные отклонения равны (0, 0, 1, 1, 2, 4, 7)). Таким образом, среднее абсолютное отклонение для этих данных равно 1.

Использует

Среднее абсолютное отклонение является мерой статистической дисперсии. Более того, MAD является надежной статистикой, более устойчивой к выбросам в наборе данных, чем стандартное отклонение. В стандартном отклонении расстояния от среднего возводятся в квадрат, поэтому большие отклонения имеют больший вес, и поэтому выбросы могут сильно влиять на него. В MAD отклонения небольшого количества выбросов не имеют значения.

Поскольку MAD является более надежной оценкой масштаба, чем выборочная дисперсия или стандартное отклонение, она лучше работает с распределениями без среднего или дисперсии, такими как распределение Коши.

Отношение к стандартному отклонению

MAD можно использовать аналогично тому, как можно использовать отклонение для среднего. Для того, чтобы использовать в качестве MAD последовательной оценки для оценки от стандартного отклонения, один принимает ${\ displaystyle \ sigma}$ $\сигма$

{\ displaystyle {\ hat {\ sigma}} = k \ cdot \ operatorname {MAD},}

{\ displaystyle {\ hat {\ sigma}} = k \ cdot \ operatorname {MAD},}

где - постоянный масштабный коэффициент, который зависит от распределения. ${\ displaystyle k}$ $k$

Для нормально распределенных данных принято ${\ displaystyle k}$ $k$

{\ Displaystyle к = 1 / \ влево (\ Phi ^ {- 1} (3/4) \ вправо) \ приблизительно 1,4826,}

{\ Displaystyle к = 1 / \ влево (\ Phi ^ {- 1} (3/4) \ вправо) \ приблизительно 1,4826,}

то есть, обратная часть функции квантиля (также известная как обратная величина интегральной функции распределения ) для стандартного нормального распределения. Аргумент 3/4 таков, что покрывает 50% (от 1/4 до 3/4) стандартной нормальной кумулятивной функции распределения, т. Е. ${\ displaystyle \ Phi ^ {- 1}}$ $\ Phi ^ {- 1}$ ${\ Displaystyle Z = (X- \ mu) / \ sigma}$ ${\ Displaystyle Z = (X- \ mu) / \ sigma}$ ${\ displaystyle \ pm \ operatorname {MAD}}$ ${\ displaystyle \ pm \ operatorname {MAD}}$

{\ Displaystyle {\ frac {1} {2}} = P (| X- \ mu | \ leq \ operatorname {MAD}) = P \ left (\ left | {\ frac {X- \ mu} {\ sigma }} \ right | \ leq {\ frac {\ operatorname {MAD}} {\ sigma}} \ right) = P \ left (| Z | \ leq {\ frac {\ operatorname {MAD}} {\ sigma}} \верно).}

{\ Displaystyle {\ frac {1} {2}} = P (| X- \ mu | \ leq \ operatorname {MAD}) = P \ left (\ left | {\ frac {X- \ mu} {\ sigma }} \ right | \ leq {\ frac {\ operatorname {MAD}} {\ sigma}} \ right) = P \ left (| Z | \ leq {\ frac {\ operatorname {MAD}} {\ sigma}} \верно).}

Следовательно, мы должны иметь это

{\ displaystyle \ Phi \ left (\ operatorname {MAD} / \ sigma \ right) - \ Phi \ left (- \ operatorname {MAD} / \ sigma \ right) = 1/2.}

{\ displaystyle \ Phi \ left (\ operatorname {MAD} / \ sigma \ right) - \ Phi \ left (- \ operatorname {MAD} / \ sigma \ right) = 1/2.}

Заметив, что

{\ Displaystyle \ Phi \ left (- \ OperatorName {MAD} / \ sigma \ right) = 1- \ Phi \ left (\ Operatorname {MAD} / \ sigma \ right),}

{\ Displaystyle \ Phi \ left (- \ OperatorName {MAD} / \ sigma \ right) = 1- \ Phi \ left (\ Operatorname {MAD} / \ sigma \ right),}

у нас есть то, из чего мы получаем масштабный коэффициент. ${\ Displaystyle \ OperatorName {MAD} / \ sigma = \ Phi ^ {- 1} (3/4) = 0,67449}$ ${\ Displaystyle \ OperatorName {MAD} / \ sigma = \ Phi ^ {- 1} (3/4) = 0,67449}$ ${\ Displaystyle к = 1 / \ Phi ^ {- 1} (3/4) = 1,4826}$ ${\ Displaystyle к = 1 / \ Phi ^ {- 1} (3/4) = 1,4826}$

Другой способ установить связь - отметить, что MAD равно медиане полунормального распределения :

{\ displaystyle \ operatorname {MAD} = \ sigma {\ sqrt {2}} \ operatorname {erf} ^ {- 1} (1/2) \ приблизительно 0,67449 \ sigma.}

{\ displaystyle \ operatorname {MAD} = \ sigma {\ sqrt {2}} \ operatorname {erf} ^ {- 1} (1/2) \ приблизительно 0,67449 \ sigma.}

Эта форма используется, например, для определения вероятной ошибки.

Абсолютное отклонение геометрической медианы

Подобно тому, как медиана обобщается на геометрическую медиану в многомерных данных, может быть построено геометрическое MAD, которое обобщает MAD. Учитывая двумерный парный набор данных (X 1, Y 1), (X 2, Y 2),..., (X n, Y n) и соответствующим образом рассчитанную геометрическую медиану, геометрическое медианное абсолютное отклонение определяется выражением: ${\ Displaystyle ({\ тильда {X}}, {\ тильда {Y}})}$ ${\ Displaystyle ({\ тильда {X}}, {\ тильда {Y}})}$

${\ displaystyle \ operatorname {MAD} = {\ Bigl (} \ operatorname {median} (| X_ {i} - {\ tilde {X}} |) ^ {2} + \ operatorname {median} (| Y_ {i } - {\ tilde {Y}} |) ^ {2} {\ Bigr)} ^ {1/2}}$ ${\ displaystyle \ operatorname {MAD} = {\ Bigl (} \ operatorname {median} (| X_ {i} - {\ tilde {X}} |) ^ {2} + \ operatorname {median} (| Y_ {i } - {\ tilde {Y}} |) ^ {2} {\ Bigr)} ^ {1/2}}$

Это дает тот же результат, что и одномерное MAD в одном измерении, и легко распространяется на более высокие измерения. В случае комплексных значений ( X + i Y) отношение MAD к стандартному отклонению не изменяется для нормально распределенных данных.

Население MAD

MAD совокупности определяется аналогично MAD выборки, но основывается на полном распределении, а не на выборке. Для симметричного распределения с нулевым средним значением MAD населения является 75-й процентиль распределения.

В отличие от дисперсии, которая может быть бесконечной или неопределенной, MAD совокупности всегда является конечным числом. Например, стандартное распределение Коши имеет неопределенную дисперсию, но его MAD равно 1.

Самое раннее известное упоминание о концепции MAD произошло в 1816 году в статье Карла Фридриха Гаусса об определении точности численных наблюдений.

Смотрите также

Заметки

Рекомендации

Хоглин, Дэвид С.; Фредерик Мостеллер; Джон У. Тьюки (1983). Понимание надежного и исследовательского анализа данных. Джон Вили и сыновья. С. 404–414. ISBN 978-0-471-09777-8.
Russell, Roberta S.; Бернард В. Тейлор III (2006). Операционный менеджмент. Джон Вили и сыновья. С. 497–498. ISBN 978-0-471-69209-6.
Venables, WN; Б.Д. Рипли (1999). Современная прикладная статистика с S-PLUS. Springer. п. 128. ISBN 978-0-387-98825-2.