В статистике, то среднее абсолютное отклонение ( MAD) является надежной мерой изменчивости в виде однофакторного выборки количественных данных. Он также может относиться к параметру совокупности, который оценивается с помощью MAD, рассчитанного на основе выборки.
Для однофакторного набора данных X 1, X 2,..., Х п, СУМАШЕДШАЯ определяется как медиана из абсолютных отклонений от данных Медиана - х:
то есть, начиная с остатков (отклонений) от медианы данных, MAD - это медиана их абсолютных значений.
Рассмотрим данные (1, 1, 2, 2, 4, 6, 9). Он имеет медианное значение 2. Абсолютные отклонения около 2 равны (1, 1, 0, 0, 2, 4, 7), которые, в свою очередь, имеют среднее значение 1 (поскольку отсортированные абсолютные отклонения равны (0, 0, 1, 1, 2, 4, 7)). Таким образом, среднее абсолютное отклонение для этих данных равно 1.
Среднее абсолютное отклонение является мерой статистической дисперсии. Более того, MAD является надежной статистикой, более устойчивой к выбросам в наборе данных, чем стандартное отклонение. В стандартном отклонении расстояния от среднего возводятся в квадрат, поэтому большие отклонения имеют больший вес, и поэтому выбросы могут сильно влиять на него. В MAD отклонения небольшого количества выбросов не имеют значения.
Поскольку MAD является более надежной оценкой масштаба, чем выборочная дисперсия или стандартное отклонение, она лучше работает с распределениями без среднего или дисперсии, такими как распределение Коши.
MAD можно использовать аналогично тому, как можно использовать отклонение для среднего. Для того, чтобы использовать в качестве MAD последовательной оценки для оценки от стандартного отклонения, один принимает
где - постоянный масштабный коэффициент, который зависит от распределения.
Для нормально распределенных данных принято
то есть, обратная часть функции квантиля (также известная как обратная величина интегральной функции распределения ) для стандартного нормального распределения. Аргумент 3/4 таков, что покрывает 50% (от 1/4 до 3/4) стандартной нормальной кумулятивной функции распределения, т. Е.
Следовательно, мы должны иметь это
Заметив, что
у нас есть то, из чего мы получаем масштабный коэффициент.
Другой способ установить связь - отметить, что MAD равно медиане полунормального распределения :
Эта форма используется, например, для определения вероятной ошибки.
Подобно тому, как медиана обобщается на геометрическую медиану в многомерных данных, может быть построено геометрическое MAD, которое обобщает MAD. Учитывая двумерный парный набор данных (X 1, Y 1), (X 2, Y 2),..., (X n, Y n) и соответствующим образом рассчитанную геометрическую медиану, геометрическое медианное абсолютное отклонение определяется выражением:
Это дает тот же результат, что и одномерное MAD в одном измерении, и легко распространяется на более высокие измерения. В случае комплексных значений ( X + i Y) отношение MAD к стандартному отклонению не изменяется для нормально распределенных данных.
MAD совокупности определяется аналогично MAD выборки, но основывается на полном распределении, а не на выборке. Для симметричного распределения с нулевым средним значением MAD населения является 75-й процентиль распределения.
В отличие от дисперсии, которая может быть бесконечной или неопределенной, MAD совокупности всегда является конечным числом. Например, стандартное распределение Коши имеет неопределенную дисперсию, но его MAD равно 1.
Самое раннее известное упоминание о концепции MAD произошло в 1816 году в статье Карла Фридриха Гаусса об определении точности численных наблюдений.