Среднее абсолютное отклонение

редактировать

Среднее абсолютное отклонение или Среднее абсолютное отклонение (MAD ) набора данных - это среднее из абсолютных отклонений от центральной точки. Это сводная статистика статистической дисперсии или изменчивости. В общем виде центральной точкой может быть среднее, медиана, мода или результат любой другой меры центральной тенденции или любой случайной точки данных, относящейся к данному набору данных. Абсолютные значения различий между точками данных и их центральная тенденция суммируются и делятся на количество точек данных.

Содержание
  • 1 Меры дисперсии
  • 2 Среднее абсолютное отклонение около центральной точки
    • 2.1 Среднее абсолютное отклонение около среднего
    • 2.2 Среднее абсолютное отклонение около медианы
  • 3 Среднее абсолютное отклонение около центральная точка
    • 3.1 Среднее абсолютное отклонение около среднего
    • 3.2 Среднее абсолютное отклонение около медианы
  • 4 Максимальное абсолютное отклонение
  • 5 Минимизация
  • 6 Оценка
  • 7 См. также
  • 8 Ссылки
  • 9 Внешние ссылки
Меры дисперсии

Некоторые меры статистической дисперсии определены в терминах абсолютного отклонения. Термин «среднее абсолютное отклонение» не однозначно определяет меру статистической дисперсии, так как есть несколько показателей, которые можно использовать для измерения абсолютных отклонений, и есть несколько показателей центральной тенденции это тоже можно использовать. Таким образом, для однозначной идентификации абсолютного отклонения необходимо указать как меру отклонения, так и меру центральной тенденции. К сожалению, в статистической литературе еще не приняты стандартные обозначения, так как среднее абсолютное отклонение около среднего и среднее абсолютное отклонение около медианы были обозначены инициалами "MAD". "в литературе, что может привести к путанице, поскольку в целом они могут иметь значения, значительно отличающиеся друг от друга.

Среднее абсолютное отклонение вокруг центральной точки

Среднее абсолютное отклонение набора {x 1, x 2,..., x n } равно

1 n ∑ i = 1 n | х i - m (X) |. {\ displaystyle {\ frac {1} {n}} \ sum _ {i = 1} ^ {n} | x_ {i} -m (X) |.}\ frac {1} {n} \ sum_ {i = 1} ^ n | x_i-m (X) |.

Выбор меры центральной тенденции, m (X) {\ displaystyle m (X)}м (X) , оказывает заметное влияние на значение среднего отклонения. Например, для набора данных {2, 2, 3, 4, 14}:

Мера центральной тенденции m (X) {\ displaystyle m (X)}м (X) Среднее абсолютное отклонение
Среднее = 5| 2 - 5 | + | 2 - 5 | + | 3 - 5 | + | 4 - 5 | + | 14 - 5 | 5 = 3,6 {\ displaystyle {\ frac {| 2-5 | + | 2-5 | + | 3-5 | + | 4-5 | + | 14-5 |} {5}} = 3,6}\ frac {| 2 - 5 | + | 2 - 5 | + | 3-5 | + | 4 - 5 | + | 14–5 |} {5} = 3,6
Медиана = 3| 2 - 3 | + | 2 - 3 | + | 3 - 3 | + | 4 - 3 | + | 14 - 3 | 5 = 2,8 {\ displaystyle {\ frac {| 2-3 | + | 2-3 | + | 3-3 | + | 4-3 | + | 14-3 |} {5}} = 2,8}\ frac {| 2 - 3 | + | 2 - 3 | + | 3 - 3 | + | 4 - 3 | + | 14 - 3 |} {5} = 2,8
Mode = 2| 2 - 2 | + | 2 - 2 | + | 3 - 2 | + | 4 - 2 | + | 14 - 2 | 5 = 3,0 {\ displaystyle {\ frac {| 2-2 | + | 2-2 | + | 3-2 | + | 4-2 | + | 14-2 |} {5}} = 3,0}\ frac {| 2 - 2 | + | 2 - 2 | + | 3 - 2 | + | 4 - 2 | + | 14 - 2 |} {5} = 3,0

Среднее абсолютное отклонение от медианы меньше или равно среднему абсолютному отклонению от среднего. Фактически, среднее абсолютное отклонение от медианы всегда меньше или равно среднему абсолютному отклонению от любого другого фиксированного числа.

Среднее абсолютное отклонение от среднего меньше или равно стандартному отклонению ; один из способов доказательства этого основан на неравенстве Дженсена.

Для нормального распределения отношение среднего абсолютного отклонения к стандартному отклонению составляет 2 / π = 0,79788456… {\ displaystyle {\ sqrt {2 / \ pi}} = 0,79788456 \ ldots}{\ sqrt {2 / \ pi}} = 0,79788456 \ ldots . Таким образом, если X - нормально распределенная случайная величина с ожидаемым значением 0, тогда см. Geary (1935):

w = E | X | Е (Х 2) = 2 π. {\ displaystyle w = {\ frac {E | X |} {\ sqrt {E (X ^ {2})}}} = {\ sqrt {\ frac {2} {\ pi}}}.}w = \ frac {E | X | } {\ sqrt {E (X ^ 2)}} = \ sqrt {\ frac {2} {\ pi}}.

Другими словами, для нормального распределения среднее абсолютное отклонение составляет примерно 0,8 стандартного отклонения. Однако измерения внутри выборки предоставляют значения отношения среднего среднего отклонения / стандартного отклонения для данной гауссовой выборки n со следующими границами: wn ∈ [0, 1] {\ displaystyle w_ {n} \ in [0, 1]}w_n \ in [0,1] , со смещением для малых n.

Среднее абсолютное отклонение от среднего

Среднее абсолютное отклонение (MAD), также называемое «средним отклонением» или иногда «средним абсолютным отклонением», представляет собой среднее значение абсолютных отклонений данных от среднего значения данных: среднее (абсолютное) расстояние от среднего. «Среднее абсолютное отклонение» может относиться либо к этому использованию, либо к общей форме по отношению к указанной центральной точке (см. Выше).

MAD было предложено использовать вместо стандартного отклонения, поскольку оно лучше соответствует реальной жизни. Поскольку MAD является более простой мерой изменчивости, чем стандартное отклонение, он может быть полезен в школьном обучении.

Точность прогноза этого метода очень тесно связана со среднеквадратичной ошибкой (MSE), который представляет собой просто среднеквадратичную ошибку прогнозов. Хотя эти методы очень тесно связаны, MAD используется чаще, потому что его проще вычислить (избегая возведения в квадрат) и легче понять.

Среднее абсолютное отклонение около медианы

Среднее абсолютное отклонение от медианы (медиана MAD) позволяет напрямую измерить масштаб случайной переменной вокруг медианы

D med = E | X - медиана | {\ displaystyle D _ {\ text {med}} = E | X - {\ text {median}} |}D _ {{\ text { med}}} = E | X - {\ text {median}} |

Это оценка максимального правдоподобия параметра масштаба b {\ displaystyle b}b из распределения Лапласа. Для нормального распределения имеем D med = σ 2 / π {\ displaystyle D _ {\ text {med}} = \ sigma {\ sqrt {2 / \ pi}}}D _ {{\ text {med}}} = \ sigma { \ sqrt {2 / \ pi}} . Поскольку медиана минимизирует среднее абсолютное расстояние, мы имеем D med ≤ D mean {\ displaystyle D _ {\ text {med}} \ leq D _ {\ text {mean}}}D _ {{\ text {med}}} \ leq D _ {{\ text {mean}}} . Используя общую дисперсионную функцию, Хабиб (2011) определил MAD относительно медианы как

D med = E | X - медиана | Знак равно 2 Cov ⁡ (X, IO) {\ displaystyle D _ {\ text {med}} = E | X - {\ text {median}} | = 2 \ operatorname {Cov} (X, I_ {O})}D _ {{\ text {med}}} = E | X - {\ text { median}} | = 2 \ operatorname {Cov} (X, I_ {O})

, где индикаторной функцией является

IO: = {1, если x>медиана, 0 в противном случае. {\ displaystyle \ mathbf {I} _ {O}: = {\ begin {cases} 1 {\ text {if}} x>{\ text {median}}, \\ 0 {\ text {else}}. \ end {case}}}{\mathbf {I}}_{O}:={\begin{cases}1{\text{if }}x>{\ text {median}}, \\ 0 {\ text {else}}. \ end {cases}}

Это представление позволяет получить медианные коэффициенты корреляции MAD.

Среднее абсолютное отклонение вокруг центральной точки

Среднее абсолютное отклонение вокруг среднего

В принципе, среднее значение может быть принято как центральная точка для среднего абсолютного отклонения, но чаще вместо него берется медианное значение.

Медианное абсолютное отклонение от медианы

Среднее абсолютное отклонение (также MAD) - это медиана абсолютного отклонения от медианы. Это надежная оценка дисперсии.

Для примера {2, 2, 3, 4, 14}: 3 - это медиана, поэтому абсолютные отклонения от медианы равны {1, 1, 0, 1, 11} (re упорядочены как {0, 1, 1, 1, 11}) со средним значением 1, в данном случае на него не влияет значение выброса 14, поэтому среднее абсолютное отклонение (также называемое MAD) составляет 1.

Максимальное абсолютное отклонение

Максимальное абсолютное отклонение вокруг произвольной точки - это максимум абсолютных отклонений образца от этой точки. Хотя это и не является строго мерой центральной тенденции, максимальное абсолютное отклонение можно найти, используя формулу для среднего абсолютного отклонения, как указано выше с m (X) = max (X) {\ displaystyle m (X) = \ max ( X)}m (X) = \ max (X) , где max (X) {\ displaystyle \ max (X)}\ max (X) - это максимум выборки.

Минимизация

Меры статистической дисперсии, полученные из абсолютного отклонения, характеризуют различные меры центральной тенденции как минимизирующие дисперсию: медиана - это мера центральной тенденции, наиболее связанной с абсолютным отклонением. Некоторые параметры местоположения можно сравнить следующим образом:

  • L norm статистика: среднее минимизирует среднеквадратичную ошибку
  • L norm статистика: медиана минимизирует среднее абсолютное отклонение,
  • L статистика norm : средний диапазон минимизирует максимальное абсолютное отклонение
  • усеченное L norm статистика: например, midhinge ( среднее значение первого и третьего квартилей ), который минимизирует среднее абсолютное отклонение всего распределения, а также минимизирует максимальное абсолютное отклонение распределения после отсечения верхних и нижних 25%.
Оценка
График 01.jpg

Среднее абсолютное отклонение выборки - это смещенная оценка среднего абсолютного отклонения совокупности. Для того чтобы абсолютное отклонение было объективной оценкой, ожидаемое значение (среднее) всех абсолютных отклонений выборки должно равняться абсолютному отклонению генеральной совокупности. Однако это не так. Для населения 1,2,3 и абсолютное отклонение совокупности относительно медианы, и абсолютное отклонение совокупности относительно среднего значения составляют 2/3. Среднее значение всех абсолютных отклонений выборки относительно среднего размера 3, которое можно извлечь из генеральной совокупности, составляет 44/81, в то время как среднее всех абсолютных отклонений выборки относительно медианы составляет 4/9. Следовательно, абсолютное отклонение является смещенной оценкой.

Однако этот аргумент основан на понятии беспристрастности к среднему. Каждый показатель местоположения имеет свою собственную форму беспристрастности (см. Запись о смещенной оценке ). Соответствующая форма беспристрастности здесь - медианная непредвзятость.

График 02.jpg
См. Также
Ссылки
Внешние ссылки
Последняя правка сделана 2021-06-12 19:55:15
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте