Средняя абсолютная ошибка

редактировать
Не путать со средним абсолютным отклонением или средней абсолютной разницей.

В статистике, средняя абсолютная ошибка ( МАЭ ) является мерой ошибок между парными наблюдениями, выражающих то же явление. Примеры Y по сравнению с X включают сравнения прогнозируемого и наблюдаемого, последующего времени и начального времени и один метод измерения по сравнению с альтернативным методом измерения. MAE рассчитывается как:

M А E знак равно я знак равно 1 п | у я - Икс я | п знак равно я знак равно 1 п | е я | п . {\ displaystyle \ mathrm {MAE} = {\ frac {\ sum _ {i = 1} ^ {n} \ left | y_ {i} -x_ {i} \ right |} {n}} = {\ frac { \ sum _ {i = 1} ^ {n} \ left | e_ {i} \ right |} {n}}.}

Таким образом, это среднее арифметическое абсолютных ошибок, где - прогноз и истинное значение. Обратите внимание, что альтернативные составы могут включать относительные частоты в качестве весовых коэффициентов. Средняя абсолютная ошибка использует ту же шкалу, что и измеряемые данные. Это известно как мера точности, зависящая от масштаба, и поэтому не может использоваться для сравнения серий с использованием разных шкал. Средняя абсолютная ошибка - это обычная мера ошибки прогноза при анализе временных рядов, которую иногда путают с более стандартным определением среднего абсолютного отклонения. Та же путаница существует и в более общем смысле. | е я | знак равно | у я - Икс я | {\ displaystyle | e_ {i} | = | y_ {i} -x_ {i} |} у я {\ displaystyle y_ {i}} Икс я {\ displaystyle x_ {i}}

Содержание
  • 1 Несогласие по количеству и разногласию по распределению
  • 2 Связанные меры
    • 2.1 Свойство оптимальности
      • 2.1.1 Доказательство оптимальности
  • 3 См. Также
  • 4 ссылки
Несогласие по количеству и разногласию по распределению
2 точки данных, для которых несовпадение количества равно 0, а несоответствие распределения равно 2 как для MAE, так и для RMSE

MAE можно выразить как сумму двух компонентов: несогласия количества и несогласия распределения. Количественное несоответствие - это абсолютное значение средней ошибки, определяемое по формуле:

M E знак равно я знак равно 1 п у я - Икс я п . {\ displaystyle \ mathrm {ME} = {\ frac {\ sum _ {i = 1} ^ {n} y_ {i} -x_ {i}} {n}}.}

Несогласие в распределении - это MAE минус несогласие по количеству.

Также возможно определить типы различий, посмотрев на график. Количественная разница существует, когда среднее значение X не равно среднему значению Y. Разница в размещении существует тогда и только тогда, когда точки находятся по обе стороны от линии идентичности. ( Икс , у ) {\ Displaystyle (х, у)}

Связанные меры

Средняя абсолютная ошибка - это один из способов сравнения прогнозов с их окончательными результатами. Хорошо известными альтернативами являются средняя абсолютная масштабированная ошибка (MASE) и среднеквадратичная ошибка. Все они суммируют производительность таким образом, чтобы игнорировать направление завышенного или заниженного прогноза; мерой, которая делает акцент на этом, является средняя знаковая разница.

Если модель прогнозирования должна быть адаптирована с использованием выбранной меры эффективности, в том смысле, что метод наименьших квадратов связан со среднеквадратичной ошибкой, эквивалентом средней абсолютной ошибки является наименьшее абсолютное отклонение.

MAE не идентично среднеквадратичной ошибке (RMSE), хотя некоторые исследователи сообщают и интерпретируют это таким образом. MAE концептуально проще и легче интерпретируется, чем RMSE: это просто среднее абсолютное расстояние по вертикали или горизонтали между каждой точкой на диаграмме рассеяния и линией Y = X. Другими словами, MAE - это средняя абсолютная разница между X и Y. Кроме того, каждая ошибка вносит вклад в MAE пропорционально абсолютному значению ошибки. Это отличается от RMSE, который включает возведение разностей в квадрат, так что несколько больших разностей увеличивают RMSE в большей степени, чем MAE. См. Пример выше для иллюстрации этих различий.

Свойство оптимальности

Средняя абсолютная ошибка реального переменных с относительно случайной величины   X является

E ( | Икс - c | ) {\ Displaystyle Е (\ влево | Xc \ вправо |) \,}

При условии, что распределение вероятностей X таково, что приведенное выше математическое ожидание существует, то т является медианным из X тогда и только тогда, когда т является минимизантом средней абсолютной погрешности по отношению к X. В частности, m является выборкой медианы тогда и только тогда, когда m минимизирует среднее арифметическое абсолютных отклонений.

В более общем плане медиана определяется как минимум

E ( | Икс - c | - | Икс | ) , {\ Displaystyle E (| Xc | - | X |),}

как описано в разделе "Многомерная медиана" (и, в частности, в разделе "Пространственная медиана" ).

Это основанное на оптимизации определение медианы полезно при статистическом анализе данных, например, при кластеризации k- средних.

Доказательство оптимальности

Утверждение: Минимизирующий классификатор есть. E | у - у ^ | {\ displaystyle \ mathbb {E} | y - {\ hat {y}} |} ж ^ ( Икс ) знак равно Медиана ( у | Икс знак равно Икс ) {\ displaystyle {\ hat {f}} (x) = {\ text {Median}} (y ​​| X = x)}

Доказательство:

Функции потерь для классификации :

L знак равно E [ | у - а | | Икс знак равно Икс ] знак равно - | у - а | ж Y | Икс ( у ) d у знак равно - а ( а - у ) ж Y | Икс ( у ) d у + а ( у - а ) ж Y | Икс ( у ) d у {\ Displaystyle {\ begin {align} L amp; = \ mathbb {E} [| да || X = x] \\ amp; = \ int _ {- \ infty} ^ {\ infty} | ya | f_ {Y | X } (y) \, dy \\ amp; = \ int _ {- \ infty} ^ {a} (ay) f_ {Y | X} (y) \, dy + \ int _ {a} ^ {\ infty} ( ya) f_ {Y | X} (y) \, dy \\\ конец {выровнено}}}

Дифференцируя WRT дает

а L знак равно - а ж Y | Икс ( у ) d у + а - ж Y | Икс ( у ) d у знак равно 0 {\ displaystyle {\ frac {\ partial} {\ partial a}} L = \ int _ {- \ infty} ^ {a} f_ {Y | X} (y) \, dy + \ int _ {a} ^ { \ infty} -f_ {Y | X} (y) \, dy = 0}

Это означает

- а ж ( у ) d у знак равно а ж ( у ) d у {\ displaystyle \ int _ {- \ infty} ^ {a} f (y) \, dy = \ int _ {a} ^ {\ infty} f (y) \, dy}

Следовательно

F Y | Икс ( а ) знак равно 0,5 {\ Displaystyle F_ {Y | X} (а) = 0,5}

Смотрите также
Рекомендации
Последняя правка сделана 2024-01-02 04:10:40
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте