В статистике, средняя абсолютная ошибка ( МАЭ ) является мерой ошибок между парными наблюдениями, выражающих то же явление. Примеры Y по сравнению с X включают сравнения прогнозируемого и наблюдаемого, последующего времени и начального времени и один метод измерения по сравнению с альтернативным методом измерения. MAE рассчитывается как:
Таким образом, это среднее арифметическое абсолютных ошибок, где - прогноз и истинное значение. Обратите внимание, что альтернативные составы могут включать относительные частоты в качестве весовых коэффициентов. Средняя абсолютная ошибка использует ту же шкалу, что и измеряемые данные. Это известно как мера точности, зависящая от масштаба, и поэтому не может использоваться для сравнения серий с использованием разных шкал. Средняя абсолютная ошибка - это обычная мера ошибки прогноза при анализе временных рядов, которую иногда путают с более стандартным определением среднего абсолютного отклонения. Та же путаница существует и в более общем смысле.
MAE можно выразить как сумму двух компонентов: несогласия количества и несогласия распределения. Количественное несоответствие - это абсолютное значение средней ошибки, определяемое по формуле:
Несогласие в распределении - это MAE минус несогласие по количеству.
Также возможно определить типы различий, посмотрев на график. Количественная разница существует, когда среднее значение X не равно среднему значению Y. Разница в размещении существует тогда и только тогда, когда точки находятся по обе стороны от линии идентичности.
Средняя абсолютная ошибка - это один из способов сравнения прогнозов с их окончательными результатами. Хорошо известными альтернативами являются средняя абсолютная масштабированная ошибка (MASE) и среднеквадратичная ошибка. Все они суммируют производительность таким образом, чтобы игнорировать направление завышенного или заниженного прогноза; мерой, которая делает акцент на этом, является средняя знаковая разница.
Если модель прогнозирования должна быть адаптирована с использованием выбранной меры эффективности, в том смысле, что метод наименьших квадратов связан со среднеквадратичной ошибкой, эквивалентом средней абсолютной ошибки является наименьшее абсолютное отклонение.
MAE не идентично среднеквадратичной ошибке (RMSE), хотя некоторые исследователи сообщают и интерпретируют это таким образом. MAE концептуально проще и легче интерпретируется, чем RMSE: это просто среднее абсолютное расстояние по вертикали или горизонтали между каждой точкой на диаграмме рассеяния и линией Y = X. Другими словами, MAE - это средняя абсолютная разница между X и Y. Кроме того, каждая ошибка вносит вклад в MAE пропорционально абсолютному значению ошибки. Это отличается от RMSE, который включает возведение разностей в квадрат, так что несколько больших разностей увеличивают RMSE в большей степени, чем MAE. См. Пример выше для иллюстрации этих различий.
Средняя абсолютная ошибка реального переменных с относительно случайной величины X является
При условии, что распределение вероятностей X таково, что приведенное выше математическое ожидание существует, то т является медианным из X тогда и только тогда, когда т является минимизантом средней абсолютной погрешности по отношению к X. В частности, m является выборкой медианы тогда и только тогда, когда m минимизирует среднее арифметическое абсолютных отклонений.
В более общем плане медиана определяется как минимум
как описано в разделе "Многомерная медиана" (и, в частности, в разделе "Пространственная медиана" ).
Это основанное на оптимизации определение медианы полезно при статистическом анализе данных, например, при кластеризации k- средних.
Утверждение: Минимизирующий классификатор есть.
Доказательство:
Функции потерь для классификации :
Дифференцируя WRT дает
Это означает
Следовательно