Средняя абсолютная погрешность шкалы

редактировать

В статистике, то средняя абсолютная ошибка масштабируется ( MASE ) является мерой точности в прогнозах. Это средняя абсолютная ошибка значений прогноза, деленная на среднюю абсолютную ошибку одношагового наивного прогноза внутри выборки. Он был предложен в 2005 году статистиком Робом Дж. Хайндманом и профессором Decision Sciences Энн Б. Кёлер, которые описали его как «общеприменимое измерение точности прогноза без проблем, наблюдаемых в других измерениях». Средняя абсолютная масштабированная ошибка имеет благоприятные свойства по сравнению с другими методами расчета ошибок прогноза, такими как среднеквадратичное отклонение, и поэтому рекомендуется для определения сравнительной точности прогнозов.

Содержание

1 Обоснование
2 Несезонный временной ряд
3 Сезонный временной ряд
4 См. Также
5 ссылки

Обоснование

Средняя абсолютная масштабированная ошибка имеет следующие желательные свойства:

Масштабная инвариантность : средняя абсолютная масштабированная ошибка не зависит от масштаба данных, поэтому может использоваться для сравнения прогнозов по наборам данных с разными масштабами.
Предсказуемое поведение, например : ${\ displaystyle y_ {t} \ rightarrow 0}$ ${\ displaystyle y_ {t} \ rightarrow 0}$ Показатели точности прогноза в процентах, такие как средняя абсолютная процентная ошибка (MAPE), основаны на делении, искажая распределение MAPE для значений, близких или равных 0. Это особенно проблематично для наборов данных, шкалы которых не имеют значимый 0, такой как температура в градусах Цельсия или Фаренгейта, и для наборов данных с периодическим потреблением, когда встречается часто. ${\ displaystyle y_ {t}}$ $г_ {т}$ ${\ displaystyle y_ {t}}$ $г_ {т}$ ${\ displaystyle y_ {t} = 0}$ ${\ displaystyle y_ {t} = 0}$
Симметрия: средняя абсолютная масштабированная ошибка в равной степени наказывает как положительные, так и отрицательные ошибки прогнозов и одинаково наказывает ошибки в больших и малых прогнозах. Напротив, MAPE и средняя абсолютная процентная ошибка (MdAPE) не соответствуют обоим этим критериям, в то время как «симметричные» sMAPE и sMdAPE не соответствуют второму критерию.
Интерпретируемость: среднюю абсолютную масштабированную ошибку можно легко интерпретировать, поскольку значения, превышающие единицу, указывают на то, что одношаговые прогнозы по выборке, полученные наивным методом, работают лучше, чем рассматриваемые прогнозные значения.
Асимптотическая нормальность MASE: тест Дибольда-Мариано для одношаговых прогнозов используется для проверки статистической значимости разницы между двумя наборами прогнозов. Для проверки гипотез с использованием статистики критерия Дибольда-Мариано желательно для, где - значение статистики критерия. Эмпирически показано, что статистика DM для MASE аппроксимирует это распределение, в то время как средняя относительная абсолютная ошибка (MRAE), MAPE и sMAPE нет. ${\ Displaystyle DM \ sim N (0,1)}$ ${\ Displaystyle DM \ sim N (0,1)}$ ${\ displaystyle DM}$ $DM$

Несезонный временной ряд

Для несезонного временного ряда средняя абсолютная масштабированная ошибка оценивается как

{\ displaystyle \ mathrm {MASE} = \ mathrm {mean} \ left ({\ frac {\ left | e_ {j} \ right |} {{\ frac {1} {T-1}} \ sum _ {t = 2} ^ {T} \ left | Y_ {t} -Y_ {t-1} \ right |}} \ right) = {\ frac {{\ frac {1} {J}} \ sum _ {j} \ left | e_ {j} \ right |} {{\ frac {1} {T-1}} \ sum _ {t = 2} ^ {T} \ left | Y_ {t} -Y_ {t-1} \ right |}}}

{\ displaystyle \ mathrm {MASE} = \ mathrm {mean} \ left ({\ frac {\ left | e_ {j} \ right |} {{\ frac {1} {T-1}} \ sum _ {t = 2} ^ {T} \ left | Y_ {t} -Y_ {t-1} \ right |}} \ right) = {\ frac {{\ frac {1} {J}} \ sum _ {j} \ left | e_ {j} \ right |} {{\ frac {1} {T-1}} \ sum _ {t = 2} ^ {T} \ left | Y_ {t} -Y_ {t-1} \ right |}}}

где числитель e j - ошибка прогноза на данный период (где J - количество прогнозов), определяемая как фактическое значение ( Y j ) минус значение прогноза ( F j ) для этого периода: e j = Y j - F j, а знаменатель - это средняя абсолютная ошибка одношагового " метода наивного прогноза " на обучающем наборе (здесь определенном как t = 1..T ), который использует фактическое значение из предыдущего периода в качестве прогноза: F t = Y t −1

Сезонный временной ряд

Для сезонных временных рядов средняя абсолютная масштабированная ошибка оценивается аналогично методу для несезонных временных рядов:

${\ displaystyle \ mathrm {MASE} = \ mathrm {mean} \ left ({\ frac {\ left | e_ {j} \ right |} {{\ frac {1} {Tm}} \ sum _ {t = m) +1} ^ {T} \ left | Y_ {t} -Y_ {tm} \ right |}} \ right) = {\ frac {{\ frac {1} {J}} \ sum _ {j} \ left | e_ {j} \ right |} {{\ frac {1} {Tm}} \ sum _ {t = m + 1} ^ {T} \ left | Y_ {t} -Y_ {tm} \ right |} }}$ ${\ displaystyle \ mathrm {MASE} = \ mathrm {mean} \ left ({\ frac {\ left | e_ {j} \ right |} {{\ frac {1} {Tm}} \ sum _ {t = m) +1} ^ {T} \ left | Y_ {t} -Y_ {tm} \ right |}} \ right) = {\ frac {{\ frac {1} {J}} \ sum _ {j} \ left | e_ {j} \ right |} {{\ frac {1} {Tm}} \ sum _ {t = m + 1} ^ {T} \ left | Y_ {t} -Y_ {tm} \ right |} }}$

Основное отличие метода для несезонных временных рядов состоит в том, что знаменатель представляет собой среднюю абсолютную ошибку одношагового « сезонного наивного метода прогноза » на обучающем наборе, который использует фактическое значение из предыдущего сезона в качестве прогноза.: F t = Y t −m, где m - сезонный период.

Эту безмасштабную метрику ошибок можно использовать для сравнения методов прогноза для одного ряда, а также для сравнения точности прогнозов между рядами. Эта метрика хорошо подходит для рядов с прерывистым спросом, поскольку она никогда не дает бесконечных или неопределенных значений, за исключением несущественного случая. где все исторические данные равны.

При сравнении методов прогнозирования предпочтительным является метод с наименьшим MASE.

Смотрите также

Рекомендации