В анализе временных рядов метод Бокса – Дженкинса, назван в честь статистиков Джордж Бокс и Гвилим Дженкинс применяют авторегрессионное скользящее среднее (ARMA) или авторегрессионное интегрированное скользящее среднее (ARIMA) модели для поиска наилучшего соответствия модели временного ряда прошлым значениям временного ряда.
Исходная модель использует итеративный трехэтапный подход к моделированию:
Данные, которые они использовали, были получены из газовой печи. Эти данные хорошо известны как данные газовых печей Бокса и Дженкинса для сравнительного анализа прогнозных моделей.
Commandeur Koopman (2007, §10.4) утверждают, что подход Бокса – Дженкинса принципиально проблематичен. Проблема возникает из-за того, что «в экономической и социальной областях реальные ряды никогда не бывают стационарными, сколько бы различий ни проводилось». Таким образом, исследователь должен столкнуться с вопросом: насколько близко к стационарному достаточно близко? Как отмечают авторы, «это сложный вопрос». Авторы далее утверждают, что вместо использования Бокса – Дженкинса лучше использовать методы пространства состояний, поскольку в этом случае не требуется стационарность временных рядов.
Первым шагом в разработке модели Бокса – Дженкинса является определение того, является ли временной ряд стационарный и наличие какой-либо значительной сезонности, которую необходимо моделировать.
Стационарность можно оценить по графику последовательности прогонов. График последовательности выполнения должен показывать постоянное местоположение и масштаб . Его также можно обнаружить по графику автокорреляции . В частности, нестационарность часто указывается графиком автокорреляции с очень медленным затуханием.
Сезонность (или периодичность) обычно можно оценить по графику автокорреляции, графику сезонной подсерии или спектральному графику.
Бокс и Дженкинс рекомендуют использовать дифференцированный подход для достижения стационарности. Однако подгонка кривой и вычитание подобранных значений из исходных данных также можно использовать в контексте моделей Бокса – Дженкинса.
На этапе идентификации модели цель состоит в том, чтобы обнаружить сезонность, если она существует, и определить порядок условий сезонной авторегрессии и сезонного скользящего среднего. Для многих рядов период известен, и достаточно одного срока сезонности. Например, для ежемесячных данных обычно включается либо сезонный член AR 12, либо сезонный член MA 12. Для моделей Бокса – Дженкинса сезонность не удаляется явно перед подгонкой модели. Вместо этого в программу оценки ARIMA включается порядок сезонных членов в спецификации модели. Однако может быть полезно применить сезонную разницу к данным и восстановить графики автокорреляции и частичной автокорреляции. Это может помочь в идентификации несезонной составляющей модели. В некоторых случаях сезонная разница может устранить большую часть или весь эффект сезонности.
После того, как были учтены стационарность и сезонность, следующим шагом будет определение порядка (т.е. p и q) членов авторегрессии и скользящего среднего. У разных авторов разные подходы к определению p и q. Броквелл и Дэвис (1991) заявляют, что «нашим основным критерием выбора модели [среди моделей ARMA (p, q)] будет AICc», то есть информационный критерий Акаике с поправкой. Другие авторы используют график автокорреляции и график частичной автокорреляции, описанные ниже.
Образец графика автокорреляции и образец частичной автокорреляции сравниваются с теоретическим поведением этих графиков, если порядок известен.
В частности, для процесса AR (1) функция автокорреляции выборки должна иметь экспоненциально убывающий вид. Однако процессы AR более высокого порядка часто представляют собой смесь экспоненциально убывающих и затухающих синусоидальных компонентов.
Для процессов авторегрессии более высокого порядка автокорреляцию выборки необходимо дополнить графиком частичной автокорреляции. Частичная автокорреляция процесса AR (p) становится равной нулю при запаздывании p + 1 и больше, поэтому мы исследуем выборочную функцию частичной автокорреляции, чтобы увидеть, есть ли свидетельства отклонения от нуля. Обычно это определяется путем размещения 95% доверительного интервала на графике частичной автокорреляции выборки (большинство программ, которые создают графики автокорреляции выборки, также строят этот доверительный интервал). Если программа не генерирует доверительный интервал, он составляет приблизительно , где N обозначает размер выборки.
Функция автокорреляции процесса MA (q) становится равной нулю при задержке q + 1 и более, поэтому мы исследуем функцию автокорреляции выборки, чтобы увидеть, где она по существу становится нулевой. Мы делаем это, помещая 95% доверительный интервал для функции автокорреляции выборки на график автокорреляции выборки. Большинство программ, которые могут генерировать график автокорреляции, также могут генерировать этот доверительный интервал.
Пример функции частичной автокорреляции, как правило, бесполезен для определения порядка процесса скользящего среднего.
В следующей таблице показано, как можно использовать образец автокорреляционной функции для идентификации модели.
Форма | Указанная модель |
---|---|
Экспоненциальная, убывающая до нуля | Авторегрессионная модель. Используйте график частичной автокорреляции, чтобы определить порядок модели авторегрессии. |
Чередование положительного и отрицательного, убывающее до нуля | Модель авторегрессии. Используйте график частичной автокорреляции, чтобы помочь определить порядок. |
Один или несколько всплесков, остаток по существу равен нулю | Модель скользящего среднего, порядок определяется тем, где график становится нулевым. |
Затухание, начинающееся после нескольких задержек | Модель смешанной авторегрессии и скользящего среднего (ARMA ). |
Все нулевые или близкие к нулю | Данные по существу случайны. |
Высокие значения через фиксированные интервалы | Включите сезонный авторегрессионный член. |
Нет спада до нуля | Серии не стационарны. |
Хайндман и Атанасопулос предлагают следующее:
На практике функции автокорреляции выборки и частичной автокорреляции являются случайными величинами и не дают такой же картины, как теоретические функции. Это затрудняет идентификацию модели. В частности, смешанные модели бывает особенно сложно идентифицировать. Хотя опыт и полезен, разработка хороших моделей с использованием этих типовых графиков может включать в себя много проб и ошибок.
Оценка параметров для моделей Бокса – Дженкинса включает численную аппроксимацию решений нелинейных уравнений. По этой причине обычно используется статистическое программное обеспечение, предназначенное для реализации этого подхода - практически все современные статистические пакеты имеют эту возможность. Основные подходы к подгонке моделей Бокса – Дженкинса - это нелинейный метод наименьших квадратов и оценка максимального правдоподобия. Оценка максимального правдоподобия обычно является предпочтительным методом. Уравнения правдоподобия для полной модели Бокса – Дженкинса сложны и здесь не рассматриваются. См. Математические подробности в (Brockwell and Davis, 1991).
Диагностика модели для моделей Бокса – Дженкинса аналогична проверке модели для нелинейной аппроксимации методом наименьших квадратов.
То есть предполагается, что член ошибки A t соответствует предположениям для стационарного одномерного процесса. Остатки должны быть белым шумом (или независимыми, если их распределения нормальные), взятыми из фиксированного распределения с постоянным средним значением и дисперсией. Если модель Бокса – Дженкинса является хорошей моделью для данных, остатки должны удовлетворять этим предположениям.
Если эти предположения не выполняются, необходимо подобрать более подходящую модель. То есть вернитесь к этапу идентификации модели и попытайтесь разработать лучшую модель. Надеюсь, анализ остатков может дать некоторые подсказки в отношении более подходящей модели.
Один из способов оценить, соответствуют ли остатки из модели Бокса – Дженкинса допущениям, - это создать статистические графики (включая график автокорреляции) остатков. Можно также взглянуть на значение статистики Бокса – Люнга.
В эту статью включены материалы общественного достояния из Национального института стандартов и технологии веб-сайт https://www.nist.gov.