Авторегрессия – модель скользящего среднего

редактировать

В статистическом анализе временных рядов, авторегрессия – скользящее среднее (ARMA ) модели предоставляют скупое описание (слабо) стационарного случайного процесса в терминах двух полиномов, один для авторегрессия (AR) и вторая для скользящей средней (MA). Общая модель ARMA была описана в тезисе Питера Уиттла 1951 года, Проверка гипотез в анализе временных рядов, и она была популяризирована в книге 1970 года Джорджем Е.П. Боксом и Гвилимом. Jenkins.

Учитывая временной ряд данных X t, модель ARMA представляет собой инструмент для понимания и, возможно, прогнозирования будущих значений в этом ряду. Часть AR включает регрессию переменной по ее собственным запаздывающим (т. Е. Прошлым) значениям. Часть MA включает моделирование члена ошибки как линейной комбинации членов ошибки, возникающих одновременно и в разное время в прошлом. Модель обычно называется моделью ARMA (p, q), где p - это порядок части AR, а q - порядок части MA (как определено ниже).

Модели ARMA можно оценить с помощью метода Бокса – Дженкинса.

Содержание

1 Модель авторегрессии
2 Модель скользящего среднего
3 Модель ARMA
4 Примечание об условиях ошибки
5 Спецификация в терминах оператора запаздывания
- 5.1 Альтернативная нотация
6 Подгонка моделей
- 6.1 Выбор p и q
- 6.2 Оценочные коэффициенты
- 6.3 Реализации в статистических пакетах
7 Приложения
8 Обобщения
- 8.1 Модель авторегрессии – скользящего среднего с моделью экзогенных входов (модель ARMAX)
9 См. Также
10 Ссылки
11 Дополнительная литература

Модель авторегрессии

Обозначение AR (p) относится к авторегрессионной модели порядка p. Модель AR (p) записывается как

X t = c + ∑ i = 1 p φ i X t - i + ε t. {\ displaystyle X_ {t} = c + \ sum _ {i = 1} ^ {p} \ varphi _ {i} X_ {ti} + \ varepsilon _ {t}. \,}

X_ {t} = c + \ sum _ {i = 1} ^ {p} \ varphi _ {i} X_ {ti} + \ varepsilon _ {t}. \,

где $φ 1,…, φ p {\ displaystyle \ varphi _ {1}, \ ldots, \ varphi _ {p}}$ $\ varphi _ {1}, \ ldots, \ varphi _ {p}$ - это параметры, $c {\ displaystyle c}$ $c$ - константа, а случайная величина $ε t {\ displaystyle \ varepsilon _ {t}}$ $\ varepsilon _ {t}$ - белый шум.

Некоторые ограничения необходимы для значения параметров, чтобы модель оставалась стационарной. Например, процессы в модели AR (1) с $| φ 1 | ≥ 1 {\ displaystyle | \ varphi _ {1} | \ geq 1}$ ${\ displaystyle | \ varphi _ {1} | \ geq 1}$ не являются стационарными.

Модель скользящего среднего

Обозначение MA (q) относится к модели скользящего среднего порядка q:

X t = μ + ε t + ∑ i = 1 q θ i ε T - я {\ displaystyle X_ {t} = \ mu + \ varepsilon _ {t} + \ sum _ {i = 1} ^ {q} \ theta _ {i} \ varepsilon _ {ti} \,}

X_ {t} = \ mu + \ varepsilon _ {t} + \ sum _ {i = 1} ^ {q } \ theta _ {i} \ varepsilon _ {ti} \,

где θ 1,..., θ q - это параметры модели, μ - это ожидание $X t {\ displaystyle X_ {t}}$ $X_ {t}$ (часто принимается равным 0) и $ε t {\ displaystyle \ varepsilon _ {t}}$ $\ varepsilon _ {t}$ , $ε t - 1 {\ displaystyle \ varepsilon _ {t-1}}$ $\ varepsilon _ {t-1}$ ,... снова, белый шум ошибки.

Модель ARMA

Обозначение ARMA (p, q) относится к модели с p членами авторегрессии и q членами скользящего среднего. Эта модель содержит модели AR (p) и MA (q),

X t = c + ε t + ∑ i = 1 p φ i X t - i + ∑ i = 1 q θ i ε t - i. {\ displaystyle X_ {t} = c + \ varepsilon _ {t} + \ sum _ {i = 1} ^ {p} \ varphi _ {i} X_ {ti} + \ sum _ {i = 1} ^ {q } \ theta _ {i} \ varepsilon _ {ti}. \,}

X_ {t} = c + \ varepsilon _ {t} + \ sum _ {i = 1} ^ {p} \ varphi _ {i} X_ {ti} + \ sum _ {i = 1} ^ {q} \ theta _ {i} \ varepsilon _ {ti}. \,

Общая модель ARMA была описана в тезисе 1951 года Питера Уиттла, который использовал математический анализ (ряд Лорана и анализ Фурье ) и статистический вывод. Модели ARMA были популяризированы в 1970 году книгой Джорджа Э. П. Бокса и Дженкинса, которые изложили итерационный (Бокс – Дженкинс ) метод их выбора и оценки. Этот метод был полезен для полиномов низкого порядка (степени три или меньше).

Модель ARMA, по сути, представляет собой фильтр бесконечной импульсной характеристики, применяемый к белому шуму, с некоторой дополнительной интерпретацией, помещенной на Это.

Примечание об условиях ошибки

Условия ошибки $ε t {\ displaystyle \ varepsilon _ {t}}$ $\ varepsilon _ {t}$ обычно считаются независимыми одинаково распределенные случайные величины (iid), выбранные из нормального распределения с нулевым средним: $ε t {\ displaystyle \ varepsilon _ {t}}$ $\ varepsilon _ {t}$ ~ N (0, σ), где σ - дисперсия. Эти предположения могут быть ослаблены, но это изменит свойства модели. В частности, изменение i.i.d. предположение будет иметь довольно фундаментальное значение.

Спецификация в терминах оператора запаздывания

В некоторых текстах модели будут определяться с помощью оператора запаздывания L. В этих терминах модель AR (p) задается следующим образом:

ε t = (1 - ∑ i = 1 p φ i L i) X t = φ (L) X t {\ displaystyle \ varepsilon _ {t} = \ left (1- \ sum _ {i = 1} ^ {p} \ varphi _ {i} L ^ {i} \ right) X_ {t} = \ varphi (L) X_ {t} \,}

\ varepsilon _ {t} = \ left (1- \ sum _ {i = 1} ^ {p} \ varphi _ {i} L ^ {i} \ right) X_ {t} = \ varphi ( L) X_ {t} \,

где $φ {\ displaystyle \ varphi}$ $\ varphi$ представляет собой многочлен

φ (L) = 1 - ∑ i = 1 p φ i L i. {\ displaystyle \ varphi (L) = 1- \ sum _ {i = 1} ^ {p} \ varphi _ {i} L ^ {i}. \,}

\ varphi (L) = 1- \ sum _ {i = 1} ^ {p} \ varphi _ {i} L ^ {i}. \,

Модель MA (q) задается формулой

Икс T знак равно (1 + ∑ я знак равно 1 Q θ я L я) ε T знак равно θ (L) ε T, {\ Displaystyle X_ {t} = \ left (1+ \ сумма _ {я = 1} ^ {q} \ theta _ {i} L ^ {i} \ right) \ varepsilon _ {t} = \ theta (L) \ varepsilon _ {t}, \,}

X_ {t} = \ left (1+ \ sum _ {i = 1} ^ {q} \ theta _ {i} L ^ {i} \ right) \ varepsilon _ {t} = \ theta (L) \ varepsilon _ {t}, \,

где θ представляет собой многочлен

θ (L) знак равно 1 + ∑ я знак равно 1 q θ я L я. {\ displaystyle \ theta (L) = 1 + \ sum _ {i = 1} ^ {q} \ theta _ {i} L ^ {i}. \,}

\ theta (L) = 1 + \ sum _ {i = 1} ^ {q} \ theta _ {i} L ^ {i}. \,

Наконец, объединенный ARMA (p, q) модель задается формулой

(1 - ∑ я знак равно 1 п φ я L я) Икс T знак равно (1 + ∑ я = 1 q θ я L я) ε t, {\ displaystyle \ left (1- \ sum _ {i = 1} ^ {p} \ varphi _ {i} L ^ {i} \ right) X_ {t} = \ left (1+ \ sum _ {i = 1} ^ {q} \ theta _ { i} L ^ {i} \ right) \ varepsilon _ {t} \,,}

\ left (1- \ sum _ {i = 1} ^ {p} \ varphi _ {i} L ^ {i} \ right) X_ {t} = \ left (1+ \ sum _ {i = 1} ^ {q} \ theta _ { i} L ^ {i} \ right) \ varepsilon _ {t} \,,

или более кратко,

φ (L) X t = θ (L) ε t {\ displaystyle \ varphi (L) X_ {t} = \ theta (L) \ varepsilon _ {t} \,}

\ varphi (L) X_ {t} = \ theta (L) \ varepsilon _ {t} \,

или

φ (L) θ (L) X t = ε t. {\ displaystyle {\ frac {\ varphi (L)} {\ theta (L)}} X_ {t} = \ varepsilon _ {t} \,.}

{\ frac {\ varphi (L)} {\ theta (L)}} X_ {t} = \ varepsilon _ {t} \,.

Альтернативное обозначение

Некоторые авторы, включая Box, Jenkins и Reinsel используют другое соглашение для коэффициентов авторегрессии. Это позволяет всем многочленам, содержащим оператор запаздывания, везде появляться в одинаковой форме. Таким образом, модель ARMA будет записана как

(1 - ∑ i = 1 p ϕ i L i) X t = (1 + ∑ i = 1 q θ i L i) ε t. {\ displaystyle \ left (1- \ сумма _ {я = 1} ^ {p} \ phi _ {i} L ^ {i} \ right) X_ {t} = \ left (1+ \ sum _ {i = 1} ^ {q} \ theta _ {i} L ^ {i} \ right) \ varepsilon _ {t} \,.}

{\ displaystyle \ left (1- \ сумма _ { i = 1} ^ {p} \ phi _ {i} L ^ {i} \ right) X_ {t} = \ left (1+ \ sum _ {i = 1} ^ {q} \ theta _ {i} L ^ {i} \ right) \ varepsilon _ {t} \,.}

Более того, если мы установим $ϕ 0 = - 1 {\ displaystyle \ phi _ {0} = - 1}$ ${\ displaystyle \ phi _ {0} = - 1}$ и $θ 0 = 1 {\ displaystyle \ theta _ {0} = 1}$ ${\ displaystyle \ theta _ {0} = 1}$ , тогда мы получаем еще более элегантную формулировку : $- i = 0 p ϕ i L i X t = ∑ i = 0 q θ i L i ε t. {\ displaystyle - \ sum _ {i = 0} ^ {p} \ phi _ {i} L ^ {i} \; X_ {t} = \ sum _ {i = 0} ^ {q} \ theta _ { i} L ^ {i} \; \ varepsilon _ {t} \,.}$ ${\ displaystyle - \ sum _ {i = 0} ^ {p} \ phi _ {i} L ^ {i} \; X_ {t} = \ sum _ {i = 0} ^ {q} \ theta _ {i} L ^ {i} \; \ varepsilon _ {t} \,.}$

Модели подгонки

Выбор p и q

Поиск подходящих значений p и q в ARMA (p, q) модель может быть упрощена путем построения графика частичных автокорреляционных функций для оценки p и аналогичным образом использования автокорреляционных функций для оценки q. Дополнительную информацию можно получить, рассматривая те же функции для остатков модели, снабженной начальным выбором p и q.

Brockwell Davis рекомендуют использовать информационный критерий Акаике (AIC) для нахождения p и q.

Оценочные коэффициенты

Модели ARMA в целом могут быть, после выбора p и q, аппроксимируемая регрессией наименьших квадратов, чтобы найти значения параметров, которые минимизируют член ошибки. Обычно считается хорошей практикой находить наименьшие значения p и q, которые обеспечивают приемлемое соответствие данным. Для чистой модели AR уравнения Юла-Уокера могут использоваться для обеспечения соответствия.

Реализации в статистических пакетах

В R функция arima (в стандартной статистике пакета) задокументирована в ARIMA Modeling of Time Series. Пакеты расширений содержат связанные и расширенные функции, например, пакет tseries включает функцию arma, описанную в «Подгонка моделей ARMA к временным рядам» ; пакет fracdiff содержит fracdiff () для частично интегрированных процессов ARMA; а пакет прогнозов включает auto.arima для выбора экономного набора p, q. Представление задач CRAN на временных рядах содержит ссылки на большинство из них.
Mathematica имеет полную библиотеку функций временных рядов, включая ARMA.
MATLAB включает такие функции, как arma и ar для оценки моделей AR, ARX (авторегрессионная экзогенная) и ARMAX. Для получения дополнительной информации см. System Identification Toolbox и Econometrics Toolbox.
Julia имеет несколько пакетов, управляемых сообществом, которые реализуют совместимость с моделью ARMA, например arma.jl.
Statsmodels Модуль Python включает множество моделей и функций для анализа временных рядов, включая ARMA. Ранее он был частью Scikit-learn, теперь он автономный и хорошо интегрируется с Pandas. Подробнее см. Здесь..
имеет реализацию на основе Python моделей ARIMAX, включая байесовские модели ARIMAX.
Численные библиотеки IMSL - это библиотеки функций численного анализа, включая процедуры ARMA и ARIMA, реализованные в стандартном программировании. языки, такие как C, Java, C #.NET и Fortran.
gretl также может оценивать модель ARMA, см. здесь, где упоминается.
GNU Octave может оценивать модели AR с использованием функций из дополнительный пакет octave-forge.
Stata включает функцию arima, которая может оценивать модели ARMA и ARIMA. Подробнее см. Здесь.
- это Java-библиотека численных методов, включая комплексные статистические пакеты, в которых одномерные / многомерные модели ARMA, ARIMA, ARMAX и т. Д. Реализованы в объектно-ориентированном подходе. Эти реализации задокументированы в «SuanShu, цифровая и статистическая библиотека Java»..
SAS имеет эконометрический пакет ETS, который оценивает модели ARIMA. Подробнее см. Здесь..

Приложения

ARMA подходит, когда система является функцией серии ненаблюдаемых шоков (MA или часть скользящей средней), а также ее собственного поведения. Например, цены на акции могут быть шокированы фундаментальной информацией, а также проявлением технических тенденций и эффектов возврата к среднему из-за участников рынка.

Обобщения

Зависимость X t для прошлых значений и членов ошибки ε t предполагается линейными, если не указано иное. Если зависимость является нелинейной, модель конкретно называется моделью нелинейного скользящего среднего (NMA), нелинейной авторегрессии (NAR) или нелинейной авторегрессионной скользящей средней (NARMA).

Модели авторегрессии со скользящим средним можно обобщить и другими способами. См. Также модели авторегрессионной условной гетероскедастичности (ARCH) и модели авторегрессии интегрированного скользящего среднего (ARIMA). Если необходимо подобрать несколько временных рядов, можно подобрать векторную модель ARIMA (или VARIMA). Если рассматриваемый временной ряд демонстрирует длинную память, тогда может быть подходящим моделирование дробного ARIMA (FARIMA, иногда называемого ARFIMA): см. Авторегрессионное дробно-интегрированное скользящее среднее. Если предполагается, что данные содержат сезонные эффекты, они могут быть смоделированы с помощью SARIMA (сезонный ARIMA) или периодической модели ARMA.

Еще одно обобщение - это модель многомасштабной авторегрессии (MAR). Модель MAR индексируется узлами дерева, тогда как стандартная (дискретная по времени) модель авторегрессии индексируется целыми числами.

Обратите внимание, что модель ARMA - это одномерная модель. Расширениями для многомерного случая являются векторная авторегрессия (VAR) и векторная авторегрессия Moving-Average (VARMA).

Модель авторегрессии – скользящего среднего с моделью экзогенных входов (модель ARMAX)

Обозначение ARMAX (p, q, b) относится к модели с p членами авторегрессии, q членами скользящего среднего и b условия экзогенных затрат. Эта модель содержит модели AR (p) и MA (q) и линейную комбинацию последних b членов известного и внешнего временных рядов $d t {\ displaystyle d_ {t}}$ $d_ {t}$ . Он задается следующим образом:

X t = ε t + ∑ i = 1 p φ i X t - i + ∑ i = 1 q θ i ε t - i + ∑ i = 1 b η i d t - i. {\ displaystyle X_ {t} = \ varepsilon _ {t} + \ sum _ {i = 1} ^ {p} \ varphi _ {i} X_ {ti} + \ sum _ {i = 1} ^ {q} \ theta _ {i} \ varepsilon _ {ti} + \ sum _ {i = 1} ^ {b} \ eta _ {i} d_ {ti}. \,}

{\ displaystyle X_ {t} = \ varepsilon _ {t} + \ sum _ {i = 1} ^ {p} \ varphi _ {i} X_ {ti} + \ sum _ {i = 1} ^ {q } \ theta _ {i} \ varepsilon _ {ti} + \ sum _ {i = 1} ^ {b} \ eta _ {i} d_ {ti}. \,}

где $η 1,…, η b {\ displaystyle \ eta _ {1}, \ ldots, \ eta _ {b}}$ $\ eta _ {1}, \ ldots, \ eta _ {b}$ - параметры экзогенного ввода $dt {\ displaystyle d_ {t}}$ $d_ {t}$ .

Определены некоторые нелинейные варианты моделей с экзогенными переменными: см., например, Нелинейная авторегрессионная экзогенная модель.

Статистические пакеты реализуют модель ARMAX посредством использования «экзогенных» (то есть независимых,) переменные. Следует проявлять осторожность при интерпретации вывода этих пакетов, потому что оценочные параметры обычно (например, в R и gretl ) относятся к регрессии:

X t - mt знак равно ε t + ∑ я знак равно 1 п φ я (X t - я - mt - я) + ∑ я знак равно 1 q θ я ε т - я. {\ displaystyle X_ {t} -m_ {t} = \ varepsilon _ {t} + \ sum _ {i = 1} ^ {p} \ varphi _ {i} (X_ {ti} -m_ {ti}) + \ sum _ {i = 1} ^ {q} \ theta _ {i} \ varepsilon _ {ti}. \,}

X_ {t} -m_ {t} = \ varepsilon _ {t} + \ sum _ {i = 1} ^ {p} \ varphi _ {i} (X_ {ti} -m_ {ti}) + \ sum _ {i = 1} ^ {q} \ theta _ {i} \ varepsilon _ {ti}. \,

где m t включает все экзогенные (или независимые) переменные:

mt = c + ∑ i = 0 b η idt - i. {\ displaystyle m_ {t} = c + \ sum _ {i = 0} ^ {b} \ eta _ {i} d_ {ti}. \,}

m_ {t} = c + \ sum _ {i = 0} ^ {b} \ eta _ {i} d_ {ti}. \,

См. также

Ссылки

Дополнительная литература

Миллс, Теренс С.. (1990). Методы временных рядов для экономистов. Издательство Кембриджского университета. ISBN 0521343399.
Персиваль, Дональд Б.; Уолден, Эндрю Т. (1993). Спектральный анализ для физических приложений. Издательство Кембриджского университета. ISBN 052135532X.
Francq, C.; Закоян, Ж.-М. (2005), «Недавние результаты для моделей линейных временных рядов с независимыми инновациями», в Duchesne, P.; Ремиллард Б. (ред.), Статистическое моделирование и анализ сложных проблем данных, Springer, стр. 241–265, CiteSeerX 10.1.1.721.1754.