При анализе данных коррелограмма представляет собой диаграмму корреляция статистика. Например, в анализе временных рядов, график выборки автокорреляций по сравнению с (временные задержки) - это автокоррелограмма . Если отображается взаимная корреляция, результат называется кросс-коррелограммой .
Коррелограмма - это часто используемый инструмент для проверки случайности в наборе данных .. Если он случайный, автокорреляция должна быть близка к нулю для всех без исключения разделений по времени. Если неслучайно, то одна или несколько автокорреляций будут значительно отличны от нуля.
Кроме того, коррелограммы используются на этапе идентификации модели для Box–Jenkins авторегрессионного скользящего среднего временного ряда модели. Автокорреляция должна быть близкой к нулю для случайности; если аналитик не проверяет случайность, тогда достоверность многих статистических выводов становится сомнительной. Коррелограмма - отличный способ проверить такую случайность.
Иногда коррограммы, цветные матрицы сил корреляции в многомерном анализе, также называются коррелограммами.
Коррелограмма может помочь ответить на следующие вопросы:
Случайность (наряду с фиксированной моделью, фиксированной вариацией и фиксированным распределением) - одно из четырех предположений, которые обычно лежат в основе всех процессов измерения. Предположение о случайности критически важно по следующим трем причинам:
, где s - стандартное отклонение данные. Несмотря на интенсивное использование, результаты использования этой формулы не имеют ценности, если не выполняется предположение о случайности.
Если данные не случайны, эта модель неверна и недействительна, а оценки параметров (таких как константа) становятся бессмысленными и недействительными.
Коэффициент автокорреляции при запаздывании h определяется как
где c h - функция автоковариации
и c 0 - это функция дисперсии
Результирующее значение r h будет находиться в диапазоне от -1 до +1.
Некоторые источники могут использовать следующую формулу для функции автоковариации:
Хотя в этом определении меньше смещения, формулировка (1 / N) обладает некоторыми желательными статистическими свойствами и является формой, наиболее часто используемой в статистической литературе. См. Подробности на страницах 20 и 49–50 в Chatfield.
На том же графике можно провести верхнюю и нижнюю границы для автокорреляции с уровнем значимости :
Если автокорреляция выше (ниже), чем эта верхняя (нижняя) граница, нулевая гипотеза об отсутствии автокорреляции на заданном лаге и за его пределами отклоняется на уровне значимости . Этот тест является приблизительным и предполагает, что временной ряд гауссовский.
. В приведенном выше примере z 1 − α / 2 является квантилем нормального распределения ; SE - стандартная ошибка, которая может быть вычислена по формуле Бартлетта для процессов MA (ℓ):
На картинке выше мы можем отклонить нулевую гипотезу об отсутствии автокорреляции между соседними временными точками (lag = 1). в другие периоды нельзя отклонить нулевую гипотезу об отсутствии автокорреляции.
Обратите внимание, что есть две различные формулы для генерации доверительных интервалов:
1. Если коррелограмма является используется для проверки на случайность (т. е. нет в данных), рекомендуется следующая формула:
где N - размер выборки, z - функция квантиля стандартного нормального распределения и α - уровень значимости. В этом случае доверительные интервалы имеют фиксированную ширину, которая зависит от размера выборки.
2. Коррелограммы также используются на этапе идентификации модели для подгонки моделей ARIMA. В этом случае для данных предполагается модель скользящего среднего , и должны быть созданы следующие доверительные интервалы:
где k - задержка. В этом случае доверительные интервалы увеличиваются с увеличением задержки.
Коррелограммы доступны в большинстве статистических библиотек общего назначения.
Коррелограммы:
Коррограммы:
В эту статью включены материалы общественного достояния с веб-сайта Национального института стандартов и технологий https://www.nist.gov.