Причинно-следственная связь по Грейнджеру

редактировать
Статистическая проверка гипотез для прогнозирования Когда временной ряд X Грейнджер вызывает временной ряд Y, паттерны в X примерно повторяются в Y через некоторое время (два примера указаны стрелками). Таким образом, прошлые значения X могут быть использованы для прогнозирования будущих значений Y.

Тест причинно-следственной связи Грейнджера - это тест статистической гипотезы для определения того, время серия полезна в прогнозировании другой, впервые предложенной в 1969 году. Обычно регрессии отражают «простые» корреляции, но Клайв Грейнджер утверждал, что причинно-следственная связь в экономике может быть проверена путем измерения способности предсказывать будущие значения временного ряда с использованием предыдущих значений другого временного ряда. Поскольку вопрос «истинной причинности» является глубоко философским и из-за ошибки post hoc ergo propter hoc, предполагающей, что одно предшествующее другому может использоваться в качестве доказательства причинности, эконометристы Утверждают, что тест Грейнджера обнаруживает только «предсказуемую причинность». Использование одного только термина «причинность» является неправильным, поскольку причинность по Грейнджеру лучше описывать как «предшествование» или, как позже сам Грейнджер утверждал в 1977 году, «временную связь». Вместо того, чтобы проверять, является ли Y причиной X, причинно-следственная связь Грейнджера проверяет, прогнозирует ли Y X.

Временной ряд X называется причиной Грейнджера Y, если он может быть показан, обычно через серию t- тесты и F-тесты на запаздывающих значениях X (и с запаздывающими значениями Y также включены), что эти значения X предоставляют статистически значимую информацию о будущих значениях Y.

Грейнджер также подчеркнула, что некоторые исследования с использованием проверки «причинности по Грейнджеру» в областях, не связанных с экономикой, привели к «смехотворным» выводам. «Конечно, появилось много нелепых работ», - сказал он в своей Нобелевской лекции. Однако он остается популярным методом анализа причинно-следственной связи во временных рядах из-за его вычислительной простоты. Первоначальное определение причинности по Грейнджеру не учитывает скрытых смешивающих эффектов и не фиксирует мгновенные и нелинейные причинно-следственные связи, хотя для решения этих проблем было предложено несколько расширений.

Содержание
  • 1 Интуиция
  • 2 Основополагающие принципы
  • 3 Метод
    • 3.1 Математическое утверждение
    • 3.2 Многомерный анализ
    • 3.3 Непараметрический тест
  • 4 Ограничения
  • 5 Расширения
  • 6 В неврологии
    • 6.1 Расширения моделей точечных процессов
  • 7 См. Также
  • 8 Ссылки
  • 9 Дополнительная литература
Интуиция

Мы говорим, что переменная X, которая развивается во времени, Грейнджер вызывает другую развивающуюся переменную Y, если прогнозы значения Y на основе его собственных прошлых значений и прошлых значений X лучше, чем прогнозы Y, основанные только на собственных прошлых значениях Y.

Основополагающие принципы

Грейнджер определил причинно-следственную связь на основе двух принципов:

  1. Причина возникает до ее следствия.
  2. Причина имеет уникальную информацию о будущих ценностях.

Учитывая эти два предположения о причинно-следственной связи, Грейнджер предложила проверить следующую гипотезу для выявления причинного эффекта X {\ displaystyle X}X на Y {\ displaystyle Y}Y :

п [Y (t + 1) ∈ A ∣ I (t)] ≠ P [Y (t + 1) ∈ A ∣ I - X (t)], {\ displaystyle \ mathbb {P} [Y (t + 1) \ in A \ mid {\ mathcal {I}} (t)] \ neq \ mathbb {P} [Y (t + 1) \ in A \ mid {\ mathcal {I}} _ {-X} (t)],}{\ displaystyle \ mathbb {P} [Y (t + 1) \ in A \ mid {\ mathcal {I}} (t)] \ neq \ mathbb {P} [Y ( t + 1) \ in A \ mid {\ mathcal {I}} _ {- X} (t)],}

где P {\ displaystyle \ mathbb {P}}\ mathbb {P} относится к вероятности, A {\ displaystyle A}A - произвольное непустое множество, а I (t) {\ displaystyle {\ mathcal {I}} (t)}{\ mathcal {I}} (t) и I - X (t) {\ displaystyle {\ mathcal {I}} _ {- X} (t)}{\ mathcal {I}} _ {- X} (t) соответственно обозначает информацию, доступную на время t {\ displaystyle t}t во всем юниверс и юниверс в измененном юниверсе, в котором X {\ displaystyle X}X исключен. Если приведенная выше гипотеза принимается, мы говорим, что X {\ displaystyle X}X вызывает причину Грейнджера Y {\ displaystyle Y}Y .

Метод

Если временной ряд является стационарным процессом, тест выполняется с использованием значений уровня двух (или более) переменных. Если переменные нестационарны, то тест выполняется с использованием первых (или более высоких) разностей. Количество включаемых лагов обычно выбирается с использованием информационного критерия, такого как информационный критерий Акаике или информационный критерий Шварца. Любое конкретное запаздывающее значение одной из переменных сохраняется в регрессии, если (1) оно является значимым согласно t-критерию и (2) оно и другие запаздывающие значения переменной вместе добавляют объясняющей силы к модели согласно F-тесту. Тогда нулевая гипотеза об отсутствии причинности по Грейнджеру не отвергается тогда и только тогда, когда в регрессии не сохраняются запаздывающие значения независимой переменной.

На практике может быть обнаружено, что ни одна переменная Грейнджера не вызывает другую, или что каждая из двух переменных Грейнджера вызывает другую.

Математическое утверждение

Пусть y и x - стационарные временные ряды. Чтобы проверить нулевую гипотезу о том, что x не вызывает y по Грейнджеру, сначала нужно найти подходящие запаздывающие значения y для включения в одномерную авторегрессию y:

yt = a 0 + a 1 yt - 1 + a 2 yt - 2 + ⋯ + amyt - m + ошибка t. {\ displaystyle y_ {t} = a_ {0} + a_ {1} y_ {t-1} + a_ {2} y_ {t-2} + \ cdots + a_ {m} y_ {tm} + {\ text {error}} _ {t}.}{\ displaystyle y_ {t } = a_ {0} + a_ {1} y_ {t-1} + a_ {2} y_ {t-2} + \ cdots + a_ {m} y_ {tm} + {\ text {error}} _ { t}.}

Затем авторегрессия дополняется включением запаздывающих значений x:

yt = a 0 + a 1 yt - 1 + a 2 yt - 2 + ⋯ + amyt - m + bpxt - p + ⋯ + bqxt - q + ошибка t. {\ displaystyle y_ {t} = a_ {0} + a_ {1} y_ {t-1} + a_ {2} y_ {t-2} + \ cdots + a_ {m} y_ {tm} + b_ {p } x_ {tp} + \ cdots + b_ {q} x_ {tq} + {\ text {error}} _ {t}.}{\ displaystyle y_ {t} = a_ {0} + a_ {1} y_ {t-1} + a_ {2} y_ {t-2} + \ cdots + a_ {m} y_ {tm} + b_ {p} x_ { tp} + \ cdots + b_ {q} x_ {tq} + {\ text {error}} _ {t}.}

В этой регрессии сохраняются все запаздывающие значения x, которые индивидуально значимы в соответствии с их t-статистика при условии, что вместе они добавляют объяснительную силу к регрессии в соответствии с F-тестом (нулевая гипотеза которого не является объяснительной силой, совместно добавляемой x). В обозначениях приведенной выше расширенной регрессии p - самый короткий, а q - самый длинный, длина лага, для которой значение x с запаздыванием является значительным.

Нулевая гипотеза о том, что x не является причиной y по Грейнджеру, принимается тогда и только тогда, когда в регрессии не сохраняются запаздывающие значения x.

Многомерный анализ

Многомерный анализ причинно-следственной связи по Грейнджеру обычно выполняется путем подгонки векторной авторегрессионной модели (VAR) к временному ряду. В частности, пусть X (t) ∈ R d × 1 {\ displaystyle X (t) \ in \ mathbb {R} ^ {d \ times 1}}X (t) \ in \ mathbb { R} ^ {d \ times 1} для t = 1,…, T {\ displaystyle t = 1, \ ldots, T}t = 1, \ ldots, Т быть d {\ displaystyle d}d -мерным многомерным временным рядом. Причинность по Грейнджеру выполняется путем подбора модели VAR с L {\ displaystyle L}L временными лагами следующим образом:

X (t) = ∑ τ = 1 LA τ X (t - τ) + ε (T), {\ Displaystyle X (t) = \ sum _ {\ tau = 1} ^ {L} A _ {\ tau} X (t- \ tau) + \ varepsilon (t),}{\ displaystyle X (t) = \ sum _ {\ tau = 1} ^ {L} A _ {\ tau} X (t- \ tau) + \ varepsilon (t),}

где ε (t) {\ displaystyle \ varepsilon (t)}\ varepsilon (t) - белый гауссовский случайный вектор, а A τ {\ displaystyle A _ {\ tau}}{\ displaystyle A _ {\ tau}} - матрица для каждого τ {\ displaystyle \ tau}\ tau . Временной ряд X i {\ displaystyle X_ {i}}X_ {i} называется причиной по Грейнджеру другого временного ряда X j {\ displaystyle X_ {j}}X_ {j} , если хотя бы один из элементов A τ (j, i) {\ displaystyle A _ {\ tau} (j, i)}A _ {\ tau} (j, i) для τ = 1,…, L { \ displaystyle \ tau = 1, \ ldots, L}\ tau = 1, \ ldots, L значительно больше нуля (по абсолютной величине).

Непараметрический тест

Вышеуказанные линейные методы являются подходит для проверки причинности по Грейнджеру в среднем. Однако они не могут обнаружить причинность Грейнджера в более высокие моменты, например, в дисперсии. Непараметрические тесты на причинность Грейнджера предназначены для решения этой проблемы. Определение причинности по Грейнджеру в этих тестах является общим и не включает никаких допущений моделирования, таких как линейная авторегрессионная модель. Непараметрические тесты на причинность Грейнджера могут использоваться в качестве диагностических инструментов для построения более совершенных параметрических моделей, включая моменты более высокого порядка и / или нелинейность.

Ограничения

Как его название подразумевает, что причинность Грейнджера не обязательно является истинной причинностью. Фактически, тесты на причинность Грейнджера удовлетворяют только Юмовскому определению причинности, которое идентифицирует причинно-следственные связи с постоянными конъюнкциями. Если и X, и Y управляются общим третьим процессом с разными задержками, можно все же не отвергнуть альтернативную гипотезу причинности Грейнджера. Тем не менее, изменение одной из переменных не изменит другую. Действительно, тесты на причинность Грейнджера предназначены для работы с парами переменных и могут давать вводящие в заблуждение результаты, если истинная связь включает три или более переменных. Сказав это, утверждалось, что с учетом вероятностного взгляда на причинность, причинность Грейнджера может считаться истинной причинностью в этом смысле, особенно когда принимается во внимание «экранирующее» понятие Рейхенбаха о вероятностной причинности. Другими возможными источниками ошибочных результатов тестирования являются: (1) недостаточно частая или слишком частая выборка, (2) нелинейная причинно-следственная связь, (3) нестационарность и нелинейность временных рядов и (4) наличие рациональных ожиданий. Аналогичный тест, включающий больше переменных, может быть применен с векторной авторегрессией.

Расширениями

Был разработан метод причинности по Грейнджеру, который нечувствителен к отклонениям от предположения, что член ошибки нормально распределен. Этот метод особенно полезен в финансовой экономике, поскольку многие финансовые переменные не имеют нормального распределения. Недавно в литературе было предложено провести тестирование на асимметричную причинно-следственную связь, чтобы отделить причинное влияние положительных изменений от отрицательных. Также доступно расширение (не) причинно-следственного тестирования по Грейнджеру на панельные данные. Модифицированный тест на причинность Грейнджера, основанный на типе GARCH (обобщенная авторегрессивная условная гетероскедастичность) моделей целочисленных временных рядов, доступен во многих областях.

В неврологии

Давно существовавшее мнение о нейронных функциях утверждало, что разные области мозга зависят от конкретной задачи; что структурная связь, локальная для определенной области, каким-то образом диктует функцию этой части. Собирая работу, которая выполнялась на протяжении многих лет, произошел переход к другому, сетецентрическому подходу к описанию потока информации в мозгу. Объяснение функции начинает включать понятие сетей, существующих на разных уровнях и в разных частях мозга. Поведение этих сетей можно описать недетерминированными процессами, развивающимися во времени. То есть при одном и том же входном стимуле вы не получите такой же выходной сигнал от сети. Динамика этих сетей определяется вероятностями, поэтому мы рассматриваем их как стохастические (случайные) процессы, чтобы мы могли уловить такую ​​динамику между различными областями мозга.

В прошлом были исследованы различные методы получения некоторой степени информационного потока от возбуждающей активности нейрона и окружающего его ансамбля, но они ограничены в видах выводов, которые можно сделать, и дают мало информации в направленный поток информации, размер его воздействия и то, как он может меняться со временем. Недавно причинно-следственная связь Грейнджера была применена для решения некоторых из этих проблем с большим успехом. Проще говоря, каждый исследует, как лучше всего предсказать будущее нейрона: используя либо весь ансамбль, либо весь ансамбль, кроме определенного целевого нейрона. Если прогноз ухудшается из-за исключения целевого нейрона, то мы говорим, что у него есть «g-причинная» связь с текущим нейроном.

Расширения точечных моделей процессов

Предыдущие методы причинности Грейнджера могли работать только с данными с непрерывным значением, поэтому анализ нейронных цепочек импульсов включал преобразования, которые в конечном итоге изменяли стохастические свойства данных, косвенно влияющие на обоснованность выводов, которые можно было сделать из них. В 2011 году, однако, была предложена новая универсальная структура причинно-следственной связи Грейнджера, которая могла напрямую работать с любой модальностью, включая цепочки нейронных всплесков.

Данные последовательности нейронных всплесков могут быть смоделированы как точка- процесс. Временной точечный процесс - это стохастический временной ряд двоичных событий, который происходит в непрерывном времени. Он может принимать только два значения в каждый момент времени, указывая, действительно ли произошло событие. Этот тип двоичного представления информации подходит для активности нейронных популяций, потому что потенциал действия отдельного нейрона имеет типичную форму волны. Таким образом, фактическую информацию, выводимую из нейрона, несет в себе возникновение «всплеска», а также время между последовательными всплесками. Используя этот подход, можно было бы абстрагировать поток информации в нейронной сети, чтобы он был просто временем всплеска для каждого нейрона в течение периода наблюдения. Точечный процесс может быть представлен либо временем самих всплесков, временем ожидания между всплесками, с использованием процесса подсчета, либо, если время достаточно дискретно, чтобы гарантировать, что в каждом окне только одно событие имеет возможность произойти, что означает, что один временной интервал может содержать только одно событие в виде набора единиц и нулей, что очень похоже на двоичное.

Одним из простейших типов моделей нейронных пиков является процесс Пуассона. Однако это ограничено тем, что не требует памяти. При расчете текущей вероятности срабатывания он не учитывает историю всплесков. Нейроны, однако, демонстрируют фундаментальную (биофизическую) зависимость от истории посредством своих относительных и абсолютных рефрактерных периодов. Чтобы решить эту проблему, функция условной интенсивности используется для представления вероятность импульса нейрона, обусловленная его собственной историей. Функция условной интенсивности выражает мгновенную вероятность срабатывания и неявно определяет полную вероятностную модель для точечного процесса. Он определяет вероятность в единицу времени. Таким образом, если это единичное время взять достаточно малым, чтобы гарантировать, что в этом временном окне может произойти только один всплеск, тогда наша функция условной интенсивности полностью определяет вероятность того, что данный нейрон сработает в определенное время.

См. Также
Ссылки
Дополнительная литература
Последняя правка сделана 2021-05-22 05:00:31
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте