Ложная связь

редактировать
очевидная корреляция между причинно-независимыми переменными В то время как посредник является фактором в причинно-следственной цепочке (1), вмешивающимся фактором является ложный фактор, неверно предполагающий причинно-следственную связь (2)

В статистике, ложная связь или ложная корреляция - это математическая связь в какие два или более события или переменных связаны, но не причинно связаны из-за совпадения или наличия определенного третьего, невидимого фактора (называемого «переменная общего отклика», «смешивающий фактор» или «скрытая переменная »).

Содержание

  • 1 Примеры
  • 2 Проверка гипотез
  • 3 Выявление ложных взаимосвязей
    • 3.1 Эксперименты
    • 3.2 Неэкспериментальный статистический анализ
  • 4 Другие взаимосвязи
  • 5 См. Также
  • 6 Сноски
  • 7 Ссылки
  • 8 Внешние ссылки

Примеры

Хорошо известный случай ложной связи можно найти в литературе по временным рядам, где ложная регрессия - это регрессия, которая предоставляет вводящие в заблуждение статистические данные о линейной связи между независимыми нестационарными переменными. Фактически, нестационарность может быть связана с наличием единичного корня в обеих переменных. В частности, любые две номинальные экономические переменные, вероятно, будут коррелированы друг с другом, даже если ни одна из них не оказывает причинно-следственного воздействия на другую, потому что каждая равна реальной переменной, умноженной на уровень цен, и общее присутствие уровня цен в двух рядах данных придает им корреляцию. (См. Также Ложная корреляция соотношений.)

Пример ложной взаимосвязи можно увидеть, исследуя продажи мороженого в городе. Эти продажи являются самыми высокими, когда процент утоплений в городских бассейнах самый высокий. Утверждать, что продажа мороженого вызывает утопление, или наоборот, значило бы подразумевать ложные отношения между ними. На самом деле, волна тепла могла вызвать и то, и другое. Волна жары - это пример скрытой или невидимой переменной, также известной как смешивающая переменная.

Другой часто упоминаемый пример - серия голландской статистики, показывающая положительную корреляцию между количеством аистов, гнездящихся в серии родников. и количество человеческих младенцев, рожденных в то время. Конечно, причинной связи не было; они были соотнесены друг с другом только потому, что были соотнесены с погодой за девять месяцев до наблюдений. Однако Höfer et al. (2004) показали, что корреляция сильнее, чем просто погодные колебания, поскольку он мог показать в Германии после воссоединения, что, хотя количество клинических родов не было связано с ростом популяции аистов, роды вне больниц коррелировали с популяцией аистов. 128>

В редких случаях может возникнуть ложная связь между двумя совершенно не связанными переменными без какой-либо смешивающей переменной, как это было в случае успеха профессиональной футбольной команды Washington Redskins в конкретной игре перед каждой президентские выборы и успех политической партии действующего президента на указанных выборах. В течение 16 последовательных выборов в период с 1940 по 2000 год Правило Краснокожих правильно соответствовало тому, сохранит ли политическая партия действующего президента президентский пост или потеряет его. Правило в конечном итоге не сработало вскоре после того, как Спортивное бюро Элиаса обнаружило корреляцию в 2000 году; в 2004, 2012 и 2016 годах результаты игры Redskins и выборов не совпадали.

Проверка гипотез

Часто проверяется нулевая гипотеза об отсутствии корреляции между двумя переменными и выбирается в заранее отклонить гипотезу, если бы корреляция, вычисленная на основе выборки данных, имела бы место менее (скажем) в 5% выборок данных, если бы нулевая гипотеза была верной. В то время как истинная нулевая гипотеза будет принята в 95% случаев, в остальных 5% случаев, когда истинный нуль или корреляция отсутствует, нулевая корреляция будет ошибочно отклонена, что приведет к принятию ложной корреляции (событие, известное как Ошибка типа I ). Здесь ложная корреляция в выборке возникла в результате случайного выбора выборки, которая не отражала истинные свойства основной совокупности.

Обнаружение ложных отношений

Термин «ложные отношения» обычно используется в статистике и, в частности, в методах экспериментальных исследований, которые пытаются для понимания и прогнозирования прямых причинно-следственных связей (X → Y). Не причинная корреляция может быть ложно создана антецедентом, который вызывает оба (W → X и W → Y). Переменные-посредники, (X → W → Y), если они не обнаружены, оценивают общий эффект, а не прямой эффект без корректировки для переменной-посредника M. Из-за этого экспериментально выявленные корреляции действительно не представляют причинно-следственные связи, если нельзя исключить ложные связи.

Эксперименты

В экспериментах ложные взаимосвязи часто можно определить, контролируя другие факторы, включая те, которые были теоретически определены как возможные мешающие факторы. Например, рассмотрим исследователя, пытающегося определить, убивает ли новый препарат бактерии; когда исследователь применяет препарат к бактериальной культуре, бактерии погибают. Но чтобы помочь исключить наличие мешающей переменной, другая культура подвергается условиям, которые максимально идентичны тем, с которыми сталкивается первая культура, но вторая культура не подвергается воздействию препарата. Если в этих условиях присутствует невидимый смешивающий фактор, эта контрольная культура также погибнет, так что по результатам первой культуры нельзя будет сделать вывод об эффективности препарата. С другой стороны, если контрольная культура не погибает, исследователь не может отвергнуть гипотезу об эффективности препарата.

Неэкспериментальный статистический анализ

Дисциплины, данные которых в основном не экспериментальны, такие как экономика, обычно используют данные наблюдений для установления причинно-следственных связей. Свод статистических методов, используемых в экономике, называется эконометрикой. Основным статистическим методом в эконометрике является многомерный регрессионный анализ. Обычно линейная зависимость, такая как

y = a 0 + a 1 x 1 + a 2 x 2 + ⋯ + akxk + e {\ displaystyle y = a_ {0} + a_ {1} x_ {1} + a_ { 2} x_ {2} + \ cdots + a_ {k} x_ {k} + e}y = a_0 + a_1x_1 + a_2x_2 + \ cdots + a_kx_k + e

предполагается, в котором y {\ displaystyle y}y является зависимой переменной (гипотетически быть вызванной переменной), xj {\ displaystyle x_ {j}}x_ {j} для j = 1,..., k - независимая переменная j (предположительно является причинной переменной), и e {\ displaystyle e}e - термин ошибки (содержащий комбинированные эффекты всех других причинных переменных, которые не должны коррелировать с включенными независимыми переменными). Если есть основания полагать, что ни один из xj {\ displaystyle x_ {j}}x_ {j} s не вызван y, тогда оценки коэффициентов aj {\ displaystyle a_ {j} }a_ {j} получены. Если нулевая гипотеза aj = 0 {\ displaystyle a_ {j} = 0}a_ {j} = 0 отклоняется, то альтернативная гипотеза aj ≠ 0 {\ displaystyle a_ {j} \ neq 0}a_ {j} \ neq 0 и, что то же самое, xj {\ displaystyle x_ {j}}x_ {j} вызывает y не может быть отклонено. С другой стороны, если нулевая гипотеза о том, что aj = 0 {\ displaystyle a_ {j} = 0}a_ {j} = 0 не может быть отклонена, то эквивалентно гипотеза об отсутствии причинного эффекта xj { \ displaystyle x_ {j}}x_ {j} по y не может быть отклонено. Здесь понятие причинности является одним из сопутствующей причинности : если истинное значение aj ≠ 0 {\ displaystyle a_ {j} \ neq 0}a_ {j} \ neq 0 , то изменение в xj {\ displaystyle x_ {j}}x_ {j} приведет к изменению y, если какая-либо другая причинная переменная, либо включенная в регрессию, либо неявная в члене ошибки, не изменится таким образом как точно компенсировать его эффект; таким образом, изменения x j {\ displaystyle x_ {j}}x_ {j} недостаточно для изменения y. Аналогичным образом, изменение xj {\ displaystyle x_ {j}}x_ {j} не обязательно для изменения y, потому что изменение y может быть вызвано чем-то неявным в термине ошибки (или каким-либо другим причинная объясняющая переменная, включенная в модель).

Регрессионный анализ контролирует другие релевантные переменные, включая их в качестве регрессоров (независимых переменных). Это помогает избежать ошибочного вывода о причинно-следственной связи из-за наличия третьей, лежащей в основе, переменной, которая влияет как на потенциально причинную переменную, так и на потенциально вызванную переменную: ее влияние на потенциально вызванную переменную фиксируется путем прямого включения ее в регрессию, поэтому этот эффект не будет рассматриваться как ложный эффект рассматриваемой потенциально причинной переменной. Кроме того, использование многомерной регрессии помогает избежать ошибочного вывода о том, что косвенное влияние, скажем, x 1 (например, x 1 → x 2 → y) является прямым эффектом (x 1 → y).

Подобно тому, как экспериментатор должен быть осторожен при использовании экспериментального плана, который учитывает каждый смешивающий фактор, так и пользователь множественной регрессии должен быть осторожен, чтобы контролировать все смешивающие факторы, включая их в число регрессоров. Если смешивающий фактор не включен в регрессию, его влияние отражается в члене ошибки по умолчанию, и если результирующий член ошибки коррелирует с одним (или несколькими) включенными регрессорами, то оценочная регрессия может быть смещенной или непоследовательной ( см. смещение пропущенной переменной ).

В дополнение к регрессионному анализу данные можно исследовать, чтобы определить, существует ли причинно-следственная связь по Грейнджеру. Наличие причинности Грейнджера указывает на то, что x предшествует y, и что x содержит уникальную информацию о y.

Другие взаимосвязи

Есть несколько других взаимосвязей, определенных в статистическом анализе следующим образом.

См. Также

Сноски

Ссылки

  • Banerjee, A.; Dolado, J.; Galbraith, J. W.; Хендри, Д. Ф. (1993). Коинтеграция, исправление ошибок и эконометрический анализ нестационарных данных. Издательство Оксфордского университета. С. 70–81. ISBN 0-19-828810-7.
  • Перл, Иудея (2000). Причинно-следственная связь: модели, рассуждения и выводы. Издательство Кембриджского университета. ISBN 0521773628.

Внешние ссылки

Последняя правка сделана 2021-06-09 04:03:59
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте