Причинная модель

редактировать

Сравнение двух конкурирующихно-следственных моделей (DCM, GCM), используемых для интерпретации изображений с помощью фМРТ

В философия науки, причинная модель (или структурная причинная модель) - это концептуальная модель, которая имеет ные механизмы система. Причинно-следственные модели могут улучшить дизайн исследования, какие независимые переменные необходимо включить / контролировать.

Они могут ответить на некоторые вопросы на интервале данных наблюдений без необходимостиенционного исследования, такого как рандоманное контролируемое исследование. Некоторые интервенционные исследования не могут быть проверены на этические или практические причины, что означает, что без причинной модели могут быть проверены некоторые гипотезы.

Причинно-следственные модели могут помочь с вопросом внешней валидности (применимы ли результаты одного исследования к неизученным группам населения). Причинно-следственные модели могут объединить данные из нескольких исследований (при определенных обстоятельствах), чтобы ответить на вопросы, на которые нельзя ответить с помощью какого-либо отдельного набора.

Причинно-следственные модели фальсифицируются в том смысле, что если они не соответствуют данным, они должны быть отклонены как недействительные. Они также должны вызывать доверие у тех, кто близок к явлениям, которые модель намеревается объяснить.

Причинные модели применение в обработке сигналов, эпидемиологии и машинах. обучение.

Содержание

1 Определение
2
3 Лестница причинно-следственной связи
- 3.1 Ассоциация
- 3.2 Вмешательство
- 3.3 Контрфактические факторы
4 Причинная связь
- 4.1 Причинная связь и корреляция
- 4.2 Типы
  - 4.2.1 Необходимые
  - 4.2.2 Достаточные причины
  - 4.2.3 Дополнительные причины
5 Модель
- 5.1 Причинная диаграмма
- 5.2 Элементы модели
  - 5.2.1 Шаблоны соединений
    - 5.2.1 Цепочка
    - 5.2.1.2 Вилка
    - 5.2.1.3 Коллайдер
  - 5.2.2 Типы узлов
    - 5.2.2.1 Посредник
    - 5.2.2.2 Конфундер
  - 5.2. 3 Инструментальная переменная
  - 5.2.4 Менделевская рандомизация
6 Ассоциации
- 6.1 Условия независимости
- 6.2 Конфаундер / деконфаундер
  - 6.2.1 Корректировка бэкдора
  - 6.2.2 Корректировка входной двери
7 Вмешательства
- 7.1 Запросы
- 7.2 Выполнить исчисление
  - 7.2.1 Правила
    - 7.2.1.1 Правило 1
    - 7.2.1.2 Правило 2
    - 7.2.1.3 Правило 3
  - 7.2.2 Расширения
8 Контрфактические данные
- 8.1 Возможный исход
- 8.2 Причинный вывод
- 8.3 Проведение контрфактических действий
  - 8.3. 1 Похищение
  - 8.3.2 Действие
  - 8.3.3 Прогноз
- 8.4 Посредничество
  - 8.4.1 Прямой эффект
  - 8.4.2 Косвенный эффект
9 Транспортируемость
10 Байесовская сеть
11 Инварианты / контекст
12 См. Также
13 Ссылки
14 Источники
15 Внешние ссылки

Определение

Причинные модели - это математические модели, представляющие причинно-следственные связи внутри системы отдельной или совокупности. Они облегчают выводы о причинно-следственных связях на основе статистических данных. Они могут научить нас многому об эпистемологии причинно-следственной связи и взаимосвязи между причинностью и вероятностью. Они также применялись к темам, представляющим интерес для философов, такими как логика контрфактов, теория принятия решений и анализ действительной причинности.

— Стэнфордская энциклопедия философии

Джудея Перл определяет причинную модель как упорядоченная тройка $⟨U, V, E⟩ {\ displaystyle \ langle U, V, E \ rangle}$ $\ langle U, V, E \ rangle$ , где U - набор экзогенных чисел, значения которых используются факторыми вне модели; V - это набор эндогенных чисел, значения которых определяют факторы в модели; и E представляет собой набор структурных функций, которые выражают значение каждой эндогенной функции других переменных в U и V.

История

Аристотель определена таксономия причинности, включая материальные, формальные, эффективные и конечные причины. Юм отверг таксономию Аристотеля в пользу контрфактов. В какой-то момент он отрицал, что обладают «способностями», которые делают одно причиной, а другое - следствием. Позже он принял «если бы первого объекта не было, никогда не существовало бы» («, но - для » ».

В конце 19 века началась дисциплина статистики формировать. После многолетних усилий по определению правил для таких областей, как биологическая наследственность, Гальтон представил концепцию средней регрессии (воплощенной спадом на втором курсе в спорте.), Что привело его к беспричинной концепции корреляции.

Как позитивист, Пирсон исключение причинности из большей науки как недоказанный частный случай. ассоциации и ввел коэффициент корреляции в качестве показателя ассоциации. Он писал: «Сила как причина движения - это то же самое, что причина роста дерева», и эта причина была лишь «фетишем среди непостижимых тайн современной науки». Пирсон основал Биометрика и лабораторию биометрии в Университетский колледж Лондона, которые стали мировым лидером в области статистики.

В 1908 Харди и Вайнберг решил проблему стабильность черты, которая привела Гальтона к отказу отности, возродив менделевское наследование.

В 1921 году путь Райта Анализ стал теоретическим родоначальником причинного моделирования иных графов. Он разработал этот подход, пытаясь распутать относительное влияние на развитие и окружающую среду на устойчивую шерсти морской свинки. Он подтвердил свои тогдашние еретические утверждения, показав, как такой анализ может объяснить взаимосвязь между массой тела при рождении морской свинки, внутриутробным временем и размером помета. Противодействие этим показателям со стороны выдающихся статистиков привело к тому, что игнорирование этих случаев произошло в следующие 40 лет (за исключением животноводов). Вместо этого основания полагались на корреляции, частично по указанию критика Райта (и ведущего статистика), Фишера. Единственным заместителем был Бёркс, студент, который в 1926 году первым применил схемы для предоставления услуг опосредующего влияния (посредника) и утверждал, что поддержание константы посредника вызывает ошибки. Возможно, она изобрела путевые диаграммы независимо.

В 1923 году Нейман представил концепцию возможного результата, но его статья не была переведена с польского на английский до 1990 года.

В 1958 году Кокс предупреждал, что управление Z допустимо в том случае, если на него вряд ли повлияют независимые переменные.

В 1960-х годах Дункан, Блэлок, Голдбергер и другие заново открыли анализ пути. Читая работу Блэлока о путевых диаграммах, Дункан вспомнил лекцию Огберна двадцатью годами ранее, в которой упоминалась статья Райта, в которой, в свою очередь, упоминался Беркс.

Социологи используемых называли причинные модели структурными. моделирование уравнениями, но как только он стал механическим методом, он потерял свою полезность, что заставило некоторых практиков отвергнуть любую связь с причинностью. Экономисты получили алгебраическую часть анализа путей, назвав ее одновременным моделированием уравнений. Однако экономисты по-прежнему избегали приписывать причинный смысл своим уравнениям.

Через шестьдесят лет после своей первой статьи Райт опубликовал статью, в которой резюмировал ее, вслед за критикой Карлина и др., Которая возражала, что он обрабатывает только линейные отношения и что надежное, свободное от моделей представления данных было более показательным.

В 1973 Льюис выступал за замену корреляции на причинно-следственную связь (контрфакты). Он сослался на способность людей вообразить альтернативные миры, в результате чего возникла причина, вызванная причиной. В 1974 г. Рубин ввел понятие «среди результатов» как язык для постановки причинно-следственных вопросов.

В 1983 г. Картрайт предположил, что любой фактор, который является «причинно-релевантным» для достижения определенного эффекта, выход за рамки простой вероятности как единственного руководства.

В 1986 году Барон и Кенни ввели принципы обнаружения и оценки посредничества в системе линейных уравнений. По состоянию на 2014 год их статья занимала 33-е место среди самых цитируемых за все время. В том же году Гренландия и Робинс представили подход «взаимозаменяемости» к устранению путаницы путем контрфактического факта. Они предложили оценить, что случилось с группой лечения, если бы они не получили лечение, и сравнить этот результат с результатом контрольной группы. Если они совпадали, смешение считалось отсутствующим.

Лаборатория каузального искусственного интеллекта, которая пытается связать теорию причинного моделирования с искусственными нейронными сетями.

лестницей причинно-следственной связи

Каузальная метамодель Перла включает трехуровневую абстракцию, которую он называет лестницей причинности. Самый низкий уровень, ассоциация (видение / наблюдение), влечет за собой восприятие закономерностей или закономерностей во входных данных, выраженных в виде корреляций. Средний уровень, Вмешательство (действие), предсказывает последствия преднамеренных действий, выраженные в виде причинно-следственных связей. Самый высокий уровень, Противоречивые действия (воображение), включает построение теории (части) мира, которое объясняет, почему эффекты действия создают эффекты и что происходит в отсутствие таких действий.

Ассоциация

Один объект связан с другими, если наблюдение за одним изменяет вероятность наблюдения за другими. Пример: покупатели, покупающие зубную пасту, с большей вероятностью также купят зубную нить. Математически:

P (f l o s s | t o t p a s t e) {\ displaystyle P (floss \ vline зубная паста)}

{\ displaystyle P (зубная нить \ vline зубная паста)}

или вероятность (покупки) зубной пасты (покупки) зубной пасты. Связи также могут быть измерены путем вычисления корреляции двух событий. Ассоциации не имеют причинных последствий. Одно событие может вызвать другое, обратное может быть правдой, или оба события могут быть вызваны каким-то третьим событием (несчастный гигиенист заставляет покупателя относиться к своему рту).

Вмешательство

Этот уровень утверждает причинно-следственные связи между событиями. Причинность оценивается путем экспериментального выполнения некоторого действия, влияющего на одно из событий. Пример: если бы мы удвоили цену на зубную пасту, какова была бы новая вероятность покупки? Причинно-следственная связь не может быть установлена путем изучения истории (изменения цен), потому что могла изменить произойти по какой-то причине, которая сама повлиять на второе событие (тариф, увеличивающий цену на оба товара). Математически:

P (floss | do (зубная паста)) {\ displaystyle P (floss \ vline do (зубная паста))}

{\ displaystyle P (нить \ vline do (зубная паста))}

где do - оператор, который сигнализирует об экспериментальном вмешательстве (удвоение цены).

Противоречия

Наивысший, контрфактический уровень рассмотрение альтернативной версии прошлого. Пример: какова вероятность того, что, если бы магазин удвоил цену на зубную нить, покупатель зубной пасты все равно купил бы ее? Ответ «да» подтверждает наличие причинно-следственной связи. Модели, которые могут дать ответ на опровержение фактов, позволяют проводить точные вмешательства, последствия которых можно предсказать. В крайнем случае такие модели принимаются как физические законы (как в закон инерции, которая гласит, что если к неподвижному объекту не приложить силу, он не будет двигаться).

Причинность

Причинно-следственная связь и корреляция

Статистика вращается вокруг анализа взаимосвязей между переменными. Традиционно эти отношения описываются как корреляции, ассоциации без каких-либо подразумеваемых причинно-следственных связей. Причинные модели расширяют эту структуру, добавляя понятие-следствие связей, в которых изменения в одной из модификаций вызывают изменения в других.

Определения причинности в двадцатом веке основывались исключительно на вероятностях / ассоциациях. Было сказано, что одно событие (X) вызывает другое, если оно увеличивает вероятность другого (Y). Математически это выражается так:

P (Y | X)>P (Y) {\ displaystyle P (Y \ vline X)>P (Y)}

P(Y\vline X)>P (Y)

Такие определения, например, не соответствуютадны Общая причина для X и Y) может удовлетворять условию. Причинная связь имеет отношение ко второй ступени лестницы.

В более позднем определении сделана попытка использовать эту неоднозначность обусловлена. Математически:

P (Y | X, K = k)>P (Y | K = k) {\ displaystyle P (Y \ vline X, K = k)>P (Y | K = k) }

P(Y\vline X,K=k)>P (Y | K = k)

где K - набор фоновых чисел, а k предста вляет значения этих чисел в конкретном контексте. Однако требуемый набор фоновых чисел не определен (несколько наборов могут увеличить вероятность), пока вероятность стабильного критерием.

Другие методы определения причинно-следственной связи включают причинность Грейнджера, проверку статистической гипотезы о том, что причинно-следственная связь (в экономика ) может быть оценена путем измерения способности предсказывать значения одного временного ряда с использованием предыдущих значений другого временного ряда.

Типы

Причиной может быть необходимая, достаточная, вспомогательная или какая-то комбинация.

Необходимость

Для того, чтобы x был необходимой причиной y, наличие y должно означать предшествующее появление x. Однако наличие x не означает, что y произойдет. Необходимые причины также известны как причины «кроме», так как в y не было бы, если бы не возникло x.

Достаточные причины

Для того, чтобы x был достаточной причиной y, наличие x означало последующее появление y. Однако другая причина z может независимо вызывать y. Таким образом, наличие y не требует предшествующего появления x.

Дополнительные причины

Для того, чтобы x был сопутствующей причиной y, присутствие x должно было увеличить вероятность y. Если вероятность равна 100%, тогда x соответствует требованиям. Также может потребоваться сопутствующая причина.

Модель

Причинная диаграмма

Причинная диаграмма - это направленный граф, который отображает причинно-следственные связи отношения между переменными в причинной модели. Причинно-следственная диаграмма включает набор чисел (или узлов ). Каждый узел соединен стрелкой с одними другими узлами, на которые он оказывает причинное влияние. Острие стрелки обозначают направление причинно-следственной связи, например, стрелка, соединяющая переменные A и B со стрелкой в точке B, указывает, что изменение в A вызывает изменение в B (с использованием вероятности). Путь - это обход графа между узлами по причинно-следственным стрелкам.

Причинные диаграммы включают диаграммы причинных циклов, ориентированные ациклические графы и диаграммы Исикавы.

Диаграммыно-следственных связей не зависят от количественных вероятностей, которые их информируют. Изменения этих вероятностей (например, в результате технологических усовершенствований) не требуют изменений модели.

Элементы модели

Причинно-следственные модели имеют формальные структуры с элементами с определенными свойствами.

Шаблоны соединений

Три типа цепи трех узлов - это линейные объединяющиеся коллайдеры.

Цепь

Цепи - это прямые соединения со стрелками, указывающими причины создания влияния. В этой модели B является посредником в том смысле, что он опосредует изменения, в результате чего он может иметь место в C.

A → B → C {\ displaystyle A \ rightarrow B \ rightarrow C}

{\ displaystyle A \ rightarrow B \ rightarrow C}

Вилка

В вилках одна причина имеет несколько последствий. Эти два эффекта имеют общую причину. Существует (не причинная) ложная корреляция между A и C, которая может быть устранена путем обработки B (для определенного значения B).

A ← B → C {\ displaystyle A \ leftarrow B \ rightarrow C}

A \ leftarrow B \ rightarrow C

«Условие на B» означает «при заданном B» (т. Е. При заданном значении B).

Формирование вилки - это средство смешения:

A ← B → C → A {\ displaystyle A \ leftarrow B \ rightarrow C \ rightarrow A}

{\ displaystyle A \ leftarrow B \ rightarrow C \ rightarrow A}

В таких моделях B является обычной причиной A и C (которая также вызывает A), что делает B мешающим фактором.

Collider

В коллайдерах несколько причин влияет на один результат. Условие на B (для определенного значения B) часто выявляет непричинную отрицательную корреляцию между A и C. Эта отрицательная корреляция была названа смещением коллайдера и эффектом «отстранения от объяснений», как, например, B объясняет корреляцию между A и C. Корреляция может быть положительной в случае, когда вклады от A и C необходимы для воздействия на B.

A → B ← C {\ displaystyle A \ rightarrow B \ leftarrow C}

{\ displaystyle A \ rightarrow B \ leftarrow C}

Типы узлов

Посредник

Узел-посредник изменяет влияние других причин на результат (в отличие от простого влияния на результат). Например, в приведенном выше примере цепочки B является посредником, потому что он изменяет эффект A (косвенная причина C) на C (результат).

Confounder

Узел confounder влияет на несколько результатов, создавая между ними положительную корреляцию.

Инструментальная переменная

инструментальная переменная это тот, который:

имеет путь к результату
не имеет другого пути к причинным переменным
не имеет прямого влияния на результат

Коэффициенты регрессии могут служить оценками причинно-следственное влияние инструментальной переменной на результат, если этот эффект не смешивается. Таким образом, инструментальные переменные позволяют количественно оценить причинные факторы без данных о влияющих факторах.

Например, с учетом модели:

Z → X → Y ← U → X {\ displaystyle Z \ rightarrow X \ rightarrow Y \ leftarrow U \ rightarrow X}

{\ displaystyle Z \ rightarrow X \ rightarrow Y \ leftarrow U \ rightarrow X}

Z - инструментальная переменная, потому что она имеет путь к результату Y и не связана, например, с U.

В приведенном выше примере, если Z и X принимают двоичные значения, тогда предположение, что Z = 0, X = 1 не возникает, называется монотонностью.

Усовершенствования техники включают создание инструмента путем настройки другой переменной, чтобы заблокировать пути между инструментом и смешивающий фактор и объединение нескольких переменных в единый инструмент.

Менделирующая рандомизация

Определение: Менделирующая рандомизация использует измеренные вариации генов известной функции для изучения причинного эффекта модифицируемое воздействие на заболевание в обсервационных исследованиях.

Поскольку гены варьируются случайным образом в разных популяциях, наличие ген обычно квалифицируется как инструментальная переменная, подразумевая, что во многих случаях причинно-следственная связь может быть определена количественно с использованием регрессии в наблюдательном исследовании.

Связи

Условия независимости

Условия независимости - это правила определения независимости двух переменных друг от друга. Переменные независимы, если значения одной не влияют напрямую назначения другой. Множественные причинные модели могут разделять условия независимости. Например, модели

A → B → C {\ displaystyle A \ rightarrow B \ rightarrow C}

{\ displaystyle A \ rightarrow B \ rightarrow C}

A ← B → C {\ displaystyle A \ leftarrow B \ rightarrow C}

A \ leftarrow B \ rightarrow C

имеют те же условия независимости, потому что кондиционирование на B оставляет A и C независимыми. Однако эти две модели не имеют одинакового значения и могут быть фальсифицированы на основе данных (есть, если данные наблюдения показывают связь между A и C после кондиционирования на B, то обе модели неверны). И наоборот, данные не могут показать, какая из этих двух моделей верна, потому что они имеют одинаковые условия независимости.

Обусловленность критериев - это механизм для проведения гипотетических экспериментов. Условие для переменных включает анализ значений других значений для данного значения условной переменной. В первом примере определяется B подразумевает, что наблюдения для данного значения B не должны показывать зависимости между A и C. Если такая зависимость существует, то модель неверна. Не-причинные модели не могут проводить такие различия, потому что они не делают причинно-следственных утверждений.

Confounder / deconfounder

Существенным образцом корреляционного исследования являются искажающие искажающие на изучаемую переменную, например, демографические данные. Эти переменные контролируются для устранения этих влияний. Однако правильный список смешивающих чисел не может быть определен априори. Таким образом, возможно, что исследование может контролировать нерелевантные переменные или даже (косвенно) изучаемую переменную.

Причинно-следственные модели возникают надежную технику для определенных смешанных чисел. Формально Z является затруднительным, если «Y связан с Z путями, не проходящими через X». Их часто можно найти, используя данные, собранные для других исследований. Математически, если

P (Y | X) ≠ P (Y | do (X)) {\ displaystyle P (Y | X) \ neq P (Y | do (X))}

{\ Displaystyle P (Y | X) \ neq P (Y | do (X))}

, то X является смущающий фактор для Y.

Ранее предположительно неправильные определяющие включали:

«Любая переменная, которая коррелирует как с X, так и с Y».
Y ассоциируется с Z среди неэкспонированных.
Несокрушимость: разница между «приблизительным относительным риском и относительным риском, увеличивающим после поправки на потенциальный искажающий фактор».
Эпидемиологический: переменная, связанная с X в целом и связанная с Y среди людей, не подвергавшихся воздействию X.

Последнее имеет изъян, учитывая, что в модели:

X → Z → Y {\ displaystyle X \ rightarrow Z \ rightarrow Y}

{\ displaystyle X \ rightarrow Z \ rightarrow Y}

Z соответствует определению, но является посредником, а не путник, и является примером контроля за результатом.

В модели

X ← A → B ← C → Y {\ displaystyle X \ leftarrow A \ rightarrow B \ leftarrow C \ rightarrow Y}

{\ Di splaystyle X \ leftarrow A \ rightarrow B \ l eftarrow C \ rightarrow Y}

Традиционно B считался искажающим, потому что он связан с X и с Y, но не находится на причинном пути. Контроль для B заставляет его стать помехой. Это известно как M-смещение.

Корректировка бэкдора

Для анализа воздействия X на причины в модели нам необходимо скорректировать все смешанные переменные (деконфаундирование). Чтобы идентифицировать набор мешающих факторов, нам необходимо (1) заблокировать каждый не причинный путь между X и Y набором (2) причин без каких-либо нарушений-либо путейных путей и (3) без создания каких-либо ложных путей.

Определение : a черный ход от X к Y - это любой путь от X к Y, который начинается со стрелками, указывающими на X.

Определение : дана упорядоченная пара размер (X, Y) в модели, набор искажающих переменных Z удовлетворяют критерию бэкдора, если (1) никакая смешивающая переменная Z не является потомком X и (2) все бэкдорные пути между X и Y заблокированы набором мешающих факторов.

Если критерий бэкдора удовлетворяется для (X, Y), X и Y деконфированы набором смешанных чисел. Нет контролировать какие-либо переменные, кроме альтернативных факторов. Критерий «черного хода» - достаточное, но не необходимое условие для набора числовых значений Z, позволяющих избавиться от анализа факторов воздействия X на y.

Когда причинная модель является правдоподобным представлением реальности и удовлетворяет критерий бэкдора, тогда коэффициенты частичной регрессии могут быть в качестве (причинных) путевых коэффициентов (для линейных отношений).

п (Y | делать (X)) знак равно ∑ Z п (Y | X, Z = Z) п (Z = z) {\ displaystyle P (Y | do (X)) = \ textstyle \ sum _ {z} \ displaystyle P (Y | X, Z = z) P (Z = z)}

{\ displaystyle P (Y | do (X)) = \ textstyle \ сумма _ {z} \ displaystyle P (Y | X, Z = z) P (Z = z)}

Регулировка входной двери

Определение : входной путь - это прямой причинный путь, данные для которого доступны для всех сумма.

следующее преобразует выражение, сделанное в формулировке путем определения длины пути входной двери.

P (Y | do (X)) = ∑ Z P (Z = z, X) ∑ x P (Y | Икс знак равно Икс, Z = Z) п (Икс = Икс) {\ Displaystyle P (Y | сделать (X)) = \ textstyle \ sum _ {z} \ Displaystyle P (Z = Z, X) \ textstyle \ sum _ {x} \ displaystyle P (Y | X = x, Z = z) P (X = x)}

{\ Displaystyle P (Y | сделать (X)) = \ textstyle \ sum _ {z} \ displaystyle P (Z = z, X) \ textstyle \ sum _ {x} \ displaystyle P (Y | X = x, Z = z) п (Икс = х)}

Предполагаемая, что данные для этих наблюдаемых вероятностей доступны, окончательную вероятность можно вычислить без эксперимента независимо от Существование других запутанных путей и без корректировки бэкдора.

Вмешательства

Запросы

Запросы - это вопросы, которые задаются на основе конкретной модели. Обычно на них путем проведения экспериментов (вмешательств). Вмешательства формулы изменения значения одной переменной в модели и наблюдения за результатом. Математически такие запросы принимают форму (из примера):

P (floss | do (зубная паста)) {\ displaystyle P ({\ text {floss}} \ vline do ({\ text {зубная паста}}))}

{\ displaystyle P ({\ text {floss}} \ vline do ({\ text {зубная паста}}))}

где оператор do указывает, что эксперимент явно изменил цену зубной пасты. Графически это блокирует любые причинные факторы, которые в наибольшей степени могут повлиять на эту переменную. На диаграмме это стирает все причинные стрелки, указывающие на экспериментальную переменную.

Возможны более сложные пакеты, которые оператор выполняет (значение установлено) к нескольким переменным.

Исчисление Do

Исчисление do - это набор доступных манипуляций для преобразования одного выражения в другое с общей трансформацией выражения, в выражениях, которые этого не делают. Выражения, которые не включают в себя оператор, можно оценить на основании данных наблюдений без необходимости экспериментального вмешательства, которое может быть дорогостоящим, длительным или даже неэтичным (например, просить субъектов бросить ку ку). Набор правил завершен (его можно использовать для получения каждого истинного утверждения в этой системе). Алгоритм может определить, является ли решение для модели данной вычислимым за полиномиальное время.

Правила

Исчисление включает три правила для преобразования выражений условной вероятности с использованием оператора do.

Правило 1

Правило 1 разрешает добавление или удаление наблюдений:

P (Y | do (X), Z, W) = P (Y | do (X), Z) {\ displaystyle P (Y | do (X), Z, W) = P (Y | do (X), Z)}

{\ displaystyle P (Y | do (X), Z, W) = P (Y | do (X), Z)}

в случае, если набор чисел Z блокирует все пути от W до Y и все стрелки, ведущие к X, удалены.

Правило 2

Правило 2 разрешает замену наблюдения или наоборот:

P (Y | do (X), Z) = P (Y | X, Z) {\ displaystyle P (Y | do (X), Z) = P (Y | X, Z)}

{\ displaystyle P (Y | do (X), Z) = П (Y | X, Z)}

в случае, если Z удовлетворяет критерий задней двери.

Правило 3

Правило 3 разрешает удаление или добавление вмешательств.:

P (Y | do (X)) = P (Y) {\ displaystyle P (Y | do (X)) = P (Y)}

{\ displaystyle P (Y | do (X)) = P (Y)}

в случае, когда никакие пути не соединяют X и Y.

Расширения

Правила не подразумевают, что любой запрос может иметь свои операторы do удалены. В этих случаях может быть преобразована переменная, которая может быть заменена манипуляцией (например, диета), вместо используемой вместо нее (например, холестерин в крови), которая может быть преобразована для удаления do. Пример:

P (Болезнь сердца | do (холестерин в крови)) = P (Болезнь сердца | do (диета)) {\ displaystyle P ({\ text {Сердечная болезнь}} | do ({\ text {холестерин в крови})})) = P ({\ text {Сердечная болезнь}} | do ({\ text {diet}}))}

{\ displaystyle P ({\ text {Болезнь сердца}} | do ({\ text {холестерин в крови}})) = P ({\ text {Болезнь сердца}} | сделать ({\ текст {диета}}))}

Контрольные факты

Контрольные выводы рассматривают возможности, не найденные в данных, например, Некурящий заболел бы раком, если бы он был заядлым курильщиком. Это высшая ступенька лестницы причинно-следственной связи Перл.

Возможный

Определение: потенциальный результат для альтернативного Y - это «значение Y, которое приняло бы для отдельного u, если бы X было присвоено значение x». Математически:

YX = x (u) {\ displaystyle Y_ {X} = \ _ {x} (u)}

{\ displaystyle Y_ {X} = \ _ {x} (u)}

или

Y x (u) {\ displaystyle Y_ {x} (u)}

{\ displaystyle Y_ {x} (u)}

Потенциальный результат определяется на уровне индивидуума u.

Традиционный подход к потенциальным результатам основан на данных, а не на модели, что ограничивает его способность распутывать причинно-следственные связи. Он рассматривает причинно-следственные вопросы как проблемы с отсутствием данных и неправильные ответы даже на стандартные сценарии.

Причинный вывод

В контексте причинно-следственных возможных возможных результатов интерпретируютсяно, а не статистически.

Первый закон причинного вывода гласит, что потенциальный результат

YX (u) {\ displaystyle Y_ {X} (u)}

{\ displaystyle Y_ {X} (u)}

может быть вычислен путем изменения причинного модели M (удаляя стрелки в X) и вычисляя результат для некоторого x. Формально:

YX (u) = YM x (u) {\ displaystyle Y_ {X} (u) = Y_ {Mx} (u)}

{\ displaystyle Y_ {X } (u) = Y_ {Mx} (u)}

Проведение контрфактов

Изучение контрфактов с использованием причинно -следственная модель включает три шага. Подход действителен независимо от формы отношений модели (линейной или иной). Когда отношения модели полностью указаны, можно вычислить значения точек. В других случаях (например, когда доступны только вероятности) можно вычислить утверждение вероятностного интервала (равенщий x будет иметь 10-20% шанс заболеть раком).

Учитывая модель:

Y ← X → M → Y ← U {\ displaystyle Y \ leftarrow X \ rightarrow M \ rightarrow Y \ leftarrow U}

{\ displaystyle Y \ leftarrow X \ rightarrow M \ rightarrow Y \ leftarrow U}

уравнения для вычисления значений A и C, полученные из регрессионного анализа, или может быть применен другой метод, подставляя известные значения из наблюдений и фиксируя значения других чисел (контрфакты).

Abduct

Применяйте абдуктивное рассуждение (логический вывод который использует наблюдение для поиска простейшего / наиболее вероятного объяснения) для оценки u, прокси для ненаблюдаемых терминов в конкретном наблюдении, поддерживает контрфакты.

Act

Для конкретного наблюдения використовуйте оператор do, чтобы установить противоречие (например, m = 0), соответствующим образом изменив уравнения.

Predict

Вычислить значения выходных данных (y) с использованием модифицированных формул.

Посредничество

Прямые и косвенные (опосредованные) причины можно различить путем проведения контрфактов. Понимание посредничества требует, чтобы посредник оставался постоянным, пока он вмешивается в прямую причину. В модели

$Y ← M ← X → Y {\ displaystyle Y \ leftarrow M \ leftarrow X \ rightarrow Y}$ ${\ displaystyle Y \ leftarrow M \ leftarrow X \ стрелка вправо Y}$

M опосредует влияние X на Y, в то время как X также оказывает непосредственное влияние на Y. Таким образом, M остается константой, в то время как do (X) вычисляется.

Ошибка посредничества вместо этого включает в себя обусловливание посредника, если посредник и результат смешаны, как в приведенной выше модели.

Для линейных моделей косвенный эффект можно вычислить, взяв произведение всех коэффициентов пути вдоль опосредованного пути. Общий косвенный эффект рассчитывается как сумма различных эффектов. Для линейных моделей посредничество указывается, когда коэффициенты уравнения, подобранного без включения посредника, значительно отличаются от уравнения, которое его включает.

Прямой эффект

В экспериментах с такой моделью контролируемое прямое эффект (CDE) вычисляется путем принудительного определения значения посредника M (do (M = 0)) и случайного присвоения некоторых субъектов каждому из значений X (do (X = 0), do (X = 1),...) и наблюдая за полученными значениями Y.

CDE (0) = P (Y = 1 | do (X = 1), do (M = 0)) - P (Y = 1 | do (X = 0), сделать (M = 0)) {\ Displaystyle CDE (0) = P (Y = 1 | сделать (X = 1), сделать (M = 0)) - P (Y = 1 | сделать (X = 0), do (M = 0))}

{\ displaystyle CDE (0) = P (Y = 1 | do (X = 1), do (M = 0)) - P (Y = 1 | do (X = 0), do (M = 0))}

Каждому значению посредника соответствует CDE.

Однако лучший эксперимент - вычислить естественный прямой эффект. (NDE) Этот эффект определяется тем, что отношения между X и M не затрагиваются, а отношения между X и Y остаются неизменными.

NDE = P (YM = M 0 = 1 | do (X = 1)) - P (YM = M 0 = 1 | делать (X = 0)) {\ displaystyle NDE = P (Y_ {M = M0} = 1 | do (X = 1)) - P (Y_ {M = M0} = 1 | do (X = 0))}

{\ displaystyle NDE = P (Y_ {M = M0} = 1 | сделать (X = 1)) - P (Y_ {M = M0} = 1 | do (X = 0))}

Например, рассмотрим прямой эффект увеличения посещений стоматолога-гигиениста (X) от одного раза к другому каждый год, что способствует использованию зубной нити (M). Десны (Y) становятся более здоровыми благодаря гигиенисту (прямой) или нитью (посредник / непрямой). Эксперимент заключается в продолжении чистки зубной нитью без посещения гигиениста.

Косвенное влияние

Косвенное влияние X на Y - это «увеличение, которое мы увидим в Y, если бы X оставалось постоянным и увеличивая M до того значения, которое M могло бы получить при увеличении X на единицу».

Косвенные эффекты нельзя «контролировать», потому что прямой путь нельзя отключить, удерживая другую переменную постоянной. Естественный косвенный эффект (NIE) - это влияние на здоровье десен (Y) зубной нити (M). NIE рассчитывается как сумма (случаев использования зубной нити и отсутствия зубной нити) разницы между вероятностью использования зубной нити с учетом гигиениста и без него, или:

NIE = ∑ m [P (M = m | X = 1) - P (M = m | X = 0)] xx P (Y = 1 | X = 0, M = m) {\ displaystyl e NIE = \ sum _ {m} [P (M = m | X = 1) -P (M = m | X = 0)] xxP (Y = 1 | X = 0, M = m)}

{\ displaystyle NIE = \ sum _ {m} [P (M = m | X = 1) -P (M = m | X = 0)] xxP (Y = 1 | X Знак равно 0, M = m)}

Приведенный выше расчет NDE включает контрфактические индексы ( $YM = M 0 {\ displaystyle Y_ {M = M0}}$ ${\ displaystyle Y_ {M = M0}}$ ). Для нелинейных моделей кажущаяся очевидная эквивалентность

T otaleffect = D irecteffect + I ndirecteffect {\ displaystyle {\ mathsf {Total \ effect = Direct \ effect + Indirect \ effect}}}

{\ displaystyle {\ mathsf {Total \ effect = Direct \ effect + Косвенный \ эффект}}}

не имеет из-за аномалий, таких как как пороговые эффекты и двоичные значения. Тем не менее,

Эффект (X = 0 → X = 1) = NDE (X = 0 → X = 1) - NIE (X = 1 → X = 0) {\ displaystyle {\ mathsf {Total \ effect} } (X = 0 \ rightarrow X = 1) = NDE (X = 0 \ rightarrow X = 1) - \ NIE (X = 1 \ rightarrow X = 0)}

{\ displaystyle {\ mathsf {Total \ effect}} (X = 0 \ rightarrow X = 1) = NDE (X = 0 \ rightarrow X = 1) - \ NIE (X = 1 \ rightarrow X = 0)}

работает для всех взаимосвязей моделей (линейных и нелинейных). Это позволяет использовать NDE непосредственно на основе данных наблюдений, без вмешательства или использования контрфактических индексов.

Транспортируемость

Причинно-следственные модели обеспечивают средство для интеграции данных из наборов данных, известное как перенос, даже если причинно-следственные модели (и связанные с ними данными) различаются. Например, данные опроса могут быть объединены с данными рандомизированного контролируемого исследования. Транспорт предлагает решение вопроса о внешней достоверности.

Если две модели совпадают по всем релевантным переменным, а данные одной модели заведомо беспристрастны, данные одной генеральной совокупности можно использовать, чтобы сделать выводы о другом. В других случаях, когда известно, что данные предвзяты, повторное взвешивание может перенести набор данных. В третьем случае выводы можно сделать на основе неполного набора данных. В некоторых случаях исследований нескольких популяций можно объединить (с помощью транспорта), чтобы сделать выводы о неизмеренной популяции. В некоторых случаях объединение оценок (например, P (W | X)) из исследований может повысить заключение.

Do-исчисление обеспечивает общий критерий для переноса: целевая переменная может быть преобразована в другое выражение через серию do-операций, не использующих «производящих различных» переменных (тех, которые различают две популяции). Аналогичное правило применяется к исследованиям, в которых участвуют соответственно разные участники.

Байесовская сеть

Любая причинная модель может быть применена как байесовская. Байесовские сети Мои сообщения для определения обратной вероятности события (учитывая исходную, каковы вероятности конкретной причины). Это требует подготовки таблицы условной вероятности, показывающей все возможные входные данные и результаты с их вероятностями.

Например, для модели с двумя переменными - болезни и теста (для болезни) таблица условной вероятности принимает вид:

<эта86>12

Вероятность положительного результата теста на данное заболевание
	Тест
Болезнь	Положительный	Отрицательный
Отрицательный	88
Положительный	73	27

Согласно таблице, когда у пациента нет заболевания, вероятность положительного теста составляет 12%.

Хотя это можно для небольших задач, по мере увеличения числа и связанных с ними чисел вероятностей (и связанное с ними время вычислений) увеличивается экспоненциально.

Байесовские сети используются в коммерческих целях в приложениях. такие как исправление ошибок в беспроводных данных и анализ ДНК.

Инварианты / контекст

Другая концепция инвариантных отношений включает в себя понятие инвариантных отношений. В случае идентификации рукописных цифр значение контролируется цифрами, поэтому форма и значение являются инвариантами. Изменение формы меняет смысл. Другие свойства нет (например, цвет). Эта инвариантность должна распространяться на наборы данных, созданных в разных контекстах (неинвариантные свойства формируют контекст). Вместо обучения (причинно-следственной связи) с использованием объединенных наборов данных обучения на одном и тестировании на другом может помочь отличить вариант от инвариантных свойств.

См. Также

Причинная сеть - байесовская сеть с явным требованием причин, чтобы были отношениями
Моделирование структурным уравнением - статистический метод для тестирования и оценкино-следственных связей
Анализ путей (статистика)
Байесовская сеть

Ссылки

Источники

Перл, Иудея (14.09.2009). Причинно-следственная связь. Издательство Кембриджского университета. ISBN 9781139643986. CS1 maint: ref = harv (ссылка )

Внешние ссылки

Перл, Иудея (26.02.2010). «Введение в причинный вывод». Международный журнал биостатистики. 6 (2): Статья 7. doi : 10.2202 / 1557-4679.1203. ISSN 1557-4679. PMC 2836213. PMID 20305706.
Причинное моделирование at PhilPapers
Фальк, Дэн (2019-03-17) «Алгоритмы AI теперь потрясающе хороши в науке». Wired. ISSN 1059-1028. Проверено 20 марта 2019 г.
Модлин, Тим (30 августа 2019 г.). «Почему в мире». Boston Review. Дата обращения 2019-09.09.
Хартнетт, Кевин. «Создавать действительно интеллектуальные машины, обучать их причине и следствию». Quanta Magazine. Дата обращения 19.09.2019.

^Изучение представлений с использованием причинной инвариантности, ICLR, февраль 2020 г., получено 2020-02-10