Анализ пути (статистика)

редактировать

В статистике анализ пути используется для описания направленных зависимостей среди набора переменных. Сюда входят модели, эквивалентные любой форме множественного регрессионного анализа, факторного анализа, канонического корреляционного анализа, дискриминантного анализа, а также многого другого. общие семейства моделей в многомерном анализе дисперсии и ковариационном анализе (MANOVA, ANOVA, ANCOVA ).

Помимо того, что анализ пути рассматривается как форма множественной регрессии с акцентом на причинно-следственные связи, его можно рассматривать как частный случай моделирования структурным уравнением (SEM), в котором только один индикаторы используются для каждой из переменных в причинной модели. То есть, анализ пути - это SEM со структурной моделью, но без модели измерения. Другие термины, используемые для обозначения анализа пути, включают причинное моделирование, анализ ковариации структур и модели скрытых переменных.

анализ пути рассматривается Judea Pearl как прямой предок методов Причинный вывод.

Содержание

1 История
2 Моделирование пути
3 Правила трассировки пути
- 3.1 Трассировка пути в нестандартных моделях
4 См. также
5 Ссылки
6 Внешние ссылки

История

Анализ путей был разработан примерно в 1918 году генетиком Сьюэлом Райтом, который более подробно писал об этом в 1920-х годах. С тех пор он был применен к огромному количеству сложных областей моделирования, включая биологию, психологию, социологию и эконометрику.

моделирование пути

Как правило, модели путей состоят из независимых и зависимых переменных, графически изображенных прямоугольниками или прямоугольниками. Переменные, которые являются независимыми переменными, а не зависимыми переменными, называются «экзогенными». Графически эти блоки экзогенных переменных лежат на внешних краях модели и имеют только односторонние стрелки, выходящие из них. Односторонние стрелки не указывают на экзогенные переменные. Переменные, которые являются исключительно зависимыми переменными или одновременно независимыми и зависимыми переменными, называются «эндогенными». Графически эндогенные переменные имеют по крайней мере одну однонаправленную стрелку, указывающую на них.

В модели ниже две экзогенные переменные (Ex 1 и Ex 2) моделируются как коррелированные, как показано двойным -головая стрелка. Обе эти переменные имеют прямое и косвенное (через En 1) эффекты на En 2 (две зависимые или «эндогенные» переменные / факторы). В большинстве моделей реального мира на эндогенные переменные также могут влиять переменные и факторы, происходящие извне модели (внешние эффекты, включая ошибку измерения). Эти эффекты обозначены буквой «е» или ошибкой в модели.

Пример пути.JPG

Используя те же переменные, возможны альтернативные модели. Например, можно предположить, что Ex 1 имеет только косвенное влияние на En 2, удаляя стрелку с Ex 1 на En 2 ; и вероятность или «соответствие» этих двух моделей можно сравнить статистически.

Существует компьютерный пакет под названием LISREL

Правила трассировки пути

Чтобы правильно вычислить взаимосвязь между любыми двумя блоками на диаграмме, Райт (1934) предложил простой набор правил трассировки пути для расчета корреляции между двумя переменными. Корреляция равна сумме вклада всех путей, которыми связаны две переменные. Сила каждого из этих путей рассчитывается как произведение коэффициентов пути для этого пути.

Правила трассировки пути следующие:

Вы можете проследить назад по стрелке вверх, а затем вперед по следующей или вперед от одной переменной к другой, но никогда не вперед, а затем назад. Другой способ подумать об этом правиле состоит в том, что вы никогда не можете перейти из одного наконечника стрелки в другой наконечник стрелы: «орел-хвост» или «решка-острие», но не «орел-острие».
Вы можете пройти только через каждую переменную. один раз в заданной цепочке путей.
В каждую цепочку путей можно включить не более одной двунаправленной стрелки.

Опять же, ожидаемая корреляция из-за каждой цепочки, прослеживаемой между двумя переменными, есть произведение стандартных коэффициентов пути, а общая ожидаемая корреляция между двумя переменными является суммой этих способствующих цепочек путей.

NB: правила Райта предполагают модель без петель обратной связи: ориентированный граф модели не должен содержать циклов, т.е. это ориентированный ациклический граф, который был тщательно изучен в структуре причинного анализа из Judea Pearl.

Трассировка пути в нестандартных моделях

Если моделируемые переменные не были стандартизированы, дополнительное правило позволяет ожидаемые ковариации, которые будут вычисляться, пока не существует путей, соединяющих зависимые переменные с другими зависимыми переменными.

В простейшем случае все остаточные дисперсии моделируются явно. В этом случае, в дополнение к трем правилам, указанным выше, рассчитайте ожидаемые ковариации следующим образом:

Вычислите произведение коэффициентов в каждом маршруте между интересующими переменными, проследив в обратном направлении, изменив направление по двуглавой стрелке, а затем проследив вперед.
Суммирование по всем различающимся маршрутам, где пути считаются различными, если они содержат разные коэффициенты, или встречаются с этими коэффициентами в другом порядке.

Если остаточные отклонения не включены явно, или в качестве более общего решения, при любом изменении направления, встречающемся на маршруте (за исключением двусторонних стрелок), учитывайте дисперсию переменной в точке изменения. То есть, при отслеживании пути от зависимой переменной к независимой переменной, включайте дисперсию независимой переменной, за исключением случаев, когда это нарушает правило 1 выше (проход через соседние стрелки: то есть, когда независимая переменная также соединяется с двойным стрелка, соединяющая его с другой независимой переменной). При выводе дисперсий (что необходимо в случае, если они не моделируются явно), путь от зависимой переменной к независимой и обратно учитывается только один раз.

См. Также

Ссылки

Внешние ссылки