В статистике анализ пути используется для описания направленных зависимостей среди набора переменных. Сюда входят модели, эквивалентные любой форме множественного регрессионного анализа, факторного анализа, канонического корреляционного анализа, дискриминантного анализа, а также многого другого. общие семейства моделей в многомерном анализе дисперсии и ковариационном анализе (MANOVA, ANOVA, ANCOVA ).
Помимо того, что анализ пути рассматривается как форма множественной регрессии с акцентом на причинно-следственные связи, его можно рассматривать как частный случай моделирования структурным уравнением (SEM), в котором только один индикаторы используются для каждой из переменных в причинной модели. То есть, анализ пути - это SEM со структурной моделью, но без модели измерения. Другие термины, используемые для обозначения анализа пути, включают причинное моделирование, анализ ковариации структур и модели скрытых переменных.
анализ пути рассматривается Judea Pearl как прямой предок методов Причинный вывод.
Анализ путей был разработан примерно в 1918 году генетиком Сьюэлом Райтом, который более подробно писал об этом в 1920-х годах. С тех пор он был применен к огромному количеству сложных областей моделирования, включая биологию, психологию, социологию и эконометрику.
Как правило, модели путей состоят из независимых и зависимых переменных, графически изображенных прямоугольниками или прямоугольниками. Переменные, которые являются независимыми переменными, а не зависимыми переменными, называются «экзогенными». Графически эти блоки экзогенных переменных лежат на внешних краях модели и имеют только односторонние стрелки, выходящие из них. Односторонние стрелки не указывают на экзогенные переменные. Переменные, которые являются исключительно зависимыми переменными или одновременно независимыми и зависимыми переменными, называются «эндогенными». Графически эндогенные переменные имеют по крайней мере одну однонаправленную стрелку, указывающую на них.
В модели ниже две экзогенные переменные (Ex 1 и Ex 2) моделируются как коррелированные, как показано двойным -головая стрелка. Обе эти переменные имеют прямое и косвенное (через En 1) эффекты на En 2 (две зависимые или «эндогенные» переменные / факторы). В большинстве моделей реального мира на эндогенные переменные также могут влиять переменные и факторы, происходящие извне модели (внешние эффекты, включая ошибку измерения). Эти эффекты обозначены буквой «е» или ошибкой в модели.
Используя те же переменные, возможны альтернативные модели. Например, можно предположить, что Ex 1 имеет только косвенное влияние на En 2, удаляя стрелку с Ex 1 на En 2 ; и вероятность или «соответствие» этих двух моделей можно сравнить статистически.
Существует компьютерный пакет под названием LISREL
Чтобы правильно вычислить взаимосвязь между любыми двумя блоками на диаграмме, Райт (1934) предложил простой набор правил трассировки пути для расчета корреляции между двумя переменными. Корреляция равна сумме вклада всех путей, которыми связаны две переменные. Сила каждого из этих путей рассчитывается как произведение коэффициентов пути для этого пути.
Правила трассировки пути следующие:
Опять же, ожидаемая корреляция из-за каждой цепочки, прослеживаемой между двумя переменными, есть произведение стандартных коэффициентов пути, а общая ожидаемая корреляция между двумя переменными является суммой этих способствующих цепочек путей.
NB: правила Райта предполагают модель без петель обратной связи: ориентированный граф модели не должен содержать циклов, т.е. это ориентированный ациклический граф, который был тщательно изучен в структуре причинного анализа из Judea Pearl.
Если моделируемые переменные не были стандартизированы, дополнительное правило позволяет ожидаемые ковариации, которые будут вычисляться, пока не существует путей, соединяющих зависимые переменные с другими зависимыми переменными.
В простейшем случае все остаточные дисперсии моделируются явно. В этом случае, в дополнение к трем правилам, указанным выше, рассчитайте ожидаемые ковариации следующим образом:
Если остаточные отклонения не включены явно, или в качестве более общего решения, при любом изменении направления, встречающемся на маршруте (за исключением двусторонних стрелок), учитывайте дисперсию переменной в точке изменения. То есть, при отслеживании пути от зависимой переменной к независимой переменной, включайте дисперсию независимой переменной, за исключением случаев, когда это нарушает правило 1 выше (проход через соседние стрелки: то есть, когда независимая переменная также соединяется с двойным стрелка, соединяющая его с другой независимой переменной). При выводе дисперсий (что необходимо в случае, если они не моделируются явно), путь от зависимой переменной к независимой и обратно учитывается только один раз.