Подход сети зависимостей обеспечивает анализ активности на уровне системы и топологии направил сети. Подход извлекает причинно-следственные связи между узлами сети (при анализе сетевой структуры) и обеспечивает важный шаг к выводу причинно-следственных связей между узлами сети (при анализе сетевой активности). Эта методология была первоначально введена для изучения финансовых данных, она была расширена и применена к другим системам, таким как иммунная система и семантические сети.
В случае сетевой активности, анализ основан на частных корреляциях, которые все более широко используются для исследования сложных систем. Проще говоря, частичная (или остаточная) корреляция является мерой влияния (или вклада) данного узла, скажем, j, на корреляции между другой парой узлов, скажем, i и k. Используя эту концепцию, зависимость одного узла от другого вычисляется для всей сети. Это приводит к ориентированной взвешенной матрице смежности полностью подключенной сети. После построения матрицы смежности для построения сети можно использовать различные алгоритмы, такие как пороговая сеть, минимальное связующее дерево (MST), планарный график с максимальной фильтрацией (PMFG) и другие.
Сеть зависимостей на основе частичной корреляции - это класс корреляционной сети, способной обнаруживать скрытые отношения между своими узлами.
Эта оригинальная методика была впервые представлена в конце 2010 года и опубликована в PLoS ONE. Они количественно раскрыли скрытую информацию о структуре США. фондовый рынок, информация, отсутствующая в стандартных корреляционных сетях. Одним из основных результатов этой работы является то, что за исследуемый период времени (2001–2003 гг.) В структуре сети преобладали компании, принадлежащие к финансовому сектору, которые являются хабами в сети зависимости. Таким образом, они впервые смогли количественно показать взаимосвязь зависимости между различными секторами экономики. После этой работы методология сети зависимостей была применена к изучению иммунной системы и семантических сетей. Таким образом, эта методология применима к любой сложной системе.
Чтобы быть более конкретным, частичные корреляции пары, заданные j, являются корреляциями между ними после правильного вычитания корреляций между i и j и между k и j. Определенная таким образом разница между корреляциями и частичными корреляциями обеспечивает меру влияния узла j на корреляцию . Таким образом, мы определяем влияние узла j на узел i или зависимость узла i от узла j - D (i, j) как сумму влияния узла j на корреляции узла i со всеми другими узлами..
В случае сетевой топологии анализ основан на влиянии удаления узла на кратчайшие пути между сетевыми узлами. Более конкретно, мы определяем влияние узла j на каждую пару узлов (i, k) как обратное топологическому расстоянию между этими узлами при наличии j минус обратное расстояние между ними при отсутствии узла j. Затем мы определяем влияние узла j на узел i или зависимость узла i от узла j - D (i, j) как сумму влияния узла j на расстояния между узлом i со всеми другими узлами k.
Корреляции узел-узел можно рассчитать по формуле Пирсона :
Где и
- активность узлов i и j субъекта n, μ обозначает среднее значение, а сигма - стандартное отклонение динамических профилей узлов i и j. Обратите внимание, что корреляции узел-узел (или для простоты корреляции узлов) для всех пар узлов определяют симметричную корреляционную матрицу, чей элемент
корреляция между узлами i и j.
Затем мы используем полученные корреляции узлов для вычисления частичных корреляций. Частичный коэффициент корреляции первого порядка - это статистическая мера, показывающая, как третья переменная влияет на корреляцию между двумя другими переменными. Определена частичная корреляция между узлами i и k относительно третьего узла как:
где и
- узел корреляции, определенные выше.
Относительный эффект корреляций и
узла j на корреляции C (i, k) задается следующим образом:
Это позволяет избежать тривиального случая, когда узел j, по-видимому, сильно влияет на корреляцию , главным образом потому, что
и
имеют небольшие значения. Отметим, что эту величину можно рассматривать либо как корреляционную зависимость C (i, k) от узла j (термин, используемый здесь), либо как корреляционное влияние узла j на корреляцию C (i, k).
Затем мы определяем общее влияние узла j на узел i или зависимость D (i, j) узла i на узел j как:
Как определено, D (i, j) является мерой среднего влияния узла j на корреляции C ( i, k) по всем узлам k, не равным j. Зависимости активности узла определяют матрицу зависимостей D, элемент (i, j) которой является зависимостью узла i от узла j. Важно отметить, что хотя корреляционная матрица C является симметричной матрицей, матрица зависимостей D несимметрична - , поскольку влияние узла j на узел i не равно влиянию узла i на узел j. По этой причине некоторые методы, используемые при анализе корреляционной матрицы (например, PCA), должны быть заменены или менее эффективны. Тем не менее, есть и другие методы, такие как те, что используются здесь, которые могут должным образом учесть несимметричный характер матрицы зависимостей.
Влияние пути и зависимость расстояния: относительное влияние узла j на направленный путь - кратчайший топологический путь с каждым сегментом соответствует расстоянию 1, между узлами i и k задано:
где и
- это кратчайший направленный топологический путь от узла i к узлу k при наличии и отсутствии узла j соответственно.
Затем мы определяем общее влияние узла j на узел i или зависимость D (i, j) узла i на узел j как:
Как определено, D (i, j) является мерой среднего влияния узла j на направленные пути из узел i ко всем остальным узлам k. Структурные зависимости узла определяют матрицу зависимостей D, элемент (i, j) которой является зависимостью узла i от узла j или влиянием узла j на узел i. Важно отметить, что матрица зависимостей D несимметрична - , поскольку влияние узла j на узел i не равно влиянию узла i на узел j.
Матрица зависимостей - это взвешенная матрица смежности, представляющая полностью подключенную сеть. Для фильтрации полностью подключенной сети для получения наиболее значимой информации могут применяться различные алгоритмы, например с использованием порогового подхода или различных алгоритмов отсечения. Широко используемый метод построения информативного подграфа полной сети - это минимальное связующее дерево (MST). Другой информативный подграф, который сохраняет больше информации (по сравнению с MST), - это планарный график с максимальной фильтрацией (PMFG), который используется здесь. Оба метода основаны на иерархической кластеризации, и результирующие подграфы включают все N узлов в сети, чьи ребра представляют собой наиболее релевантные корреляции ассоциаций. Подграф MST содержит ребер без петель, а подграф PMFG содержит
края.