Экспоненциальные модели случайных графов

редактировать

Экспоненциальные случайные графические модели (ERGM) - это семейство статистических моделей для анализа данных о социальных и других сетях. Примеры сетей, исследуемых с помощью ERGM, включают сети знаний, организационные сети, сети коллег, сети социальных сетей, сети научных разработок и другие.

Содержание
  • 1 Предпосылки
  • 2 Определение
  • 3 Ссылки
  • 4 Дополнительная литература
Предпосылки

Существует множество метрик для описания структурных особенностей наблюдаемой сети, таких как плотность, центральность или ассортативность. Однако эти показатели описывают наблюдаемую сеть, которая является лишь одним из множества возможных альтернативных сетей. Этот набор альтернативных сетей может иметь похожие или отличные структурные особенности. Для поддержки статистического вывода о процессах, влияющих на формирование структуры сети, статистическая модель должна учитывать набор всех возможных альтернативных сетей, взвешенных по их сходству с наблюдаемой сетью. Однако, поскольку сетевые данные по своей сути реляционные, они нарушают предположения о независимости и идентичном распределении стандартных статистических моделей, таких как линейная регрессия. Альтернативные статистические модели должны отражать неопределенность, связанную с данным наблюдением, позволять делать выводы об относительной частоте сетевых подструктур, представляющих теоретический интерес, устранять неоднозначность влияния смешивающих процессов, эффективно представлять сложные структуры и связывать процессы локального уровня со свойствами глобального уровня. Рандомизация с сохранением степени, например, - это особый способ, которым наблюдаемая сеть может рассматриваться с точки зрения нескольких альтернативных сетей.

Определение

Экспоненциальное семейство - это широкое семейство моделей для охвата многих типов данных, а не только сетей. ERGM - это модель из этого семейства, которая описывает сети.

Формально случайный граф Y ∈ Y {\ displaystyle Y \ in {\ mathcal {Y}}}{\ displaystyle Y \ in {\ mathcal {Y}}} состоит из набора п {\ displaystyle n}n узлов и m {\ displaystyle m}m диад (ребер) {Y ij: i = 1,…, n; j = 1,…, n} {\ displaystyle \ {Y_ {ij}: i = 1, \ dots, n; j = 1, \ dots, n \}}\ {Y _ {{ij}}: i = 1, \ dots, n; j = 1, \ dots, n \} где Y ij = 1 {\ displaystyle Y_ {ij} = 1}Y_{{ij}}=1, если узлы (i, j) {\ displaystyle (i, j)}(i, j) соединены и Y ij = 0 {\ displaystyle Y_ {ij} = 0}Y_{{ij}}=0в противном случае.

Основное предположение этих моделей состоит в том, что структура в наблюдаемом графике y {\ displaystyle y}y может быть объяснена заданным вектором достаточной статистики s (y) {\ displaystyle s (y)}s(y), которые являются функцией наблюдаемой сети и, в некоторых случаях, узловых атрибутов. Таким образом, можно описать любую зависимость между недиадическими переменными:

P (Y = y | θ) = exp ⁡ (θ T s (y)) c (θ), ∀ y ∈ Y {\ displaystyle P (Y = Y | \ theta) = {\ frac {\ exp (\ theta ^ {T} s (y))} {c (\ theta)}}, \ quad \ forall y \ in {\ mathcal { Y}}}{\ displaystyle P (Y = y | \ theta) = {\ frac {\ exp (\ theta ^ {T} s (y))} {c (\ theta)}}, \ quad \ forall y \ in {\ mathcal {Y}}}

где θ {\ displaystyle \ theta}\ theta - вектор параметров модели, связанных с s (y) {\ displaystyle s (y)}s(y)и с (θ) = ∑ y ′ ∈ Y ехр ⁡ (θ T s (y ′)) {\ displaystyle c (\ theta) = \ sum _ {y '\ in {\ mathcal {Y }}} \ exp (\ theta ^ {T} s (y '))}{\displaystyle c(\theta)=\sum _{y'\in {\mathcal {Y}}}\exp(\theta ^{T}s(y'))}- нормализующая константа.

Эти модели представляют распределение вероятностей для каждой возможной сети на узлах n {\ displaystyle n}n . Однако размер набора возможных сетей для неориентированной сети (простой граф) размера n {\ displaystyle n}n равен 2 n (n - 1) / 2 {\ стиль отображения 2 ^ {п (п-1) / 2}}2 ^ {{n ( n-1) / 2}} . Поскольку количество возможных сетей в наборе значительно превышает количество параметров, которые могут ограничивать модель, идеальное распределение вероятностей - это то, которое максимизирует энтропию Гиббса.

Ссылки
Дополнительная литература
  1. ^Харрис, Дженин К. (2014). Введение в моделирование экспоненциального случайного графа. ISBN 9781452220802. OCLC 870698788.
Последняя правка сделана 2021-05-19 10:02:36
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте