Модель случайного графа с максимальной энтропией

редактировать

Максимум энтропии модель случайного графа является случайным граф моделью, используемой для изучения сложных сетей при условии соблюдения принципа максимальной энтропии при наборе структурных ограничений, которые могут быть глобальными, дистрибутивными, или местными.

Содержание
  • 1 Обзор
  • 2 Канонический ансамбль графов (общие рамки)
  • 3 Модель Эрдеша – Реньи г ( п , м ) {\ Displaystyle G (п, м)}
  • 4 Обобщения
  • 5 См. Также
  • 6 Ссылки
Обзор

Любая случайная модель графа (при фиксированном наборе значений параметров) приводит к распределению вероятностей на графах, и те из них, которые имеют максимальную энтропию в рамках рассматриваемого класса распределений, обладают особым свойством быть максимально несмещенными нулевыми моделями для сетевого вывода (например, биологическая сеть вывод ). Каждая модель определяет семейство распределений вероятностей на наборе графов размера (для каждого для некоторого конечного), параметризованных набором ограничений на наблюдаемые, определенные для каждого графа (например, фиксированная ожидаемая средняя степень, распределение степеней определенной формы, или определенная последовательность степеней ), применяемая в распределении графа наряду с максимизацией энтропии методом множителей Лагранжа. Обратите внимание, что в этом контексте «максимальная энтропия» относится не к энтропии одного графа, а скорее к энтропии всего вероятностного ансамбля случайных графов. п {\ displaystyle n} п gt; п 0 {\ displaystyle ngt; n_ {0}} п 0 {\ displaystyle n_ {0}} J {\ displaystyle J} { Q j ( г ) } j знак равно 1 J {\ Displaystyle \ {Q_ {j} (G) \} _ {j = 1} ^ {J}} г {\ displaystyle G}

Несколько обычно изучаемых моделей случайных сетей на самом деле являются максимальной энтропией, например графы ER и (каждый из которых имеет одно глобальное ограничение на количество ребер), а также модель конфигурации (CM). и модель мягкой конфигурации (SCM) (каждая из которых имеет локальные ограничения, по одному для каждого узлового значения степени). В двух парах моделей, упомянутых выше, важное различие состоит в том, является ли ограничение резким (т. Е. Удовлетворяется каждым элементом набора размерных графов с ненулевой вероятностью в ансамбле) или мягким (т. Е. Выполняется в среднем по всему ансамблю). ансамбль). Первый (острый) случай соответствует микроканоническому ансамблю, условие максимальной энтропии дает все графы, удовлетворяющие как равновероятные; последний (мягкий) случай является каноническим и дает модель экспоненциального случайного графа (ERGM). г ( п , м ) {\ Displaystyle G (п, м)} г ( п , п ) {\ Displaystyle G (п, р)} п {\ displaystyle n} п {\ displaystyle n} г {\ displaystyle G} Q j ( г ) знак равно q j j {\ Displaystyle Q_ {j} (G) = q_ {j} \ forall j}

Модель Тип ограничения Ограничительная переменная Распределение вероятностей
ER, г ( п , м ) {\ Displaystyle G (п, м)} Резкий, глобальный Общее количество ребер | E ( г ) | {\ displaystyle | E (G) |} 1 / ( ( п 2 ) м ) ;   м знак равно | E ( г ) | {\ Displaystyle 1 / {\ binom {\ binom {n} {2}} {m}}; \ m = | E (G) |}
ER, г ( п , п ) {\ Displaystyle G (п, р)} Мягкий, глобальный Ожидаемое общее количество ребер | E ( г ) | {\ displaystyle | E (G) |} п | E ( г ) | ( 1 - п ) ( п 2 ) - | E ( г ) | {\ Displaystyle p ^ {| E (G) |} (1-p) ^ {{\ binom {n} {2}} - | E (G) |}}
Модель конфигурации Острый, местный Степень каждой вершины, { k ^ j } j знак равно 1 п {\ displaystyle \ {{\ hat {k}} _ {j} \} _ {j = 1} ^ {n}} 1 / | Ω ( { k ^ j } j знак равно 1 п ) | ; Ω ( { k j } j знак равно 1 п ) знак равно { г г п : k j ( г ) знак равно k ^ j j } г п {\ displaystyle 1 / \ left \ vert \ Omega (\ {{\ hat {k}} _ {j} \} _ {j = 1} ^ {n}) \ right \ vert; \ Omega (\ {k_ { j} \} _ {j = 1} ^ {n}) = \ {g \ in {\ mathcal {G}} _ {n}: k_ {j} (g) = {\ hat {k}} _ { j} \ forall j \} \ subset {\ mathcal {G}} _ {n}}
Модель мягкой конфигурации Мягкий, местный Ожидаемая степень каждой вершины, { k ^ j } j знак равно 1 п {\ displaystyle \ {{\ hat {k}} _ {j} \} _ {j = 1} ^ {n}} Z - 1 exp [ - j знак равно 1 п ψ j k j ( г ) ] ;   - пер Z ψ j знак равно k ^ j {\ Displaystyle Z ^ {- 1} \ exp \ left [- \ sum _ {j = 1} ^ {n} \ psi _ {j} k_ {j} (G) \ right]; \ - {\ frac { \ partial \ ln Z} {\ partial \ psi _ {j}}} = {\ hat {k}} _ {j}}
Канонический ансамбль графов (общие рамки)

Предположим, что мы строим модель случайного графа, состоящего из распределения вероятностей на множестве из простых графов с вершинами. Энтропия Гиббса этого ансамбля будет дано п ( г ) {\ Displaystyle \ mathbb {P} (G)} г п {\ displaystyle {\ mathcal {G}} _ {n}} п {\ displaystyle n} S [ г ] {\ Displaystyle S [G]}

S [ г ] знак равно - г г п п ( г ) журнал п ( г ) . {\ displaystyle S [G] = - \ sum _ {G \ in {\ mathcal {G}} _ {n}} \ mathbb {P} (G) \ log \ mathbb {P} (G).}

Мы хотели бы, чтобы усредненные по ансамблю значения наблюдаемых (такие как средняя степень, средняя кластеризация или средняя длина кратчайшего пути ) были настраиваемыми, поэтому мы налагаем «мягкие» ограничения на распределение графа: { Q j } j знак равно 1 J {\ Displaystyle \ {\ langle Q_ {j} \ rangle \} _ {j = 1} ^ {J}} { Q j ( г ) } j знак равно 1 J {\ Displaystyle \ {Q_ {j} (G) \} _ {j = 1} ^ {J}} J {\ displaystyle J}

Q j знак равно г г п п ( г ) Q j ( г ) знак равно q j , {\ displaystyle \ langle Q_ {j} \ rangle = \ sum _ {G \ in {\ mathcal {G}} _ {n}} \ mathbb {P} (G) Q_ {j} (G) = q_ {j },}

где обозначить ограничения. Применение метода множителей Лагранжа для определения максимального распределения при выполнении условия нормализации приводит к следующему: j знак равно 1 , . . . , J {\ displaystyle j = 1,..., J} п ( г ) {\ Displaystyle \ mathbb {P} (G)} S [ г ] {\ Displaystyle S [G]} Q j знак равно q j {\ Displaystyle \ langle Q_ {j} \ rangle = q_ {j}} г г п п ( г ) знак равно 1 {\ displaystyle \ sum _ {G \ in {\ mathcal {G}} _ {n}} \ mathbb {P} (G) = 1}

п ( г ) знак равно 1 Z exp [ - j знак равно 1 J ψ j Q j ( г ) ] , {\ displaystyle \ mathbb {P} (G) = {\ frac {1} {Z}} \ exp \ left [- \ sum _ {j = 1} ^ {J} \ psi _ {j} Q_ {j} (G) \ right],}

где - нормализующая константа ( статистическая сумма ) и - параметры (множители Лагранжа), связанные с соответственно проиндексированными наблюдаемыми графами, которые могут быть настроены для получения в среднем выборок графов с желаемыми значениями этих свойств; результат - экспоненциальное семейство и канонический ансамбль ; конкретно давая ERGM. Z {\ displaystyle Z} { ψ j } j знак равно 1 J {\ Displaystyle \ {\ psi _ {j} \} _ {j = 1} ^ {J}}

Модель Эрдеша – Реньи г ( п , м ) {\ Displaystyle G (п, м)}

В канонической схеме выше были наложены ограничения на усредненные по ансамблю величины. Хотя эти свойства в среднем будут принимать значения, определяемые соответствующей настройкой, каждый конкретный экземпляр может иметь, что может быть нежелательно. Вместо этого мы можем наложить гораздо более жесткое условие: каждый граф с ненулевой вероятностью должен точно удовлетворять. При этих «резких» ограничениях определяется распределение максимальной энтропии. Мы проиллюстрируем это на примере модели Эрдеша – Реньи. Q j {\ Displaystyle \ langle Q_ {j} \ rangle} { ψ j } j знак равно 1 J {\ Displaystyle \ {\ psi _ {j} \} _ {j = 1} ^ {J}} г {\ displaystyle G} Q j ( г ) q j {\ Displaystyle Q_ {j} (G) \ neq q_ {j}} Q j ( г ) знак равно q j {\ Displaystyle Q_ {j} (G) = q_ {j}} г ( п , м ) {\ Displaystyle G (п, м)}

Резкое ограничение в - это ограничение на фиксированное количество ребер, то есть для всех графов, взятых из ансамбля (созданных с обозначенной вероятностью). Это ограничивает выборочное пространство от (всех графов на вершинах) до подмножества. Это прямо аналогично микроканоническому ансамблю в классической статистической механике, в котором система ограничена тонким многообразием в фазовом пространстве всех состояний с определенным значением энергии. г ( п , м ) {\ Displaystyle G (п, м)} м {\ displaystyle m} | E ( г ) | знак равно м {\ Displaystyle | \ OperatorName {E} (G) | = m} г {\ displaystyle G} п п , м ( г ) {\ Displaystyle \ mathbb {P} _ {n, m} (G)} г п {\ displaystyle {\ mathcal {G}} _ {n}} п {\ displaystyle n} г п , м знак равно { г г п ; | E ( г ) | знак равно м } г п {\ displaystyle {\ mathcal {G}} _ {n, m} = \ {g \ in {\ mathcal {G}} _ {n}; | \ operatorname {E} (g) | = m \} \ subset {\ mathcal {G}} _ {n}}

После ограничения пространства выборки у нас нет внешних ограничений (кроме нормализации), которые необходимо удовлетворить, и поэтому мы выберем максимизацию без использования множителей Лагранжа. Хорошо известно, что максимизирующее энтропию распределение при отсутствии внешних ограничений - это равномерное распределение по пространству выборки (см. Максимальное распределение вероятностей энтропии ), из которого мы получаем: г п , м {\ displaystyle {\ mathcal {G}} _ {n, m}} п п , м ( г ) {\ Displaystyle \ mathbb {P} _ {n, m} (G)} S [ г ] {\ Displaystyle S [G]}

п п , м ( г ) знак равно 1 | г п , м | знак равно ( ( п 2 ) м ) - 1 , {\ displaystyle \ mathbb {P} _ {n, m} (G) = {\ frac {1} {| {\ mathcal {G}} _ {n, m} |}} = {\ binom {\ binom { п} {2}} {m}} ^ {- 1},}

где последнее выражение в терминах биномиальных коэффициентов является числом способов расставить края среди возможных ребер, и, таким образом, является кардинальным из. м {\ displaystyle m} ( п 2 ) {\ Displaystyle {\ binom {п} {2}}} г п , м {\ displaystyle {\ mathcal {G}} _ {n, m}}

Обобщения

Различные ансамбли максимальной энтропии были изучены на обобщениях простых графов. К ним относятся, например, ансамбли симплициальных комплексов и взвешенные случайные графы с заданной ожидаемой последовательностью степеней.

Смотрите также
Рекомендации
Последняя правка сделана 2024-01-02 02:51:19
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте