Распределение по степеням

редактировать

При изучении графиков и сетей, степень узла в сети - это количество подключений, которые он имеет к другим узлам, а распределение степеней - это распределение вероятностей этих степеней по всей сети.

Содержание
  • 1 Определение
  • 2 Наблюдаемые распределения степеней
  • 3 Распределение избыточных степеней
  • 4 Метод генерирующих функций
  • 5 Распределение степеней для направленных сетей
  • 6 См. Также
  • 7 Ссылки
Определение

степень узла в сети (иногда неправильно называемая связностью ) - это количество соединений или ребер узел относится к другим узлам. Если сеть направлена ​​, что означает, что ребра указывают в одном направлении от одного узла к другому, тогда узлы имеют две разные степени: входящую, которая представляет собой количество входящих ребер, и исходящую. степень, которая является количеством исходящих ребер.

Затем определяется степень распределения P (k) сети как доля узлов в сети со степенью k. Таким образом, если в сети всего n узлов и n k из них имеют степень k, мы имеем P (k) = n k / n.

Та же самая информация также иногда представлена ​​в форме распределения кумулятивных степеней, доли узлов со степенью меньше k или даже дополнительного распределения кумулятивной степени, доли узлов со степенью больше или равной до k (1 - C), если рассматривать C как совокупное распределение степеней; то есть дополнение C.

Наблюдаемое распределение степеней

Распределение степеней очень важно при изучении как реальных сетей, таких как Интернет и социальные сети и теоретические сети. Простейшая сетевая модель, например (модель Эрдеша – Реньи) случайный граф, в котором каждый из n узлов независимо связан (или нет) с вероятностью p (или 1 - p), имеет биномиальное распределение степеней k:

P (k) = (n - 1 k) pk (1 - p) n - 1 - k, {\ displaystyle P (k) = {n-1 \ выберите k} p ^ {k} (1-p) ^ {n-1-k},}P (k) = {n -1 \ выбрать k} p ^ {k} (1-p) ^ {{n-1-k}},

(или Пуассон в пределе большого n, если средняя степень ⟨ к⟩ знак равно п (n - 1) {\ displaystyle \ langle k \ rangle = p (n-1)}{\ displaystyle \ langle k \ rangle = p (n-1)} фиксируется). Однако в большинстве сетей в реальном мире распределение степеней сильно отличается от этого. Большинство из них сильно наклонено вправо, что означает, что подавляющее большинство узлов имеют низкую степень, но небольшое количество, известное как «концентраторы», имеет высокую степень. Утверждалось, что некоторые сети, в частности Интернет, всемирная паутина и некоторые социальные сети, имеют распределение степеней, которое приблизительно соответствует степенному закону : P (k) ∼ k - γ {\ displaystyle P (k) \ sim k ^ {- \ gamma}}{\ displaystyle P (k) \ sim k ^ { - \ gamma}} , где γ - постоянная. Такие сети называются безмасштабными сетями и привлекают особое внимание своими структурными и динамическими свойствами. Однако в последнее время были проведены некоторые исследования, основанные на реальных наборах данных, в которых утверждается, что, несмотря на то, что большинство наблюдаемых сетей имеют распределение степеней с толстыми хвостами, они отклоняются от безмасштабных.

Распределение избыточных степеней

Распределение избыточных степеней - это распределение вероятности для узла, достигнутого при следовании за ребром, количества других ребер, прикрепленных к этому узлу. Другими словами, это распределение исходящих ссылок от узла, достигнутого при переходе по ссылке.

Предположим, что сеть имеет распределение степеней P (k) {\ displaystyle P (k)}{\ displaystyle P (k)} , выбирая один узел (случайно или нет) и переходя к одному из его соседей (предполагается, что у этого узла есть хотя бы один сосед), тогда вероятность того, что этот узел будет иметь k {\ displaystyle k}{\ displaystyle k} соседей, не определяется как P (k) {\ displaystyle P (k)}{\ displaystyle P (k)} . Причина в том, что всякий раз, когда какой-либо узел выбирается в неоднородной сети, более вероятно достичь хобов, следуя за одним из существующих соседей этого узла. Истинная вероятность таких узлов иметь степень k {\ displaystyle k}{\ displaystyle k} равна q (k) {\ displaystyle q (k)}{ \ displaystyle q (k)} , что называется избыточная степень этого узла. В модели конфигурации , в которой корреляции между узлами были проигнорированы, и предполагается, что каждый узел связан с любыми другими узлами в сети с той же вероятностью, распределение избыточных степеней может быть найдено как:

Q (К) знак равно К + 1 ⟨К⟩ п (к + 1), {\ Displaystyle д (к) = {\ гидроразрыва {к + 1} {\ langle к \ rangle}} п (к + 1), }{\ displaystyle q (к) = {\ гидроразрыва {к + 1} {\ langle k \ rangle}} P (k + 1),}

где ⟨k⟩ {\ displaystyle {\ langle k \ rangle}}{\ displaystyle {\ langle k \ rangle}} - средний градус (средний градус) модели. Отсюда следует тот факт, что средняя степень соседа любого узла больше, чем средняя степень этого узла. В социальных сетях это означает, что у ваших друзей в среднем больше друзей, чем у вас. Это известно как парадокс дружбы. Можно показать, что сеть может иметь гигантский компонент, если его средняя степень превышения больше единицы:

∑ kkq (k)>1 ⇒ ⟨k 2⟩ - 2 ⟨k⟩>0 {\ displaystyle \ sum _ {k} kq (k)>1 \ Rightarrow {\ langle k ^ {2} \ rangle} -2 {\ langle k \ rangle}>0}{\displaystyle \sum _{k}kq(k)>1 \ Rightarrow {\ langle k ^ {2} \ rangle} -2 {\ langle k \ rangle}>0}

Имейте в виду, что последние два уравнения предназначены только для модели конфигурации и позволяют получить распределение избыточных степеней реального -слова сети, мы также должны добавить корреляции степеней.

Метод генерирующих функций

Генерирующие функции можно использовать для вычисления различных свойств случайных сетей. Учитывая распределение степеней и избыточную степень распределение некоторой сети, P (k) {\ displaystyle P (k)}{\ displaystyle P (k)} и q (k) {\ displaystyle q (k)}{ \ displaystyle q (k)} res соответственно, можно записать два степенных ряда в следующих формах:

G 0 (x) = ∑ k P (k) xk {\ displaystyle G_ {0} (x) = \ textstyle \ sum _ {k} \ Displaystyle P (k) x ^ {k}}{\ displaystyle G_ {0} (x) = \ textstyle \ сумма _ {к} \ displaystyle P (k) x ^ {k}} и G 1 (x) = ∑ kq (k) xk = ∑ kk ⟨k⟩ P (k) xk - 1 {\ displaystyle G_ {1} (x) = \ textstyle \ sum _ {k} \ displaystyle q (k) x ^ {k} = \ textstyle \ sum _ {k} \ displaystyle {\ frac {k} {\ langle k \ rangle }} P (k) x ^ {k-1}}{\ displaystyle G_ {1} (x) = \ textstyle \ s гм _ {к} \ Displaystyle Q (K) х ^ {k} = \ textstyle \ sum _ {k} \ displaystyle {\ frac {k} {\ langle k \ rangle}} P (k) x ^ {k- 1}}

G 1 (x) {\ displaystyle G_ {1} (x)}{\ displaystyle G_ {1} (x)} можно также получить из производных от G 0 (Икс) {\ Displaystyle G_ {0} (х)}{\ displaystyle G_ {0} (x)} :

G 1 (x) = G 0 ′ (x) G 0 ′ (1) {\ displaystyle G_ {1} (x) = {\ frac {G '_ {0} (x)} {G' _ {0} (1)}}}{\displaystyle G_{1}(x)={\frac {G'_{0}(x)}{G'_{0}(1)}}}

Если мы знаем производящую функцию для распределения вероятностей P (k) {\ displaystyle P (k)}{\ displaystyle P (k)} , тогда мы можем восстановить значения P (k) {\ displaystyle P (k)}{\ displaystyle P (k)} путем дифференцирования:

P (k) = 1 k! d k G d x k | x = 0 {\ displaystyle P (k) = {\ frac {1} {k!}} {\ operatorname {d} ^ {k} \! G \ over \ operatorname {d} \! x ^ {k}} {\ biggl \ vert} _ {x = 0}}{\ displaystyle P (k) = {\ frac {1} {k!}} {\ operatorname {d} ^ {k} \! G \ over \ operatorname {d} \ ! x ^ {k}} {\ biggl \ vert} _ {x = 0}}

Некоторые свойства, например моменты, могут быть легко вычислены из G 0 (x) {\ displaystyle G_ {0} (x)}{\ displaystyle G_ {0} (x)} и его производных:

  • ⟨k⟩ = G 0 ′ (1) {\ displaystyle {\ langle k \ rangle} = G '_ {0} (1)}{\displaystyle {\langle k\rangle }=G'_{0}(1)}
  • ⟨k 2⟩ = G 0 ″ (1) + G 0 ′ (1) {\ displaystyle {\ langle k ^ {2} \ rangle} = G '' _ {0} (1) + G '_ {0} (1)}{\displaystyle {\langle k^{2}\rangle }=G''_{0}(1)+G'_{0}(1)}

И вообще:

  • ⟨km⟩ = [(x ⁡ d dx) m G 0 (x)] x = 1 {\ displaystyle {\ langle k ^ {m} \ rangle} = {\ Biggl [} {{\ bigg (} \ operatorname {x} {\ operatorname {d} \! \ Over \ operatorname {dx} \!} {\ biggl)} ^ {m}} G_ {0} (x) {\ Biggl]} _ {x = 1}}{\ displaystyle {\ langle k ^ {m} \ rangle} = {\ Biggl [} {{\ bigg (} \ operatorname {x} {\ operatorname {d} \! \ over \ operatorname {dx} \!} {\ biggl)} ^ {m}} G_ {0} (x) {\ Biggl]} _ {x = 1}}

Для с распределением по Пуассону случайные сети, такие как график ER, G 1 (x) = G 0 (x) {\ displaystyle G_ {1} (x) = G_ {0} (x)}{\ displaystyle G_ {1} (x) = G_ {0} (x)} , поэтому теория случайных сетей этого типа особенно проста. Распределения вероятностей для 1-го и 2-го ближайших соседей генерируются функциями G 0 (x) {\ displaystyle G_ {0} (x)}{\ displaystyle G_ {0} (x)} и G 0 (G 1 (х)) {\ Displaystyle G_ {0} (G_ {1} (x))}{\ displaystyle G_ {0} (G_ {1} (x))} . В более широком смысле, распределение m {\ displaystyle m}{\ displaystyle m} -го соседа генерируется следующим образом:

G 0 (G 1 (... G 1 (x)..)) {\ displaystyle G_ {0} {\ bigl (} G_ {1} (... G_ {1} (x)...) {\ bigr)}}{\ displaystyle G_ {0} {\ bigl (} G_ {1} (... G_ {1} (x)...) {\ bigr)}} , с m - 1 {\ displaystyle m-1}{\ displaystyle m-1} итераций функции G 1 {\ displaystyle G_ {1}}{\ displaystyle G_ {1}} , действующей на себя.

Среднее число первых соседей, c 1 {\ displaystyle c_ {1}}{\ displaystyle c_ {1}} , равно ⟨k⟩ = d G 0 (x) dx | x = 1 {\ displaystyle {\ langle k \ rangle} = {dG_ {0} (x) \ over dx} | _ {x = 1}}{\ displaystyle {\ langle k \ rangle} = {dG_ {0} (x) \ over dx} | _ {x = 1}} , а среднее количество вторых соседей: c 2 = [ddx G 0 (G 1 (x))] x = 1 = G 1 ′ (1) G 0 ′ (G 1 (1)) = G 1 ′ (1) G 0 ′ (1) Знак равно G 0 ″ (1) {\ displaystyle c_ {2} = {\ biggl [} {d \ over dx} G_ {0} {\ big (} G_ {1} (x) {\ big)} {\ biggl ]} _ {x = 1} = G_ {1} '(1) G' _ {0} {\ big (} G_ {1} (1) {\ big)} = G_ {1} '(1) G '_ {0} (1) = G' '_ {0} (1)}{\displaystyle c_{2}={\biggl [}{d \over dx}G_{0}{\big (}G_{1}(x){\big)}{\biggl ]}_{x=1}=G_{1}'(1)G'_{0}{\big (}G_{1}(1){\big)}=G_{1}'(1)G'_{0}(1)=G''_{0}(1)}

Распределение степени для направленных сетей
Распределение степени входа / выхода для графа гиперссылок Википедии (логарифмические шкалы)

В направленном сети, каждый узел имеет некоторую внутреннюю степень kin {\ displaystyle k_ {in}}{\ displaystyle k_ {in}} и некоторую внешнюю степень kout {\ displaystyle k_ {out}}{\ displaystyle k_ {out}} которые представляют собой количество ссылок, которые должным образом входили и выходили из этого узла. Если P (kin, kout) {\ displaystyle P (k_ {in}, k_ {out})}{\ displaystyle P (k_ {in}, k_ {out})} - это вероятность того, что случайно выбранный узел имеет внутреннюю степень kin {\ displaystyle k_ {in}}{\ displaystyle k_ {in}} и out-degree kout {\ displaystyle k_ {out}}{\ displaystyle k_ {out}} , затем производящая функция, назначенная этому совместному распределению вероятностей можно записать с двумя значениями x {\ displaystyle x}{ \ displaystyle x} и y {\ displaystyle y}{\ displaystyle y} как:

G (x, y) = ∑ кин, коут П (кин, коут) xkinykout. {\ displaystyle {\ mathcal {G}} (x, y) = \ sum _ {k_ {in}, k_ {out}} \ displaystyle P ({k_ {in}, k_ {out}}) x ^ {k_ {in}} y ^ {k_ {out}}.}{\ displaystyle {\ mathcal {G}} (x, y) = \ sum _ {k_ {in}, k_ {out}} \ displaystyle P ({k_ {in}, k_ {out}) }) x ^ {k_ {in}} y ^ {k_ {out}}.}

Поскольку каждая ссылка в направленной сети должна выходить из одного узла и входить в другой, чистое среднее количество ссылок, входящих в

узел, равно нулю. Следовательно,

⟨кин - коут⟩ = ∑ кин, коут (кин - коут) P (кин, коут) = 0 {\ displaystyle \ langle {k_ {in} -k_ {out}} \ rangle = \ sum _ {k_ {in}, k_ {out}} \ displaystyle (k_ {in} -k_ {out}) P ({k_ {in}, k_ {out}}) = 0}{\ displaystyle \ langle {k_ {in} -k_ {out}} \ rangle = \ sum _ {k_ {in}, k_ {out}} \ displaystyle (k_ {in} -k_ {out}) P ({k_ {in}, k_ {out}}) = 0} ,

что означает, что поколение функция должна удовлетворять:

∂ G ∂ x | x, y = 1 = ∂ G ∂ y | Икс, Y знак равно 1 знак равно с, {\ Displaystyle {\ partial {\ mathcal {G}} \ over \ partial x} \ vert _ {x, y = 1} = {\ partial {\ mathcal {G}} \ over \ partial y} \ vert _ {x, y = 1} = c,}{\ displaystyle {\ partial {\ mathcal {G}} \ over \ partial x} \ vert _ {x, y = 1} = {\ partial {\ mathcal {G}} \ over \ partial y} \ vert _ {x, y = 1} = c,}

где c {\ displaystyle c}{\ displaystyle c} - средняя степень (как внутри, так и снаружи) узлов. в сети; k i n⟩ = ⟨k o u t⟩ = c. {\ displaystyle \ langle {k_ {in}} \ rangle = \ langle {k_ {out}} \ rangle = c.}{\ displaystyle \ langle {k_ {in}} \ rangle = \ langle {k_ {out}} \ rangle = c.}

Использование функции G (x, y) {\ displaystyle {\ mathcal { G}} (x, y)}{\ displaystyle {\ mathcal {G}} (x, y) } , мы снова можем найти функцию генерации для распределения внутренних / исходящих степеней и распределения входных / выходных степеней, как и раньше. G 0 in (x) {\ displaystyle G_ {0} ^ {in} (x)}{\ displaystyle G_ {0} ^ {in} (x)} можно определить как производящие функции для количества поступающих ссылок на случайно выбранный узел, а G 1 in (x) {\ displaystyle G_ {1} ^ {in} (x)}{\ displaystyle G_ {1} ^ {in} (x)} можно определить как количество входящих ссылок на узел, достигнутый при переходе по случайно выбранной ссылке. Мы также можем определить производящие функции G 0 out (y) {\ displaystyle G_ {0} ^ {out} (y)}{\ displaystyle G_ { 0} ^ {out} (y)} и G 1 out (y) {\ displaystyle G_ {1} ^ {out} (y)}{\ displaystyle G_ {1} ^ {out} (y)} для числа, выходящего из такого узла:

  • G 0 in (x) = G (x, 1) {\ displaystyle G_ {0} ^ { in} (x) = {\ mathcal {G}} (x, 1)}{\ displaystyle G_ {0} ^ {in} (x) = {\ mathcal {G}} (x, 1)}
  • G 1 in (x) = 1 c ∂ G ∂ x | y = 1 {\ displaystyle G_ {1} ^ {in} (x) = {\ frac {1} {c}} {\ partial {\ mathcal {G}} \ over \ partial x} \ vert _ {y = 1}}{\ displaystyle G_ {1} ^ {in} (x) = {\ frac {1} {c}} {\ partial {\ mathcal {G}} \ over \ partial x} \ vert _ {y = 1}}
  • G 0 out (y) = G (1, y) {\ displaystyle G_ {0} ^ {out} (y) = {\ mathcal {G}} (1, y)}{\ displaystyle G_ {0} ^ {out} (y) = {\ mathcal {G}} (1, y)}
  • G 1 out (y) = 1 c ∂ G ∂ y | Икс = 1 {\ Displaystyle G_ {1} ^ {out} (y) = {\ frac {1} {c}} {\ partial {\ mathcal {G}} \ over \ partial y} \ vert _ {x = 1}}{\ displaystyle G_ {1} ^ {out} (y) = {\ frac {1} {c}} {\ partial {\ mathcal {G}} \ over \ partial y} \ vert _ {x = 1}}

Здесь среднее количество первых соседей, c {\ displaystyle c}{\ displaystyle c} , или, как ранее было указано, c 1 {\ displaystyle c_ {1}}{\ displaystyle c_ {1}} , равно ∂ G ∂ x | x, y = 1 = ∂ G ∂ y | х, у знак равно 1 {\ Displaystyle {\ partial {\ mathcal {G}} \ over \ partial x} {\ biggl \ vert} _ {x, y = 1} = {\ partial {\ mathcal {G}} \ over \ partial y} {\ biggl \ vert} _ {x, y = 1}}{\ displaystyle {\ partial {\ mathcal {G}} \ over \ partial x} {\ biggl \ vert} _ {x, y = 1} = {\ partial {\ mathcal {G}} \ over \ partial y } {\ biggl \ vert} _ {x, y = 1}} , а среднее количество 2-х соседей, достижимых из случайно выбранного узла, равно: c 2 = G 1 ′ (1) G 0 ′ (1) = ∂ 2 G ∂ x ∂ y | Икс, Y = 1 {\ Displaystyle c_ {2} = G_ {1} '(1) G' _ {0} (1) = {\ partial ^ {2} {\ mathcal {G}} \ over \ partial x \ partial y} {\ biggl \ vert} _ {x, y = 1}}{\displaystyle c_{2}=G_{1}'(1)G'_{0}(1)={\partial ^{2}{\mathcal {G}} \over \partial x\partial y}{\biggl \vert }_{x,y=1}}. Это также номера 1-го и 2-го соседей, из которых может быть достигнут случайный узел, поскольку эти уравнения явно симметричны в x {\ displaystyle x}{ \ displaystyle x} и y {\ displaystyle y }{\ displaystyle y} .

См. Также
Ссылки
Последняя правка сделана 2021-05-17 11:34:11
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте