Распределение твиди

редактировать

В вероятности и статистике, то распределение Твиди представляет собой семейство вероятностных распределений, которые включают в чисто непрерывные нормальных, гамма и обратные гауссовые распределения, чисто дискретным масштабируются распределение Пуассона, и класс соединений Пуассона-гамма - распределений, которые имеют положительную массу в нуле, но в остальном они непрерывны. Распределения Твиди являются частным случаем моделей экспоненциальной дисперсии и часто используются в качестве распределений для обобщенных линейных моделей.

Распределения Твиди были названы Бентом Йоргенсеном в честь Мориса Твиди, статистика и физика-медика из Ливерпульского университета, Великобритания, который представил первое тщательное исследование этих распределений в 1984 году.

СОДЕРЖАНИЕ
  • 1 Определения
  • 2 свойства
    • 2.1 Аддитивные модели экспоненциальной дисперсии
    • 2.2 Репродуктивные модели экспоненциальной дисперсии
    • 2.3 Масштабная инвариантность
    • 2.4 Функция отклонения мощности Твиди
    • 2.5 Отклонение от твиди
    • 2.6 Производящие функции кумулянта Твиди
    • 2.7 Теорема Твиди о сходимости
  • 3 Связанные дистрибутивы
  • 4 Возникновение и применение
    • 4.1 Модели Твиди и степенной закон Тейлора
    • 4.2 Твиди конвергенция и шум 1 / f
    • 4.3 Модели Твиди и мультифрактальность
    • 4.4 Кровоток в региональных органах
    • 4.5 Метастазирование рака
    • 4.6 Геномная структура и эволюция
    • 4.7 Теория случайных матриц
    • 4.8 Распределение простых чисел
    • 4.9 Другие приложения
  • 5 ссылки
  • 6 Дальнейшее чтение
Определения

Распределения (репродуктивного) Твиди определяются как подсемейство (репродуктивных) моделей экспоненциальной дисперсии (ED) со специальным соотношением среднее - дисперсия. Случайная величина Y является Твиди распределенных Tw р (М, σ 2), если со средним, положительным параметром дисперсии и Y E D ( μ , σ 2 ) {\ Displaystyle Y \ sim \ mathrm {ED} (\ mu, \ sigma ^ {2})} μ знак равно E ( Y ) {\ displaystyle \ mu = \ operatorname {E} (Y)} σ 2 {\ displaystyle \ sigma ^ {2}}

Вар ( Y ) знак равно σ 2 μ п , {\ Displaystyle \ OperatorName {Var} (Y) = \ sigma ^ {2} \, \ mu ^ {p},}

где называется силовым параметром Твиди. Распределение вероятностей P θ, σ 2 на измеримых множествах A, задается формулой п р {\ displaystyle p \ in \ mathbf {R}}

п θ , σ 2 ( Y А ) знак равно А exp ( θ z - κ п ( θ ) σ 2 ) ν λ ( d z ) , {\ displaystyle P _ {\ theta, \ sigma ^ {2}} (Y \ in A) = \ int _ {A} \ exp \ left ({\ frac {\ theta \ cdot z- \ kappa _ {p} ( \ theta)} {\ sigma ^ {2}}} \ right) \ cdot \ nu _ {\ lambda} \, (dz),}

для некоторой σ-конечной меры ν λ. Это представление использует канонический параметр θ модели экспоненциальной дисперсии и кумулянтную функцию

κ п ( θ ) знак равно { α - 1 α ( θ α - 1 ) α , для  п 1 , 2 - бревно ( - θ ) , для  п знак равно 2 е θ , для  п знак равно 1 {\ displaystyle \ kappa _ {p} (\ theta) = {\ begin {case} {\ frac {\ alpha -1} {\ alpha}} \ left ({\ frac {\ theta} {\ alpha -1} } \ right) ^ {\ alpha}, amp; {\ text {for}} p \ neq 1,2 \\ - \ log (- \ theta), amp; {\ text {for}} p = 2 \\ e ^ {\ theta}, amp; {\ text {for}} p = 1 \ end {case}}}

где мы использовали, или что-то подобное. α знак равно п - 2 п - 1 {\ displaystyle \ alpha = {\ frac {p-2} {p-1}}} п знак равно α - 2 α - 1 {\ displaystyle p = {\ frac {\ alpha -2} {\ alpha -1}}}

Характеристики

Аддитивные модели экспоненциальной дисперсии

Только что описанные модели находятся в репродуктивной форме. Модель экспоненциальной дисперсии всегда имеет двойственную форму: аддитивную. Если Y репродуктивный, то with находится в аддитивной форме ED * ( θ, λ) для Tweedie Tw *p (μ, λ). Аддитивные модели обладают тем свойством, что распределение суммы независимых случайных величин, Z знак равно λ Y {\ displaystyle Z = \ lambda Y} λ знак равно 1 σ 2 {\ displaystyle \ lambda = {\ frac {1} {\ sigma ^ {2}}}}

Z + знак равно Z 1 + + Z п , {\ Displaystyle Z _ {+} = Z_ {1} + \ cdots + Z_ {n},}

для которого Z i  ~ ED * ( θ, λ i) с фиксированным θ и различными λ являются членами семейства распределений с одинаковым θ,

Z + ED * ( θ , λ 1 + + λ п ) . {\ displaystyle Z _ {+} \ sim \ operatorname {ED} ^ {*} (\ theta, \ lambda _ {1} + \ cdots + \ lambda _ {n}).}

Репродуктивные модели экспоненциальной дисперсии

Существует второй класс моделей экспоненциальной дисперсии, обозначаемый случайной величиной

Y знак равно Z / λ ED ( μ , σ 2 ) , {\ displaystyle Y = Z / \ lambda \ sim \ operatorname {ED} (\ mu, \ sigma ^ {2}),}

где σ 2  = 1 / λ, известные как репродуктивные модели экспоненциальной дисперсии. Они обладают тем свойством, что для n независимых случайных величин Y i  ~ ED ( μ, σ 2 / w i) с весовыми коэффициентами w i и

ш знак равно я знак равно 1 п ш я , {\ Displaystyle ш = \ сумма _ {я = 1} ^ {п} ш_ {я},}

средневзвешенное значение переменных дает,

ш - 1 я знак равно 1 п ш я Y я ED ( μ , σ 2 / ш ) . {\ displaystyle w ^ {- 1} \ sum _ {i = 1} ^ {n} w_ {i} Y_ {i} \ sim \ operatorname {ED} (\ mu, \ sigma ^ {2} / w). }

Для репродуктивных моделей средневзвешенное значение независимых случайных величин с фиксированными μ и σ 2 и различными значениями для w i является членом семейства распределений с одинаковыми μ и σ 2.

Модели экспоненциальной дисперсии Твиди одновременно аддитивны и воспроизводительны; Таким образом, мы имеем преобразование дуальности

Y Z знак равно Y / σ 2 . {\ Displaystyle Y \ mapsto Z = Y / \ sigma ^ {2}.}

Масштабная инвариантность

Третье свойство моделей Твиди состоит в том, что они инвариантны к масштабу : для репродуктивной модели экспоненциальной дисперсии Tw p (μ, σ 2) и любой положительной константы c мы имеем свойство замыкания при масштабном преобразовании,

c Tw п ( μ , σ 2 ) знак равно Tw п ( c μ , c 2 - п σ 2 ) . {\ displaystyle c \ operatorname {Tw} _ {p} (\ mu, \ sigma ^ {2}) = \ operatorname {Tw} _ {p} (c \ mu, c ^ {2-p} \ sigma ^ { 2}).}

Функция отклонения мощности Твиди

Чтобы определить функцию дисперсии для моделей экспоненциальной дисперсии, мы используем отображение среднего значения, соотношение между каноническим параметром θ и средним μ. Он определяется функцией

τ ( θ ) знак равно κ ( θ ) знак равно μ . {\ Displaystyle \ тау (\ тета) = \ каппа ^ {\ прайм} (\ тета) = \ му.}

с накопительной функцией. Функция дисперсии V ( μ) строится из отображения среднего значения, κ ( θ ) {\ Displaystyle \ каппа (\ тета)}

V ( μ ) знак равно τ [ τ - 1 ( μ ) ] . {\ Displaystyle V (\ mu) = \ tau ^ {\ prime} [\ tau ^ {- 1} (\ mu)].}

Здесь минус показатель в τ −1 ( μ) обозначает обратную функцию, а не обратную функцию. Среднее значение и дисперсия аддитивной случайной величины равны E ( Z) =  λμ и var ( Z) =  λV ( μ).

Масштабная инвариантность означает, что функция дисперсии подчиняется соотношению V ( μ) = μ p.

Отклонение от твиди

Блок девиация из распределения репродуктивной Tweedie дается

d ( у , μ ) знак равно { ( у - μ ) 2 , для  п знак равно 0 2 ( у бревно ( у / μ ) + μ - у ) , для  п знак равно 1 2 ( бревно ( μ / у ) + у / μ - 1 ) , для  п знак равно 2 2 ( Максимум ( у , 0 ) 2 - п ( 1 - п ) ( 2 - п ) - у μ 1 - п 1 - п + μ 2 - п 2 - п ) , еще {\ displaystyle d (y, \ mu) = {\ begin {case} (y- \ mu) ^ {2}, amp; {\ text {for}} p = 0 \\ 2 (y \ log (y / \ mu) + \ mu -y), amp; {\ text {for}} p = 1 \\ 2 (\ log (\ mu / y) + y / \ mu -1), amp; {\ text {for}} p = 2 \\ 2 \ left ({\ frac {\ max (y, 0) ^ {2-p}} {(1-p) (2-p)}} - {\ frac {y \ mu ^ {1 -p}} {1-p}} + {\ frac {\ mu ^ {2-p}} {2-p}} \ right), amp; {\ text {else}} \ end {case}}}

Производящие функции кумулянта Твиди

Свойства моделей экспоненциальной дисперсии дают нам два дифференциальных уравнения. Первый связывает отображение среднего значения и функцию дисперсии друг с другом,

τ - 1 ( μ ) μ знак равно 1 V ( μ ) . {\ displaystyle {\ frac {\ partial \ tau ^ {- 1} (\ mu)} {\ partial \ mu}} = {\ frac {1} {V (\ mu)}}.}

Второй показывает, как отображение среднего значения связано с кумулянтной функцией,

κ ( θ ) θ знак равно τ ( θ ) . {\ displaystyle {\ frac {\ partial \ kappa (\ theta)} {\ partial \ theta}} = \ tau (\ theta).}

Эти уравнения могут быть решены для получения кумулянтной функции для различных случаев моделей Твиди. Кумулянтная производящая функция (CGF) затем может быть получена из кумулянтной функции. Аддитивный CGF обычно определяется уравнением

K * ( s ) знак равно бревно [ E ( е s Z ) ] знак равно λ [ κ ( θ + s ) - κ ( θ ) ] , {\ Displaystyle К ^ {*} (s) = \ журнал [\ Operatorname {E} (e ^ {sZ})] = \ lambda [\ kappa (\ theta + s) - \ kappa (\ theta)],}

и репродуктивный CGF

K ( s ) знак равно бревно [ E ( е s Y ) ] знак равно λ [ κ ( θ + s / λ ) - κ ( θ ) ] , {\ Displaystyle К (s) = \ журнал [\ OperatorName {E} (е ^ {sY})] = \ lambda [\ kappa (\ theta + s / \ lambda) - \ kappa (\ theta)],}

где s - переменная производящей функции.

Для аддитивных моделей Tweedie CGF принимают форму

K п * ( s ; θ , λ ) знак равно { λ κ п ( θ ) [ ( 1 + s / θ ) α - 1 ] п 1 , 2 , - λ бревно ( 1 + s / θ ) п знак равно 2 , λ е θ ( е s - 1 ) п знак равно 1 , {\ displaystyle K_ {p} ^ {*} (s; \ theta, \ lambda) = {\ begin {case} \ lambda \ kappa _ {p} (\ theta) [(1 + s / \ theta) ^ { \ alpha} -1] amp; \ quad p \ neq 1,2, \\ - \ lambda \ log (1 + s / \ theta) amp; \ quad p = 2, \\\ lambda e ^ {\ theta} (e ^ {s} -1) amp; \ quad p = 1, \ end {case}}}

а для репродуктивных моделей

K п ( s ; θ , λ ) знак равно { λ κ п ( θ ) { [ 1 + s / ( θ λ ) ] α - 1 } п 1 , 2 , - λ бревно [ 1 + s / ( θ λ ) ] п знак равно 2 , λ е θ ( е s / λ - 1 ) п знак равно 1. {\ Displaystyle K_ {p} (s; \ theta, \ lambda) = {\ begin {case} \ lambda \ kappa _ {p} (\ theta) \ left \ {[1 + s / (\ theta \ lambda) ] ^ {\ alpha} -1 \ right \} amp; \ quad p \ neq 1,2, \\ - \ lambda \ log [1 + s / (\ theta \ lambda)] amp; \ quad p = 2, \\ \ lambda e ^ {\ theta} (e ^ {s / \ lambda} -1) amp; \ quad p = 1. \ end {cases}}}

Аддитивная и репродуктивная модели Твиди условно обозначаются символами Tw *p ( θ, λ) и Tw p ( θ, σ 2) соответственно.

Первая и вторая производные CGF при s  = 0 дают среднее значение и дисперсию соответственно. Таким образом, можно подтвердить, что для аддитивных моделей дисперсия относится к среднему по степенному закону:

v а р ( Z ) E ( Z ) п . {\ displaystyle \ mathrm {var} (Z) \ propto \ mathrm {E} (Z) ^ {p}.}

Теорема Твиди о сходимости

Модели экспоненциальной дисперсии Твиди являются фундаментальными в статистической теории вследствие их роли в качестве фокусов конвергенции для широкого круга статистических процессов. Йоргенсен и др. Доказали теорему, определяющую асимптотическое поведение функций дисперсии, известную как теорема Твиди о сходимости. Технически эта теорема формулируется так: функция единичной дисперсии регулярна порядка p в нуле (или бесконечности) при условии, что V ( μ) ~  c 0 μ p для μ, когда она приближается к нулю (или бесконечности) для всех реальных значения p и c 0  gt; 0. Тогда для регулярной функции единичной дисперсии порядка p либо в нуле, либо в бесконечности и для

п ( 0 , 1 ) , {\ Displaystyle р \ notin (0,1),}

для любого, и у нас есть μ gt; 0 {\ displaystyle \ mugt; 0} σ 2 gt; 0 {\ displaystyle \ sigma ^ {2}gt; 0}

c - 1 ED ( c μ , σ 2 c 2 - п ) Т ш п ( μ , c 0 σ 2 ) {\ displaystyle c ^ {- 1} \ operatorname {ED} (c \ mu, \ sigma ^ {2} c ^ {2-p}) \ rightarrow Tw_ {p} (\ mu, c_ {0} \ sigma ^ {2})}

as или, соответственно, где сходимость происходит через такие значения c, что cμ находится в области значений θ, а c p −2 / σ 2 находится в области значений λ. Модель должна быть безгранично делимой, поскольку c 2−p стремится к бесконечности. c 0 {\ displaystyle c \ downarrow 0} c {\ displaystyle c \ rightarrow \ infty}

В нетехнических терминах эта теорема подразумевает, что любая модель экспоненциальной дисперсии, которая асимптотически проявляет степенной закон дисперсии к среднему, должна иметь функцию дисперсии, которая входит в область притяжения модели Твиди. Почти все функции распределения с конечными кумулянтными производящими функциями квалифицируются как модели экспоненциальной дисперсии, и большинство моделей экспоненциальной дисперсии проявляют функции дисперсии этой формы. Следовательно, многие распределения вероятностей имеют функции дисперсии, которые выражают это асимптотическое поведение, и распределения Твиди становятся фокусом сходимости для широкого диапазона типов данных.

Связанные дистрибутивы

Распределения Tweedie включают в себя ряд знакомых распределений, а также некоторые необычные, каждое из которых определяется доменом параметра индекса. У нас есть

Для 0 lt;  p  lt;1 модели Твиди не существует. Обратите внимание, что все стабильные дистрибутивы фактически генерируются стабильными дистрибутивами.

Возникновение и приложения

Модели Твиди и степенной закон Тейлора

Закон Тейлора - это эмпирический закон в экологии, который связывает дисперсию количества особей вида на единицу площади среды обитания с соответствующим средним значением степенным соотношением. Для подсчета населения Y со средним µ и дисперсией var ( Y) записан закон Тейлора:

вар ( Y ) знак равно а μ п , {\ displaystyle \ operatorname {var} (Y) = a \ mu ^ {p},}

где a и p - положительные постоянные. С тех пор, как Л. Р. Тейлор описал этот закон в 1961 году, было предложено множество различных объяснений для его объяснения, начиная от поведения животных, модели случайного блуждания, стохастической модели рождения, смерти, иммиграции и эмиграции до следствия равновесия и неравновесности статистических данных. механика. Нет единого мнения относительно объяснения этой модели.

Поскольку закон Тейлора математически идентичен степенному закону дисперсии к среднему, который характеризует модели Твиди, казалось разумным использовать эти модели и теорему о сходимости Твиди для объяснения наблюдаемой группировки животных и растений, связанной с законом Тейлора. Большинство наблюдаемых значений показателя степени p попали в интервал (1,2), и поэтому составное распределение Пуассона – гамма Твиди может показаться применимым. Сравнение эмпирической функции распределения с теоретическим составным распределением Пуассона – гамма предоставило средства для проверки непротиворечивости этой гипотезы.

В то время как традиционные модели закона Тейлора имели тенденцию включать специальные предположения о поведении животных или динамике популяции, теорема Твиди о сходимости подразумевала бы, что закон Тейлора является результатом общего эффекта математической сходимости во многом так же, как то, как центральная предельная теорема управляет поведением сходимости определенных типов случайные данные. В самом деле, любая математическая модель, приближение или симуляция, которые предназначены для вывода закона Тейлора (на основе этой теоремы), должны сходиться к форме моделей Твиди.

Конвергенция твиди и шум 1 / f

Розовый шум, или шум 1 / f, относится к типу шума, характеризующемуся степенным соотношением между его интенсивностями S ( f) на разных частотах f,

S ( ж ) 1 ж γ , {\ displaystyle S (f) \ propto {\ frac {1} {f ^ {\ gamma}}},}

где безразмерный показатель γ ∈ [0,1]. Он встречается в различных природных процессах. Существует много различных объяснений шума 1 / f, широко распространенная гипотеза основана на самоорганизованной критичности, когда считается, что динамические системы, близкие к критической точке, проявляют масштабно-инвариантное пространственное и / или временное поведение.

В этом подразделе будет описана математическая связь между шумом 1 / f и степенным законом Твиди. Для начала нам нужно ввести автомодельные процессы : Для последовательности чисел

Y знак равно ( Y я : я знак равно 0 , 1 , 2 , , N ) {\ Displaystyle Y = (Y_ {i}: я = 0,1,2, \ ldots, N)}

со средним

μ ^ знак равно E ( Y я ) , {\ displaystyle {\ widehat {\ mu}} = \ operatorname {E} (Y_ {i}),}

отклонения

у я знак равно Y я - μ ^ , {\ displaystyle y_ {i} = Y_ {i} - {\ widehat {\ mu}},}

отклонение

σ ^ 2 знак равно E ( у я 2 ) , {\ displaystyle {\ widehat {\ sigma}} ^ {2} = \ operatorname {E} (y_ {i} ^ {2}),}

и автокорреляционная функция

р ( k ) знак равно E ( у я , у я + k ) E ( у я 2 ) {\ displaystyle r (k) = {\ frac {\ operatorname {E} (y_ {i}, y_ {i + k})} {\ operatorname {E} (y_ {i} ^ {2})}}}

с запаздыванием k, если автокорреляция этой последовательности имеет дальнодействующее поведение

р ( k ) k - d L ( k ) {\ Displaystyle г (к) \ сим к ^ {- d} L (к)}

при k → ∞ и где L ( k) - медленно меняющаяся функция при больших значениях k, эта последовательность называется автомодельным процессом.

Метод разложения бункеров может быть использован для анализа самоподобные процессов. Рассмотрим набор неперекрывающихся интервалов одинакового размера, который делит исходную последовательность из N элементов на группы по m сегментов одинакового размера ( N / m - целое число), чтобы можно было определить новые репродуктивные последовательности на основе средних значений:

Y я ( м ) знак равно ( Y я м - м + 1 + + Y я м ) / м . {\ displaystyle Y_ {i} ^ {(m)} = (Y_ {im-m + 1} + \ cdots + Y_ {im}) / m.}

Дисперсия, определенная из этой последовательности, будет масштабироваться по мере изменения размера ячейки, так что

вар [ Y ( м ) ] знак равно σ ^ 2 м - d {\ displaystyle \ operatorname {var} [Y ^ {(m)}] = {\ widehat {\ sigma}} ^ {2} m ^ {- d}}

тогда и только тогда, когда автокорреляция имеет предельный вид

Lim k р ( k ) / k - d знак равно ( 2 - d ) ( 1 - d ) / 2. {\ displaystyle \ lim _ {k \ to \ infty} r (k) / k ^ {- d} = (2-d) (1-d) / 2.}

Также можно построить набор соответствующих аддитивных последовательностей

Z я ( м ) знак равно м Y я ( м ) , {\ Displaystyle Z_ {я} ^ {(м)} = mY_ {я} ^ {(м)},}

на основе расширяющихся бункеров,

Z я ( м ) знак равно ( Y я м - м + 1 + + Y я м ) . {\ displaystyle Z_ {i} ^ {(m)} = (Y_ {im-m + 1} + \ cdots + Y_ {im}).}

Если автокорреляционная функция демонстрирует такое же поведение, аддитивные последовательности будут подчиняться соотношению

вар [ Z я ( м ) ] знак равно м 2 вар [ Y ( м ) ] знак равно ( σ ^ 2 μ ^ 2 - d ) E [ Z я ( м ) ] 2 - d {\ displaystyle \ operatorname {var} [Z_ {i} ^ {(m)}] = m ^ {2} \ operatorname {var} [Y ^ {(m)}] = \ left ({\ frac {{\ widehat {\ sigma}} ^ {2}} {{\ widehat {\ mu}} ^ {2-d}}} \ right) \ operatorname {E} [Z_ {i} ^ {(m)}] ^ { 2-d}}

Поскольку и являются константами, это отношение представляет собой степенной закон дисперсии к среднему, с p  = 2 -  d. μ ^ {\ displaystyle {\ widehat {\ mu}}} σ ^ 2 {\ Displaystyle {\ widehat {\ sigma}} ^ {2}}

Biconditional отношения выше между степенной и степенной функцией автокорреляции дисперсии-к-средним и Винер-Хинчин теорема означает, что любая последовательность, которая обладает степенной дисперсией-к-среднего методом расширяющихся бункеров будут также проявляться 1 / f шум, и наоборот. Более того, теорема Твиди сходимости, в силу своего центрального предельного эффекта генерации распределений, которые проявляют степенные функции дисперсии к среднему, также будет генерировать процессы, которые проявляют шум 1 / f. Таким образом, теорема Твиди о сходимости обеспечивает альтернативное объяснение происхождения шума 1 / f, основанное на его центральном предельном эффекте.

Подобно тому, как центральная предельная теорема требует, чтобы в фокусе сходимости определенных видов случайных процессов было гауссово распределение и, таким образом, выражался белый шум, теорема о сходимости Твиди требует, чтобы в фокусе сходимости некоторых негауссовских процессов были распределения Твиди, которые выразить шум 1 / f.

Модели Твиди и мультифрактальность

Исходя из свойств автомодельных процессов, степенной показатель p  = 2 -  d связан с показателем Херста H и фрактальной размерностью D соотношением

D знак равно 2 - ЧАС знак равно 2 - п / 2. {\ Displaystyle D = 2-H = 2-p / 2.}

Одномерная последовательность данных самоподобных данных может продемонстрировать закон дисперсии мощности-к-среднему с местными вариациями в значении р и, следовательно, в значении D. Когда фрактальные структуры проявляют локальные изменения фрактальной размерности, они называются мультифракталами. Примеры последовательностей данных, которые демонстрируют локальные вариации p, такие как эта, включают отклонения собственных значений гауссовских ортогональных и унитарных ансамблей. Составное распределение Пуассона – гамма Твиди служило для моделирования мультифрактальности на основе локальных вариаций показателя Твиди α. Следовательно, в сочетании с вариацией α теорема Твиди о сходимости может рассматриваться как играющая роль в возникновении таких мультифракталов.

Было обнаружено, что изменение α в некоторых случаях подчиняется асимметричному распределению Лапласа. Было показано, что это распределение является членом семейства геометрических моделей Твиди, которые проявляются как предельные распределения в теореме сходимости для геометрических моделей дисперсии.

Кровоток в региональных органах

Кровоток в региональных органах традиционно оценивали путем инъекции меченных радиоактивными изотопами полиэтиленовых микросфер в артериальное кровообращение животных такого размера, что они оказываются захваченными микроциркуляцией органов. Затем оцениваемый орган делится на кубики равного размера, и количество радиоактивной метки в каждом кубе оценивается с помощью жидкостной сцинтилляции и регистрируется. Количество радиоактивности внутри каждого куба берется для отражения кровотока через этот образец во время инъекции. Можно оценить соседние кубики от органа, чтобы аддитивно определить кровоток через более крупные области. Благодаря работе JB Bassingthwaighte и других был получен эмпирический степенной закон между относительной дисперсией кровотока в образцах ткани ( RD  = стандартное отклонение / среднее значение) массы m относительно образцов эталонного размера:

р D ( м ) знак равно р D ( м ссылка ) ( м м ссылка ) 1 - D s {\ displaystyle RD (m) = RD (m _ {\ text {ref}}) \ left ({\ frac {m} {m _ {\ text {ref}}}} \ right) ^ {1-D_ {s} }}

Этот показатель степенного закона D s был назван фрактальной размерностью. Можно показать, что степенной закон Бассингтуайта напрямую связан со степенным законом дисперсии к среднему. Таким образом, региональный кровоток в органе может быть смоделирован с помощью распределения Пуассона – гамма соединения Твиди. В этой модели образец ткани можно рассматривать как содержащий случайное (пуассоновское) количество участков захвата, каждое из которых имеет гамма-распределенный кровоток. Было обнаружено, что кровоток на этом уровне микроциркуляции подчиняется гамма-распределению, что подтверждает эту гипотезу.

Метастаз рака

«Экспериментальный анализ метастазов рака » имеет некоторое сходство с описанным выше методом измерения регионального кровотока. Группам сингенных мышей и мышей соответствующего возраста внутривенно вводят аликвоты равных размеров суспензий клонированных раковых клеток, а затем через установленный период времени их легкие удаляют и подсчитывают количество метастазов рака в каждой паре легких. Если другим группам мышей вводят различные клоны раковых клеток, то количество метастазов на группу будет отличаться в соответствии с метастатическим потенциалом клонов. Давно признано, что могут быть значительные внутриклональные различия в количестве метастазов на мышь, несмотря на все попытки сохранить однородность экспериментальных условий в каждой клональной группе. Эта вариация больше, чем можно было бы ожидать на основе распределения Пуассона количества метастазов на мышь в каждом клоне, и когда дисперсия количества метастазов на мышь была нанесена на график против соответствующего среднего значения, был найден степенной закон.

Было обнаружено, что степенной закон отклонения от среднего для метастазов справедлив и для спонтанных метастазов у ​​мышей и для серий случаев метастазов у ​​человека. Поскольку гематогенные метастазы возникают в прямой связи с региональным кровотоком, а видеомикроскопические исследования показывают, что прохождение и захват раковых клеток внутри кровообращения похоже на эксперименты с микросферой, казалось правдоподобным предположить, что вариация в количестве гематогенных метастазов может отражать гетерогенность в региональном разрезе. органный кровоток. Модель кровотока была основана на распределении Пуассона – гамма соединения Твиди, распределении, управляющем непрерывной случайной величиной. По этой причине в модели метастазирования предполагалось, что кровоток регулируется этим распределением и что количество региональных метастазов возникает как процесс Пуассона, интенсивность которого прямо пропорциональна кровотоку. Это привело к описанию отрицательного биномиального распределения Пуассона (PNB) как дискретного эквивалента составного распределения Пуассона – гамма Твиди. Функция генерирования вероятности для распределения PNB имеет вид

грамм ( s ) знак равно exp [ λ α - 1 α ( θ α - 1 ) α { ( 1 - 1 θ + s θ ) α - 1 } ] {\ displaystyle G (s) = \ exp \ left [\ lambda {\ frac {\ alpha -1} {\ alpha}} \ left ({\ frac {\ theta} {\ alpha -1}} \ right) ^ {\ alpha} \ left \ {\ left (1 - {\ frac {1} {\ theta}} + {\ frac {s} {\ theta}} \ right) ^ {\ alpha} -1 \ right \} \Правильно]}

Тогда соотношение между средним значением и дисперсией распределения PNB будет

вар ( Y ) знак равно а E ( Y ) б + E ( Y ) , {\ displaystyle \ operatorname {var} (Y) = a \ operatorname {E} (Y) ^ {b} + \ operatorname {E} (Y),}

который в диапазоне многих экспериментальных анализов метастазов был бы неотличим от закона степени дисперсии к среднему. Однако для разреженных данных это отношение дискретной дисперсии к среднему будет больше похоже на распределение Пуассона, где дисперсия равна среднему.

Геномная структура и эволюция

Локальная плотность однонуклеотидных полиморфизмов (SNP) в геноме человека, а также в генах, по-видимому, группируется в соответствии со степенным законом дисперсии к среднему и распределением Пуассона – гамма соединения Твиди. В случае SNP их наблюдаемая плотность отражает методы оценки, доступность геномных последовательностей для анализа и гетерозиготность нуклеотидов. Первые два фактора отражают ошибки установления, присущие методам сбора, последний фактор отражает внутреннее свойство генома.

В модели слияния популяционной генетики каждый генетический локус имеет свою уникальную историю. В рамках эволюции популяции от некоторых видов некоторые генетические локусы предположительно могут быть прослежены до относительно недавнего общего предка, тогда как другие локусы могут иметь более древние генеалогии. У более древних геномных сегментов было бы больше времени для накопления SNP и рекомбинации. Р. Р. Хадсон предложил модель, в которой рекомбинация могла вызвать изменение во времени наиболее общего недавнего предка для разных сегментов генома. Высокая скорость рекомбинации может привести к тому, что хромосома будет содержать большое количество небольших сегментов с менее коррелированными генеалогиями.

Предполагая постоянную фоновую скорость мутации, количество SNP на геномный сегмент будет накапливаться пропорционально времени до самого последнего общего предка. Текущая популяционно-генетическая теория указывает на то, что это время в среднем будет иметь гамма-распределение. Составное распределение Пуассона – гамма Твиди предлагает модель, в которой карта SNP будет состоять из нескольких небольших геномных сегментов со средним числом SNP на сегмент, который будет гамма-распределением в соответствии с моделью Хадсона.

Распределение генов в геноме человека также продемонстрировало степенной закон дисперсии к среднему, когда для определения соответствующих дисперсий и средних значений использовался метод расширения интервалов. Аналогичным образом было обнаружено, что количество генов в счетном бункере подчиняется составному распределению Пуассона-гамма Твиди. Это распределение вероятности было сочтено совместимым с двумя различными биологическими моделями: модель микропорядка, в которой количество генов на единицу длины генома определялось суммой случайного числа меньших геномных сегментов, полученных путем случайного разрушения и реконструкции протохормосом. Предполагается, что эти меньшие сегменты несут в среднем гамма-распределенное количество генов.

В альтернативной модели кластера генов гены будут случайным образом распределены в протохромосомах. В больших эволюционных временных масштабах будут происходить тандемные дупликации, мутации, вставки, делеции и перестройки, которые могут повлиять на гены через стохастический процесс рождения, смерти и иммиграции, что приведет к составному распределению Пуассона – гамма Твиди.

Оба эти механизма предполагают нейтральные эволюционные процессы, которые приведут к региональной кластеризации генов.

Теория случайных матриц

Гауссы унитарный ансамбль (GUE) состоит из комплексных эрмитовых матриц, инвариантные относительно унитарных преобразований, тогда как гауссов ортогонален ансамбль (ГЭ) состоит из вещественных симметричных матриц инвариантны относительно ортогональных преобразований. Ранжированные собственные значения E n из этих случайных матриц подчиняются полукруглому распределению Вигнера : для матрицы N × N средняя плотность для собственных значений размера E будет

ρ ¯ ( E ) знак равно { 2 N - E 2 / π | E | lt; 2 N 0 | E | gt; 2 N {\ displaystyle {\ bar {\ rho}} (E) = {\ begin {case} {\ sqrt {2N-E ^ {2}}} / \ pi amp; \ quad \ left \ vert E \ right \ vert lt; {\ sqrt {2N}} \\ 0 amp; \ quad \ left \ vert E \ right \ vertgt; {\ sqrt {2N}} \ end {case}}}

при E → ∞. Интегрирование полукруглого правила дает количество собственных значений в среднем меньше E,

η ¯ ( E ) знак равно 1 2 π [ E 2 N - E 2 + 2 N Arcsin ( E 2 N ) + π N ] . {\ displaystyle {\ bar {\ eta}} (E) = {\ frac {1} {2 \ pi}} \ left [E {\ sqrt {2N-E ^ {2}}} + 2N \ arcsin \ left ({\ frac {E} {\ sqrt {2N}}} \ right) + \ pi N \ right].}

Ранжированные собственные значения можно развернуть или перенормировать с помощью уравнения

е п знак равно η ¯ ( E ) знак равно - E п d E ρ ¯ ( E ) . {\ displaystyle e_ {n} = {\ bar {\ eta}} (E) = \ int \ limits _ {- \ infty} ^ {E_ {n}} \, dE ^ {\ prime} {\ bar {\ rho}} (E ^ {\ prime}).}

Это удаляет тенденцию последовательности из колеблющейся части. Если мы посмотрим на абсолютную величину разницы между фактическим и ожидаемым кумулятивным числом собственных значений

| D ¯ п | знак равно | п - η ¯ ( E п ) | {\ displaystyle \ left | {\ bar {D}} _ {n} \ right | = \ left | n - {\ bar {\ eta}} (E_ {n}) \ right |}

мы получаем последовательность флуктуаций собственных значений, которая, используя метод расширения интервалов, выявляет степенной закон дисперсии к среднему. Флуктуации собственных значений как GUE, так и GOE проявляют этот степенной закон с показателями степенного закона в диапазоне от 1 до 2, и они аналогичным образом проявляют спектры шума 1 / f. Эти флуктуации собственных значений также соответствуют составному распределению Пуассона – гамма Твиди и демонстрируют мультифрактальность.

Распределение простых чисел

Вторая функция Чебышева ψ ( х) задается,

ψ ( Икс ) знак равно п ^ k Икс бревно п ^ знак равно п Икс Λ ( п ) {\ displaystyle \ psi (x) = \ sum _ {{\ widehat {p \,}} ^ {k} \ leq x} \ log {\ widehat {p \,}} = \ sum _ {n \ leq x } \ Lambda (n)}

где суммирование проводится по всем степеням простых чисел, не превосходящих  x, x пробегает положительные действительные числа и является функцией фон Мангольдта. Функция ψ ( x) связана с функцией подсчета простых чисел π ( x) и как таковая предоставляет информацию о распределении простых чисел среди действительных чисел. Это асимптотическое по отношению к  x утверждение, эквивалентное теореме о простых числах, и также можно показать, что оно связано с нулями дзета-функции Римана, расположенными на критической полосе ρ, где действительная часть дзета-нуля ρ находится между 0 и 1. Тогда ψ, выраженное для x больше единицы, можно записать: п ^ k {\ displaystyle {\ widehat {p \,}} ^ {k}} Λ ( п ) {\ Displaystyle \ Lambda (п)}

ψ 0 ( Икс ) знак равно Икс - ρ Икс ρ ρ - пер 2 π - 1 2 пер ( 1 - Икс - 2 ) {\ displaystyle \ psi _ {0} (x) = x- \ sum _ {\ rho} {\ frac {x ^ {\ rho}} {\ rho}} - \ ln 2 \ pi - {\ frac {1 } {2}} \ ln (1-x ^ {- 2})}

куда

ψ 0 ( Икс ) знак равно Lim ε 0 ψ ( Икс - ε ) + ψ ( Икс + ε ) 2 . {\ displaystyle \ psi _ {0} (x) = \ lim _ {\ varepsilon \ rightarrow 0} {\ frac {\ psi (x- \ varepsilon) + \ psi (x + \ varepsilon)} {2}}.}

В гипотезой Римана гласит, что нетривиальные нули о дзета - функции Римана все имеют действительную часть ½. Эти нули дзета-функции связаны с распределением простых чисел. Шенфельд показал, что если гипотеза Римана верна, то

Δ ( Икс ) знак равно | ψ ( Икс ) - Икс | lt; Икс бревно 2 ( Икс ) / ( 8 π ) {\ displaystyle \ Delta (x) = \ left \ vert \ psi (x) -x \ right \ vert lt;{\ sqrt {x}} \ log ^ {2} (x) / (8 \ pi)}

для всех. Если мы проанализируем чебышёвские отклонения Δ ( n) для целых чисел n, используя метод расширения интервалов, и построим график зависимости дисперсии от среднего, можно продемонстрировать степенной закон дисперсии для среднего. Кроме того, эти отклонения соответствуют составному пуассоновскому гамма-распределению Твиди, и они демонстрируют шум 1 / f. Икс gt; 73,2 {\ displaystyle xgt; 73,2}

Другие приложения

Приложения дистрибутивов Tweedie включают:

  • актуарные исследования
  • пробирный анализ
  • анализ выживаемости
  • экология
  • анализ потребления алкоголя британскими подростками
  • медицинские приложения
  • экономика здравоохранения
  • метеорология и климатология
  • рыболовство
  • Функция Мертенса
  • самоорганизованная критичность
использованная литература
дальнейшее чтение
  • Данн, ПК; Смит, GK (2018). Обобщенные линейные модели с примерами в R. Нью-Йорк: Спрингер. DOI : 10.1007 / 978-1-4419-0118-7. ISBN   978-1-4419-0118-7. Глава 12 посвящена дистрибутивам и моделям Tweedie.
  • Каас, Р. (2005). «Составное распределение Пуассона и GLM - распределение Твиди». В материалах контактного форума «3-й день актуарной и финансовой математики», страницы 3–12. Брюссель: Королевская фламандская академия науки и искусств Бельгии.
  • Твиди, MCK (1956). «Некоторые статистические свойства обратных гауссовских распределений». Virginia J. Sci. Новая серия. 7: 160–165.
Последняя правка сделана 2023-03-19 08:40:01
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте