Распределение Уишарта

редактировать

Обозначение Уишарта
Нотация	X ~ W p(V, n)
Параметры	n>p - 1 степени свободы (real ). V>0 масштабная матрица (p × p pos. Def )
Поддержка	X(p × p) положительно определенная матрица
PDF	$f X (x) = \| x \| (n - p - 1) / 2 e - tr ⁡ (V - 1 x) / 2 2 np 2 \| V \| n / 2 Γ p (n 2) {\ displaystyle f _ {\ mathbf {X}} (\ mathbf {x}) = {\ frac {\| \ mathbf {x} \| ^ {(np- 1) / 2} e ^ {- \ operatorname {tr} (\ mathbf {V} ^ {- 1} \ mathbf {x}) / 2}} {2 ^ {\ frac {np} {2}} \| { \ mathbf {V}} \| ^ {n / 2} \ Gamma _ {p} ({\ frac {n} {2}})}}}$ ${\ displaystyle f _ {\ mathbf {X}} (\ mathbf {x}) = {\ frac { \| \ mathbf {x} \| ^ {(np-1) / 2} e ^ {- \ operatorname {tr} (\ mathbf {V} ^ {- 1} \ mathbf {x}) / 2}} {2 ^ {\ frac {np} {2}} \| {\ mathbf {V}} \| ^ {n / 2} \ Gamma _ {p} ({\ frac {n} {2}})}}}$ Γp- это многомерная гамма-функция tr - функция трассировки
Среднее значение	$E ⁡ [X] = n V {\ displaystyle \ operatorname {E} [X] = n {\ mathbf {V}}}$ ${\ displaystyle \ operatorname {E} [X] = n {\ mathbf {V}}}$
Mode	(n - p - 1) V для n ≥ p + 1
Дисперсия	$Var ⁡ (X ij) = n (vij 2 + viivjj) {\ displaystyle \ operatorname {Var } (\ mathbf {X} _ {ij}) = n \ left (v_ {ij} ^ {2} + v_ {ii} v_ {jj} \ right)}$ $\ operatorname {Var} (\ mathbf {X} _ {ij}) = n \ left (v_ {ij} ^ 2 + v_ {ii} v_ {jj} \ right)$
Энтропия	см. ниже
CF	$Θ ↦ \| I - 2 i Θ V \| - п 2 {\ displaystyle \ Theta \ mapsto \ left \| {\ mathbf {I}} -2i \, {\ mathbf {\ Theta}} {\ mathbf {V}} \ right \| ^ {- {\ frac {n } {2}}}}$ $\ Theta \ mapsto \ left \| {\ mathbf I} - 2i \, {\ mathbf \ Theta} {\ mathbf V} \ right \| ^ {- \ frac {n} {2}}$

В статистике, распределение Уишарта является обобщением для нескольких измерений гамма-распределения. Он назван в честь Джона Уишарта, который первым сформулировал распределение в 1928 году.

Это семейство распределений вероятностей, определенных на симметричных, неотрицательных -определенная матрица -значная случайные величины («случайные матрицы»). Эти распределения имеют большое значение при оценке ковариационных матриц в многомерной статистике. В байесовской статистике распределение Уишарта является сопряженным априорным обратной ковариационной матрицей многомерной нормальной случайной -vector.

Содержание

1 Определение
2 Вхождение
3 Функция плотности вероятности
4 Использование в байесовской статистике
- 4.1 Выбор параметров
5 Свойства
- 5.1 Логарифмическое ожидание
- 5.2 Логарифмическая дисперсия
- 5.3 Энтропия
- 5.4 Кросс-энтропия
- 5.5 KL-дивергенция
- 5.6 Характеристическая функция
6 Теорема
- 6.1 Следствие 1
- 6.2 Следствие 2
7 Оценщик многомерного нормального распределения
8 Разложение Бартлетта
9 Предельное распределение матричных элементов
10 Диапазон параметра формы
11 Связь с другими распределениями
12 См. Также
13 Ссылки
14 Внешние ссылки

Определение

Предположим, что G представляет собой матрицу размера p × n, каждый столбец которой независимо, полученный из p-вариативного нормального распределения с нулевым средним:

G i = (gi 1, …, G i p) T ∼ N p (0, V). {\ displaystyle G_ {i} = (g_ {i} ^ {1}, \ dots, g_ {i} ^ {p}) ^ {T} \ sim N_ {p} (0, V).}

{\ displaystyle G_ {i} = (g_ {i} ^ {1}, \ dots, g_ {i} ^ {p}) ^ {T} \ sim N_ {p} (0, V).}

Тогда распределение Уишарта - это распределение вероятностей случайной матрицы размера p × p

S = GGT = ∑ i = 1 n G i G i T {\ displaystyle S = GG ^ {T} = \ sum _ {i = 1} ^ {n} G_ {i} G_ {i} ^ {T}}

{\ displaystyle S = GG ^ {T} = \ sum _ {i = 1} ^ {n} G_ {i} G_ {i} ^ {T}}

, известная как матрица рассеяния. Один указывает, что S имеет это распределение вероятностей, записывая

S ∼ W p (V, n). {\ displaystyle S \ sim W_ {p} (V, n).}

S \ sim W_p (V, n).

Положительное целое число n - это количество степеней свободы. Иногда это пишут W (V, p, n). При n ≥ p матрица S обратима с вероятностью 1, если V обратима.

Если p = V = 1, то это распределение является распределением хи-квадрат с n степенями свободы.

Вхождение

Распределение Уишарта возникает как распределение выборочной ковариационной матрицы для выборки из многомерного нормального распределения. Это часто встречается в тестах отношения правдоподобия при многомерном статистическом анализе. Он также возникает в спектральной теории случайных матриц и в многомерном байесовском анализе. Он также встречается в беспроводной связи при анализе характеристик рэлеевских замираний MIMO беспроводных каналов.

Функция плотности вероятности

Распределение Уишарта может характеризуется его функцией плотности вероятности следующим образом:

Пусть X будет симметричной матрицей случайных величин размера p × p, которая равна положительно определенный. Пусть V будет (фиксированной) симметричной положительно определенной матрицей размера p × p.

Тогда, если n ≥ p, X имеет распределение Уишарта с n степенями свободы, если оно имеет функцию плотности вероятности

f X (x) = 1 2 np / 2 | V | n / 2 Γ p (n 2) | х | (N - п - 1) / 2 е - (1/2) тр ⁡ (V - 1 Икс) {\ Displaystyle F _ {\ mathbf {X}} (\ mathbf {x}) = {\ frac {1} { 2 ^ {np / 2} \ left | {\ mathbf {V}} \ right | ^ {n / 2} \ Gamma _ {p} \ left ({\ frac {n} {2}} \ right)}} {\ left | \ mathbf {x} \ right |} ^ {(np-1) / 2} e ^ {- (1/2) \ operatorname {tr} ({\ mathbf {V}} ^ {- 1} \ mathbf {x})}}

{\ displaystyle f _ {\ mathbf {X}} (\ mathbf {x}) = {\ frac {1} {2 ^ {np / 2} \ left | {\ mathbf {V}} \ right | ^ {n / 2} \ Gamma _ {p} \ left ({\ frac {n} {2}} \ right)}} {\ left | \ mathbf {x} \ rig ht |} ^ {(np-1) / 2} e ^ {- (1/2) \ operatorname {tr} ({\ mathbf {V}} ^ {- 1} \ mathbf {x})}}

где $| х | {\ displaystyle \ left | {\ mathbf {x}} \ right |}$ ${\ displaystyle \ left | {\ mathbf {x}} \ righ t |}$ - это определитель для $x {\ displaystyle \ mathbf {x}}$ $\ mathbf {x}$ и Γ p - многомерная гамма-функция, определяемая как

Γ p (n 2) = π p (p - 1) / 4 ∏ j = 1 p Γ ( n 2 - j - 1 2). {\ displaystyle \ Gamma _ {p} \ left ({\ frac {n} {2}} \ right) = \ pi ^ {p (p-1) / 4} \ prod _ {j = 1} ^ {p } \ Gamma \ left ({\ frac {n} {2}} - {\ frac {j-1} {2}} \ right).}

{\ displaystyle \ Gamma _ { p} \ left ({\ frac {n} {2}} \ right) = \ pi ^ {p (p-1) / 4} \ prod _ {j = 1} ^ {p} \ Gamma \ left ({ \ frac {n} {2}} - {\ frac {j-1} {2}} \ right).}

Плотность выше не является совместной плотностью всех $p 2 {\ displaystyle p ^ {2}}$ $p ^ {2}$ элементы случайной матрицы X (например, $p 2 {\ displaystyle p ^ {2}}$ $p ^ {2}$ -мерная плотность не существует из-за ограничений симметрии $X ij = X ji {\ displaystyle X_ {ij} = X_ {ji}}$ ${\ displaystyle X_ {ij} = X_ {ji}}$ ), это скорее совместная плотность $p (p + 1) / 2 {\ displaystyle p (p + 1) / 2}$ $p (p + 1) / 2$ elements $X ij {\ displaystyle X_ {ij}}$ $X_ {ij}$ for $я ≤ j {\ displaystyle i \ leq j}$ $я \ leq j$ (, стр. 38). Кроме того, приведенная выше формула плотности применима только к положительно определенным матрицам $x; {\ displaystyle \ mathbf {x};}$ ${\ displaystyle \ mathbf {x};}$ для других матриц плотность равна нулю.

Плотность совместных собственных значений для собственных значений $λ 1,… λ p ≥ 0 {\ displaystyle \ lambda _ {1}, \ dots \ lambda _ {p} \ geq 0}$ ${\ displaystyle \ lambda _ {1}, \ точки \ лямбда _ {p} \ geq 0}$ случайной матрицы $X ∼ W p (I, n) {\ displaystyle \ mathbf {X} \ sim W_ {p} (\ mathbf {I}, n)}$ ${\ displaystyle \ mathbf {X} \ sim W_ {p} (\ mathbf {I}, n)}$ равно

cn, pe - 1 2 ∑ я λ я ∏ λ я (n - p - 1) / 2 ∏ i < j | λ i − λ j | {\displaystyle c_{n,p}e^{-{\frac {1}{2}}\sum _{i}\lambda _{i}}\prod \lambda _{i}^{(n-p-1)/2}\prod _{i

{\ displaystyle c_ {n, p} e ^ {- {\ frac { 1} {2}} \ sum _ {i} \ lambda _ {i}} \ prod \ lambda _ {i} ^ {(np-1) / 2} \ prod _ {i <j} | \ lambda _ { i} - \ lambda _ {j} |}

где $cn, p {\ displaystyle c_ {n, p}}$ ${\ displaystyle c_ {n, p}}$ - постоянная величина.

Фактически, приведенное выше определение может быть расширено до любого действительного n>p - 1. Если n ≤ p - 1, то Wishart больше не имеет плотности - вместо этого оно представляет сингулярное распределение, которое принимает значения в подпространство более низкой размерности пространства матриц размера p × p.

Использование в байесовской статистике

В байесовской статистике в контексте многомерного нормального распределения, распределение Уишарта является сопряженным до матрицы точности Ω= Σ, где Σ - ковариационная матрица.

Выбор параметров

Наименее информативный, правильное априорное значение Уишарта получается путем установки n = p.

Предыдущее среднее значение W p(V, n) равно n V, что предполагает разумный выбор для V будет n Σ0, где Σ0- некоторое предварительное предположение для ковариационной матрицы.

Свойства

Логарифмическое ожидание

Следующая формула играет роль в вариационных вычислениях Байеса для сетей Байеса с использованием распределения Уишарта:

E ⁡ [ln ⁡ | X | ] = ψ p (n 2) + p ln ⁡ (2) + ln ⁡ | V | {\ Displaystyle \ OperatorName {E} [\, \ ln \ left | \ mathbf {X} \ right | \,] = \ psi _ {p} \ left ({\ frac {n} {2}} \ right) + p \, \ ln (2) + \ ln | \ mathbf {V} |}

{\ displaystyle \ operatorname {E} [\, \ ln \ left | \ mathbf {X} \ right | \,] = \ psi _ {p} \ left ({\ frac {n} {2}} \ right) + p \, \ ln (2) + \ ln | \ mathbf {V} |}

где $ψ p {\ displaystyle \ psi _ {p}}$ $\ psi _ {p}$ - многомерная дигамма-функция (производная логарифма многомерной гамма-функции ).

Логарифмическая дисперсия

Следующее вычисление дисперсии может помочь в байесовской статистике:

Var ⁡ [ln ⁡ | X | ] Знак равно ∑ я знак равно 1 п ψ 1 (N + 1 - я 2) {\ Displaystyle \ OperatorName {Var} \ left [\, \ ln \ left | \ mathbf {X} \ right | \, \ right] = \ сумма _ {я = 1} ^ {p} \ psi _ {1} \ left ({\ frac {n + 1-i} {2}} \ right)}

{\ displaystyle \ operatorname {Var } \ left [\, \ ln \ left | \ mathbf {X} \ right | \, \ right] = \ sum _ {i = 1} ^ {p} \ psi _ {1} \ left ({\ frac { п + 1-я} {2}} \ справа)}

где $ψ 1 {\ displaystyle \ psi _ {1}}$ $\ psi _ {1}$ - тригамма-функция. Это возникает при вычислении информации Фишера случайной величины Уишарта.

Энтропия

информационная энтропия распределения имеет следующую формулу:

H ⁡ [X] = - ln ⁡ (B (V, n)) - n - p - 1 2 E ⁡ [ln ⁡ | X | ] + np 2 {\ displaystyle \ operatorname {H} \ left [\, \ mathbf {X} \, \ right] = - \ ln \ left (B (\ mathbf {V}, n) \ right) - {\ frac {np-1} {2}} \ operatorname {E} \ left [\, \ ln \ left | \ mathbf {X} \ right | \, \ right] + {\ frac {np} {2}}}

{\ displaystyle \ operatorname {H} \ left [\, \ mathbf {X} \, \ right] = - \ ln \ left (B (\ mathbf {V}, n) \ right) - {\ frac {np-1} {2}} \ operatorname {E} \ left [\, \ ln \ left | \ mathbf {X} \ right | \, \ right] + {\ frac {np} {2}}}

, где B (V, n) - нормализующая константа распределения:

B (V, n) = 1 | V | n / 2 2 n p / 2 Γ p (n 2). {\ Displaystyle B (\ mathbf {V}, n) = {\ frac {1} {\ left | \ mathbf {V} \ right | ^ {n / 2} 2 ^ {np / 2} \ Gamma _ {p } \ left ({\ frac {n} {2}} \ right)}}.}

{\ displaystyle B (\ mathbf {V}, n) = {\ frac {1} {\ left | \ mathbf {V} \ right | ^ { n / 2} 2 ^ {np / 2} \ Gamma _ {p} \ left ({\ frac {n} {2}} \ right)}}.}

Это может быть расширено следующим образом:

H ⁡ [X] = n 2 ln ⁡ | V | + n p 2 ln ⁡ 2 + ln ⁡ Γ p (n 2) - n - p - 1 2 E ⁡ [ln ⁡ | X | ] + n p 2 = n 2 ln ⁡ | V | + n p 2 ln ⁡ 2 + ln ⁡ Γ p (n 2) - n - p - 1 2 (ψ p (n 2) + p ln ⁡ 2 + ln ⁡ | V |) + n p 2 = n 2 ln ⁡ | V | + np 2 ln ⁡ 2 + ln ⁡ Γ p (n 2) - n - p - 1 2 ψ p (n 2) - n - p - 1 2 (p ln ⁡ 2 + ln ⁡ | V |) + np 2 = p + 1 2 ln ⁡ | V | + 1 2 п (п + 1) пер ⁡ 2 + пер ⁡ Γ p (N 2) - n - p - 1 2 ψ p (n 2) + np 2 {\ displaystyle {\ begin {align} \ operatorname {H } \ left [\, \ mathbf {X} \, \ right] = {\ frac {n} {2}} \ ln \ left | \ mathbf {V} \ right | + {\ frac {np} {2 }} \ ln 2+ \ ln \ Gamma _ {p} \ left ({\ frac {n} {2}} \ right) - {\ frac {np-1} {2}} \ operatorname {E} \ left [\, \ ln \ left | \ mathbf {X} \ right | \, \ right] + {\ frac {np} {2}} \\ [8pt] = {\ frac {n} {2}} \ ln \ left | \ mathbf {V} \ right | + {\ frac {np} {2}} \ ln 2+ \ ln \ Gamma _ {p} \ left ({\ frac {n} {2}} \ right) - {\ frac {np-1} {2}} \ left (\ psi _ {p} \ left ({\ frac {n} {2}} \ right) + p \ ln 2+ \ ln \ left | \ mathbf {V} \ right | \ right) + {\ frac {np} {2}} \\ [8pt] = {\ frac {n} {2}} \ ln \ left | \ mathbf {V} \ right | + {\ frac {np} {2}} \ ln 2+ \ ln \ Gamma _ {p} \ left ({\ frac {n} {2}} \ right) - {\ frac {np-1} {2}} \ psi _ {p} \ left ({\ frac {n} {2}} \ right) - {\ frac {np-1} {2}} \ left (p \ ln 2+ \ ln \ left | \ mathbf {V} \ right | \ right) + {\ frac {np} {2}} \\ [8pt] = {\ frac {p + 1} {2}} \ ln \ left | \ mathbf {V} \ right | + {\ frac {1} {2}} p (p + 1) \ ln 2+ \ ln \ Gamma _ {p} \ left ({\ frac {n} {2}} \ right) - {\ frac {np-1} {2}} \ p si _ {p} \ left ({\ frac {n} {2}} \ right) + {\ frac {np} {2}} \ end {align}}}

{\ displaystyle {\ begin {align} \ operatorname {H} \ left [\, \ mathbf {X} \, \ right] = {\ frac {n} {2}} \ ln \ left | \ mathbf {V} \ right | + {\ frac {np} {2}} \ ln 2+ \ ln \ Gamma _ {p} \ left ({\ frac {n} {2}} \ right) - {\ frac {np-1} {2}} \ operatorname {E} \ left [\, \ ln \ left | \ mathbf {X} \ right | \, \ right] + {\ frac {np} {2}} \\ [8pt] = {\ frac {n} {2}} \ ln \ left | \ mathbf {V} \ right | + { \ frac {np} {2}} \ ln 2+ \ ln \ Gamma _ {p} \ left ({\ frac {n} {2}} \ right) - {\ frac {np-1} {2}} \ left (\ psi _ {p} \ left ({\ frac {n} {2}} \ right) + p \ ln 2+ \ ln \ left | \ mathbf {V} \ right | \ right) + {\ frac {np} {2}} \\ [8pt] = {\ frac {n} {2}} \ ln \ left | \ mathbf {V} \ ri ght | + {\ frac {np} {2}} \ ln 2+ \ ln \ Gamma _ {p} \ left ({\ frac {n} {2}} \ right) - {\ frac {np-1} {2}} \ psi _ {p} \ left ({\ frac {n} {2}} \ right) - {\ frac {np-1} {2}} \ left (p \ ln 2+ \ ln \ left | \ mathbf {V} \ right | \ right) + {\ frac {np} {2}} \\ [8pt] = {\ frac {p + 1} {2}} \ ln \ left | \ mathbf {V} \ right | + {\ frac {1} {2}} p (p + 1) \ ln 2+ \ ln \ Gamma _ {p} \ left ({\ frac {n} {2}} \ right) - {\ frac {np-1} {2}} \ psi _ {p} \ left ({\ frac {n} {2}} \ right) + {\ frac {np} {2}} \ end { выровнено}}}

Кросс-энтропия

перекрестная энтропия двух распределений Уишарта $p 0 {\ displaystyle p_ {0}}$ $p_ {0}$ с параметрами $n 0, V 0 {\ displaystyle n_ {0}, V_ {0}}$ $n_ {0}, V_ {0}$ и $p 1 {\ displaystyle p_ {1}}$ $p_ {1}$ с параметрами $n 1, V 1 {\ displaystyle n_ {1}, V_ {1}}$ $n_ {1}, V_ {1}$ равно

H (p 0, p 1) = E p 0 ⁡ [- log ⁡ p 1] = E p 0 ⁡ [- log ⁡ | X | (n 1 - p 1 - 1) / 2 e - tr ⁡ (V 1 - 1 X) / 2 2 n 1 p 1/2 | V 1 | n 1/2 Γ p 1 (n 1 2)] = n 1 p 1 2 журнал ⁡ 2 + n 1 2 журнал ⁡ | V 1 | + журнал ⁡ Γ p 1 (n 1 2) - n 1 - p 1 - 1 2 E p 0 ⁡ [журнал ⁡ | X | ] + 1 2 E p 0 ⁡ [tr ⁡ (V 1 - 1 X)] = n 1 p 1 2 журнал ⁡ 2 + n 1 2 журнал ⁡ | V 1 | + журнал ⁡ Γ p 1 (n 1 2) - n 1 - p 1 - 1 2 (ψ p 0 (n 0 2) + p 0 log ⁡ 2 + журнал ⁡ | V 0 |) + 1 2 tr ⁡ (V 1 - 1 n 0 V 0) = - n 1 2 журнал ⁡ | V 1 - 1 V 0 | + p 1 + 1 2 журнал ⁡ | V 0 | + n 0 2 tr ⁡ (V 1 - 1 V 0) + журнал ⁡ Γ p 1 (n 1 2) - n 1 - p 1 - 1 2 ψ p 0 (n 0 2) + n 1 (p 1 - p 0) + p 0 (p 1 + 1) 2 журнал ⁡ 2 {\ displaystyle {\ begin {выровнено} H (p_ {0}, p_ {1}) = \ operatorname {E} _ {p_ {0}} [\, - \ log p_ {1} \,] \\ [8pt] = \ operatorname {E} _ {p_ {0}} \ left [\, - \ log {\ frac {\ left | \ mathbf { X} \ right | ^ {(n_ {1} -p_ {1} -1) / 2} e ^ {- \ operatorname {tr} (\ mathbf {V} _ {1} ^ {- 1} \ mathbf { X}) / 2}} {2 ^ {n_ {1} p_ {1} / 2} \ left | \ mathbf {V} _ {1} \ right | ^ {n_ {1} / 2} \ Gamma _ { p_ {1}} \ left ({\ tfrac {n_ {1}} {2}} \ right)}} \ right] \\ [8pt] = {\ tfrac {n_ {1} p_ {1}} { 2}} \ log 2 + {\ tfrac {n_ {1}} {2}} \ log \ left | \ mathbf {V} _ {1} \ right | + \ log \ Gamma _ {p_ {1}} ( {\ tfrac {n_ {1}} {2}}) - {\ tfrac {n_ {1} -p_ {1} -1} {2}} \ operatorname {E} _ {p_ {0}} \ left [ \, \ log \ left | \ mathbf {X} \ right | \, \ right] + {\ tfrac {1} {2}} \ operatorname {E} _ {p_ {0}} \ left [\, \ operatorname {tr} \ left (\, \ mathbf {V} _ {1} ^ {- 1} \ mathbf {X} \, \ right) \, \ right] \\ [8pt] = {\ tfrac {n_ { 1} p_ {1}} {2}} \ log 2 + {\ tfrac {n_ {1}} {2}} \ log \ left | \ mathbf {V} _ {1} \ right | + \ log \ Gamma _ {p_ {1}} ({\ tfrac {n_ {1}} {2}}) - {\ tfrac {n_ {1} -p_ {1} -1} {2}} \ left (\ psi _ {p_ {0}} ({\ tfrac {n_ {0}} {2}}) + p_ {0} \ log 2+ \ log \ left | \ mathbf {V} _ {0} \ right | \ right) + {\ tfrac {1} {2}} \ operatorname {tr} \ left (\, \ mathbf {V} _ {1} ^ {- 1} n_ {0} \ mathbf {V} _ {0} \, \ right) \\ [8pt] = - {\ tfrac {n_ {1}} {2} } \ log \ left | \, \ mathbf {V} _ {1} ^ {- 1} \ mathbf {V} _ {0} \, \ right | + {\ tfrac {p_ {1} +1} {2 }} \ log \ left | \ mathbf {V} _ {0} \ right | + {\ tfrac {n_ {0}} {2}} \ operatorname {tr} \ left (\, \ mathbf {V} _ { 1} ^ {- 1} \ mathbf {V} _ {0} \ right) + \ log \ Gamma _ {p_ {1}} \ left ({\ tfrac {n_ {1}} {2}} \ right) - {\ tfrac {n_ {1} -p_ {1} -1} {2}} \ psi _ {p_ {0}} ({\ tfrac {n_ {0}} {2}}) + {\ tfrac { n_ {1} (p_ {1} -p_ {0}) + p_ {0} (p_ {1} +1)} {2}} \ log 2 \ end {align}}}

{\ displaystyle {\ begin {выровнен} H (p_ {0}, p_ {1}) = \ operatorname {E} _ {p_ {0}} [\, - \ log p_ {1} \,] \\ [8pt] = \ operatorname {E} _ {p_ {0}} \ left [\, - \ log {\ frac {\ left | \ mathbf { X} \ right | ^ {(n_ {1} -p_ {1} -1) / 2} e ^ {- \ operatorname {tr} (\ mathbf {V} _ {1} ^ {- 1} \ mathbf { X}) / 2}} {2 ^ {n_ {1} p_ {1} / 2} \ left | \ mathbf {V} _ {1} \ right | ^ {n_ {1} / 2} \ Gamma _ { p_ {1}} \ left ({\ tfrac {n_ {1}} {2}} \ right)}} \ right] \\ [8pt] = {\ tfrac {n_ {1} p_ {1}} { 2}} \ log 2 + {\ tfrac {n_ {1}} {2}} \ log \ left | \ mathbf {V} _ {1} \ right | + \ log \ Gamma _ {p_ {1}} ( {\ tfrac {n_ { 1}} {2}}) - {\ tfrac {n_ {1} -p_ {1} -1} {2}} \ operatorname {E} _ {p_ {0}} \ left [\, \ log \ left | \ mathbf {X} \ right | \, \ right] + {\ tfrac {1} {2}} \ operatorname {E} _ {p_ {0}} \ left [\, \ operatorname {tr} \ left ( \, \ mathbf {V} _ {1} ^ {- 1} \ mathbf {X} \, \ right) \, \ right] \\ [8pt] = {\ tfrac {n_ {1} p_ {1} } {2}} \ log 2 + {\ tfrac {n_ {1}} {2}} \ log \ left | \ mathbf {V} _ {1} \ right | + \ log \ Gamma _ {p_ {1} } ({\ tfrac {n_ {1}} {2}}) - {\ tfrac {n_ {1} -p_ {1} -1} {2}} \ left (\ psi _ {p_ {0}} ( {\ tfrac {n_ {0}} {2}}) + p_ {0} \ log 2+ \ log \ left | \ mathbf {V} _ {0} \ right | \ right) + {\ tfrac {1} {2}} \ operatorname {tr} \ left (\, \ mathbf {V} _ {1} ^ {- 1} n_ {0} \ mathbf {V} _ {0} \, \ right) \\ [8pt ] = - {\ tfrac {n_ {1}} {2}} \ log \ left | \, \ mathbf {V} _ {1} ^ {- 1} \ mathbf {V} _ {0} \, \ right | + {\ tfrac {p_ {1} +1} {2}} \ log \ left | \ mathbf {V} _ {0} \ right | + {\ tfrac {n_ {0}} {2}} \ имя оператора {tr} \ left (\, \ mathbf {V} _ {1} ^ {- 1} \ mathbf {V} _ {0} \ right) + \ log \ Gamma _ {p_ {1}} \ left ( {\ tfrac {n_ {1}} {2}} \ right) - {\ tfrac {n_ {1} -p_ {1} -1} {2}} \ psi _ {p_ {0}} ({\ tfrac {n_ {0}} {2}}) + {\ tfrac {n_ {1} (p_ {1} -p_ {0}) + p_ {0} (p_ {1} +1)} {2}} \ журнал 2 \ end {ali gned}}}

Обратите внимание, что когда $п 0 = п 1 {\ displaystyle p_ {0} = p_ {1}}$ $p_ {0} = p_ {1}$ и $n 0 = n 1 {\ displaystyle n_ {0} = n_ {1}}$ ${\ displaystyle n_ {0} = n_ {1}}$ восстанавливаем энтропию.

KL-дивергенция

Дивергенция Кульбака – Лейблера из $p 1 {\ displaystyle p_ {1}}$ $p_ {1}$ из $p 0 {\ displaystyle p_ {0}}$ $p_ {0}$ равно

DKL (p 0 ‖ p 1) = H (p 0, p 1) - H (p 0) = - n 1 2 журнал ⁡ | V 1 - 1 V 0 | + n 0 2 (tr ⁡ (V 1 - 1 V 0) - p) + log ⁡ Γ p (n 1 2) Γ p (n 0 2) + n 0 - n 1 2 ψ p (n 0 2) { \ Displaystyle {\ begin {align} D_ {KL} (p_ {0} \ | p_ {1}) = H (p_ {0}, p_ {1}) - H (p_ {0}) \\ [6pt ] = - {\ frac {n_ {1}} {2}} \ log | \ mathbf {V} _ {1} ^ {- 1} \ mathbf {V} _ {0} | + {\ frac {n_ {0}} {2}} (\ operatorname {tr} (\ mathbf {V} _ {1} ^ {- 1} \ mathbf {V} _ {0}) - p) + \ log {\ frac {\ Гамма _ {p} \ left ({\ frac {n_ {1}} {2}} \ right)} {\ Gamma _ {p} \ left ({\ frac {n_ {0}} {2}} \ right)}} + {\ tfrac {n_ {0} -n_ {1}} {2}} \ psi _ {p} \ left ({\ frac {n_ {0}} {2}} \ right) \ end { выровнено}}}

{\ displaystyle {\ begin {align} D_ {KL} (p_ {0} \ | p_ {1}) = H (p_ {0}, p_ {1}) - H (p_ {0}) \\ [6pt] = - {\ frac {n_ {1}} {2}} \ log | \ mathbf {V} _ {1} ^ {- 1} \ mathbf {V} _ {0} | + {\ frac {n_ {0}} {2}} (\ operatorname {tr} (\ mathbf {V} _ {1} ^ {- 1} \ mathbf {V} _ {0}) - p) + \ log {\ frac {\ Gamma _ {p} \ left ({\ frac {n_ {1}} {2}} \ right)} {\ Gamma _ {p} \ left ({\ frac {n_ {0}} { 2}} \ right)}} + {\ tfrac {n_ {0} -n_ {1}} {2}} \ psi _ {p} \ left ({\ frac {n_ {0}} {2}} \ справа) \ конец {выровнен}}}

Характеристическая функция

Характеристическая функция распределения Уишарта:

Θ ↦ | I - 2 i Θ V | - п / 2. {\ displaystyle \ Theta \ mapsto \ left | \, {\ mathbf {I}} -2i \, {\ mathbf {\ Theta}} \, {\ mathbf {V}} \, \ right | ^ {- n / 2}.}

{\ displaystyle \ Theta \ mapsto \ left | \, {\ mathbf {I}} -2i \, {\ mathbf {\ Theta} } \, {\ mathbf {V}} \, \ right | ^ {- n / 2}.}

Другими словами,

Θ ↦ E ⁡ [exp ⁡ (i tr ⁡ (X Θ))] = | I - 2 i Θ V | - п / 2 {\ displaystyle \ Theta \ mapsto \ operatorname {E} \ left [\, \ exp \ left (\, я \ OperatorName {tr} \ left (\, \ mathbf {X} {\ mathbf {\ Theta }} \, \ right) \, \ right) \, \ right] = \ left | \, {\ mathbf {I}} -2i \, {\ mathbf {\ Theta}} \, {\ mathbf {V} } \, \ right | ^ {- n / 2}}

{\ displaystyle \ Theta \ mapsto \ operatorname {E} \ left [\, \ exp \ left (\, i \ operatorname {tr} \ left (\, \ mathbf {X} {\ mathbf {\ Theta}} \, \ right) \, \ right) \, \ right] = \ left | \, {\ mathbf {I}} -2i \, {\ mathbf { \ Theta}} \, {\ mathbf {V}} \, \ right | ^ {- n / 2}}

где E [⋅] обозначает ожидание. (Здесь Θ и I - это матрицы того же размера, что и V(I- это единичная матрица ); и i - квадратный корень из -1).

Поскольку диапазон определителя содержит замкнутую линию, проходящую через начало координат для размеров матрицы больше двух, приведенная выше формула верна только для малых значений переменной Фурье. (см. arXiv : 1901.09347 )

Теорема

Если случайная матрица p × p X имеет распределение Уишарта с m степенями свободы и матрицей дисперсии V - запишите $X ∼ W p (V, m) {\ displaystyle \ mathbf {X} \ sim {\ mathcal {W}} _ {p} ({\ mathbf {V}}, m)}$ $\ mathbf {X} \ sim \ mathcal {W} _p ({\ mathbf V}, m)$ - и C представляет собой матрицу q × p ранга q, тогда

CXCT ∼ W q (CVCT, m). {\ displaystyle \ mathbf {C} \ mathbf {X} {\ mathbf {C}} ^ {T} \ sim {\ mathcal {W}} _ {q} \ left ({\ mathbf {C}} {\ mathbf {V} } {\ mathbf {C}} ^ {T}, m \ right).}

\ mathbf { C} \ mathbf {X} {\ mathbf C} ^ T \ sim \ mathcal {W} _q \ left ({\ mathbf C } {\ mathbf V} {\ mathbf C} ^ T, m \ right).

Следствие 1

Если z является ненулевым постоянным вектором p × 1, то:

Z TX Z ∼ σ Z 2 χ м 2. {\ Displaystyle {\ mathbf {z}} ^ {T} \ mathbf {X} {\ mathbf {z}} \ sim \ sigma _ {z} ^ {2 } \ chi _ {m} ^ {2}.}

{\ mathbf z} ^ T \ mathbf {X} {\ mathbf z} \ sim \ sigma_z ^ 2 \ chi_m ^ 2.

В этом случае $χ m 2 {\ displaystyle \ chi _ {m} ^ {2}}$ $\ chi_m ^ 2$ - это распределение хи-квадрат и $σ z 2 = z TV z {\ displaystyle \ sigma _ {z} ^ {2} = {\ mathbf {z}} ^ {T} {\ mathbf {V} } {\ mathbf {z}}}$ $\ sigma_z ^ 2 = {\ mathbf z} ^ T {\ mathbf V} {\ mathbf z}$ (обратите внимание, что $σ z 2 {\ displaystyle \ si gma _ {z} ^ {2}}$ $\ sigma_z ^ 2$ - постоянная; он положительный, потому что V положительно определен).

Следствие 2

Рассмотрим случай, когда z = (0,..., 0, 1, 0,..., 0) (то есть j-й элемент равен единице, а все остальные - нулю). Тогда следствие 1 выше показывает, что

wjj ∼ σ jj χ m 2 {\ displaystyle w_ {jj} \ sim \ sigma _ {jj} \ chi _ {m} ^ {2}}

w_ {jj} \ sim \ sigma_ {jj} \ chi ^ 2_m

дает маргинальное распределение каждый из элементов по диагонали матрицы.

Джордж Себер указывает, что распределение Уишарта не называется «многомерным распределением хи-квадрат», потому что предельное распределение недиагональных элементов не является хи-квадрат. Себер предпочитает зарезервировать термин многомерный для случая, когда все одномерные маргиналы принадлежат к одному семейству.

Оценщик многомерного нормального распределения

Распределение Уишарта - это выборочное распределение из оценки максимального правдоподобия (MLE) ковариационной матрицы многомерного нормального распределения . вывод MLE использует спектральную теорему.

разложение Бартлетта

разложение Бартлетта матрицы X из p-вариативное распределение Уишарта с масштабной матрицей V и n степенями свободы - это факторизация:

X = LAATLT, {\ displaystyle \ mathbf {X} = {\ textbf {L}} {\ textbf {A}} {\ textbf {A}} ^ {T} {\ textbf {L}} ^ {T},}

\ mathbf {X} = {\ textbf L} {\ textbf A} {\ textbf A} ^ T {\ textbf L} ^ T,

где L - фактор Холецкого V и:

A = (c 1 0 0 ⋯ 0 n 21 c 2 0 ⋯ 0 n 31 n 32 c 3 ⋯ 0 ⋮ ⋮ ⋮ ⋱ ⋮ np 1 np 2 np 3 ⋯ cp) {\ displaystyle \ mathbf {A} = {\ begin {pmatrix} c_ {1} 0 0 \ cdots 0 \\ n_ {21} c_ {2} 0 \ cdots 0 \\ n_ {31} n_ {32} c_ { 3} \ cdots 0 \\\ vdots \ vdots \ vdots \ ddots \ vdots \\ n_ {p1} n_ {p2} n_ {p3} \ cdots c_ {p} \ end {pmatrix}}}

\ mathbf A = \ begin {pmatrix} c_1 0 0 \ cdots 0 \\ n_ {21} c_2 0 \ cdots 0 \\ n_ {31} n_ {32} c_3 \ cdots 0 \\ \ vdots \ vdots \ vdots \ ddots \ vdots \\ n_ {p1} n_ {p2} n_ {p3} \ cdots c_p \ end {pmatrix}

где $ci 2 ∼ χ n - i + 1 2 {\ displaystyle c_ {i} ^ {2} \ sim \ chi _ {n-i + 1} ^ {2}}$ $c_i ^ 2 \ sim \ chi ^ 2_ {n-i + 1}$ и n ij ~ N (0, 1) независимо. Это обеспечивает полезный метод получения случайных выборок из распределения Уишарта.

Предельное распределение матричных элементов

Пусть V будет матрицей дисперсии 2 × 2, характеризующейся коэффициент корреляции −1 < ρ < 1 and L его нижний коэффициент Холецкого:

V = (σ 1 2 ρ σ 1 σ 2 ρ σ 1 σ 2 σ 2 2), L = (σ 1 0 ρ σ 2 1 - ρ 2 σ 2) {\ Displaystyle \ mathbf {V} = {\ begin {pmatrix} \ sigma _ {1} ^ {2} \ rho \ sigma _ {1} \ sigma _ {2} \\\ rho \ sigma _ {1} \ sigma _ {2} \ sigma _ {2} ^ {2} \ end {pmatrix}}, \ qquad \ mathbf {L} = {\ begin {pmatrix} \ sigma _ {1} 0 \\\ rho \ sigma _ {2} {\ sqrt {1- \ rho ^ {2}}} \ sigma _ {2} \ end {pmatrix}}}

\ mathbf {V} = \ begin {pmatrix} \ sigma_1 ^ 2 \ rho \ sigma_1 \ sigma_2 \\ \ rho \ sigma_1 \ sigma_2 \ sigma_2 ^ 2 \ end {pmatrix}, \ qquad \ mathbf {L} = \ begin {pmatrix} \ sigma_1 0 \\ \ rho \ sigma_2 \ sqrt {1- \ rho ^ 2} \ sigma_2 \ end {pmatrix}

Умножение через Бартлетт выше, мы находим, что случайная выборка из распределения Уишарта 2 × 2 имеет вид

X = (σ 1 2 c 1 2 σ 1 σ 2 (ρ c 1 2 + 1 - ρ 2 c 1 n 21) σ 1 σ 2 (ρ c 1 2 + 1 - ρ 2 c 1 n 21) σ 2 2 ((1 - ρ 2) c 2 2 + (1 - ρ 2 n 21 + ρ c 1) 2)) {\ Displaystyle \ mathbf {X} = {\ begin {pmatrix} \ sigma _ {1} ^ {2} c_ {1} ^ {2} \ sigma _ {1} \ sigma _ {2 } \ left (\ rho c_ {1} ^ {2} + {\ sqrt {1- \ rho ^ {2}}} c_ {1} n_ {21} \ right) \\\ sigma _ {1} \ sigma _ {2} \ left (\ rho c_ {1} ^ {2} + {\ sqrt {1- \ rho ^ {2}}} c_ {1} n_ {21} \ right) \ sigma _ {2} ^ {2} \ left (\ left (1- \ rho ^ {2} \ right) c_ {2} ^ {2} + \ left ({\ sqrt {1- \ rho ^ {2}}} n_ {21 } + \ rho c_ {1} \ right) ^ {2} \ right) \ end {pmatrix}}}

\ mathbf {X} = \ begin {pmatrix} \ sigma_1 ^ 2 c_1 ^ 2 \ sigma_1 \ sigma_2 \ left (\ rho c_1 ^ 2 + \ sqrt {1- \ rho ^ 2} c_1 n_ {21} \ right) \\ \ sigma_1 \ sigma_2 \ left (\ rho c_1 ^ 2 + \ sqrt {1 - \ rho ^ 2} c_1 n_ {21} \ right) \ sigma_2 ^ 2 \ left (\ left (1- \ rho ^ 2 \ right) c_2 ^ 2 + \ left (\ sqrt {1- \ rho ^ 2 } n_ {21} + \ rho c_1 \ right) ^ 2 \ right) \ end {pmatrix}

Диагональные элементы, наиболее очевидно в первом элементе, следуют распределению χ с n степенями свободы (масштабированные на σ), как и ожидалось. Недиагональный элемент менее известен, но может быть идентифицирован как нормальная смесь средних значений дисперсии, где плотность смешения является распределением χ. Соответствующая предельная плотность вероятности для недиагонального элемента, следовательно, является гамма-распределением дисперсии

f (x 12) = | х 12 | n - 1 2 Γ (n 2) 2 n - 1 π (1 - ρ 2) (σ 1 σ 2) n + 1 ⋅ K n - 1 2 (| x 12 | σ 1 σ 2 (1 - ρ 2)) ехр ⁡ (ρ Икс 12 σ 1 σ 2 (1 - ρ 2)) {\ Displaystyle F (X_ {12}) = {\ frac {\ left | x_ {12} \ right | ^ {\ frac {n- 1} {2}}} {\ Gamma \ left ({\ frac {n} {2}} \ right) {\ sqrt {2 ^ {n-1} \ pi \ left (1- \ rho ^ {2} \ right) \ left (\ sigma _ {1} \ sigma _ {2} \ right) ^ {n + 1}}}}} \ cdot K _ {\ frac {n-1} {2}} \ left ({ \ frac {\ left | x_ {12} \ right |} {\ sigma _ {1} \ sigma _ {2} \ left (1- \ rho ^ {2} \ right)}} \ right) \ exp {\ left ({\ frac {\ rho x_ {12}} {\ sigma _ {1} \ sigma _ {2} (1- \ rho ^ {2})}} \ right)}}

f (x_ {12}) = \ frac {\ left | x_ {12} \ right | ^ {\ frac {n-1} {2}}} {\ Gamma \ left (\ frac {n} {2} \ right) \ sqrt {2 ^ {n-1} \ pi \ left (1- \ rho ^ 2 \ right) \ left (\ sigma_1 \ sigma_2 \ right) ^ {n + 1}}} \ cdot K _ {\ frac {n-1} {2}} \ left (\ frac {\ left | x_ {12} \ right |} {\ sigma_1 \ sigma_2 \ left (1- \ rho ^ 2 \ right)} \ right) \ exp {\ left (\ frac {\ rho x_ {12}} { \ sigma_1 \ sigma_2 (1- \ rho ^ 2)} \ right)}

где K ν (z) - модифицированная функция Бесселя второго рода. Подобные результаты могут быть получены для более высоких измерений, но взаимозависимость недиагональных корреляций становится все более сложной. Также возможно записать функцию , генерирующую момент, даже в нецентральном случае (по существу, n-я степень уравнения Крейга (1936) 10), хотя плотность вероятности становится бесконечной суммой функций Бесселя.

Диапазон параметра формы

Можно показать, что распределение Уишарта можно определить тогда и только тогда, когда параметр формы n принадлежит набору

Λ p: = {0,…, p - 1} ∪ (p - 1, ∞). {\ displaystyle \ Lambda _ {p}: = \ {0, \ ldots, p-1 \} \ cup \ left (p-1, \ infty \ right).}

{\ displaystyle \ Lambda _ {p}: = \ {0, \ ldots, p-1 \} \ cup \ left (p-1, \ infty \ right).}

Этот набор назван в честь Гиндикина, который ввел его в семидесятые годы в контексте гамма-распределений на однородных конусах. Однако для новых параметров в дискретном спектре ансамбля Гиндикина, а именно,

Λ p ∗: = {0,…, p - 1}, {\ displaystyle \ Lambda _ {p} ^ {*}: = \ {0, \ ldots, p-1 \},}

{\ displaystyle \ Lambda _ {p} ^ {*}: = \ {0, \ ldots, p-1 \},}

соответствующее распределение Уишарта не имеет плотности Лебега.

Связь с другими распределениями

Распределение Уишарта связано с обратным распределением Уишарта, обозначенным $W p - 1 {\ displaystyle W_ {p} ^ {- 1}}$ $W_p ^ {- 1}$ , следующим образом: Если X ~ W p(V, n) и если мы сделаем замену переменных C= X, то $C ∼ W p - 1 (V - 1, n) {\ displaystyle \ mathbf {C} \ sim W_ {p} ^ {- 1} (\ mathbf {V} ^ {- 1}, n)}$ $\ mathbf {C} \ sim W_p ^ {- 1} (\ mathbf {V} ^ {- 1}, n)$ . Это соотношение можно вывести, отметив, что абсолютное значение определителя Якоби этой замены переменных равно | C |, см., Например, уравнение (15.15) в.
В байесовской статистике распределение Уишарта является сопряженным априорным для параметра точности многомерного нормального распределения, когда среднее параметр известен.
Обобщение - это многомерное гамма-распределение.
Другой тип обобщения - это нормальное распределение Уишарта, по существу, продукт многомерного нормальное распределение с распределением Уишарта.

См. также

Ссылки

Внешние ссылки

Библиотека C ++ очень редко для генератора случайных матриц