Матричное нормальное распределение

редактировать
Матрица нормальная
Обозначение M N п , п ( M , U , V ) {\ displaystyle {\ mathcal {MN}} _ {n, p} (\ mathbf {M}, \ mathbf {U}, \ mathbf {V})}
Параметры

M {\ displaystyle \ mathbf {M}} расположение ( действительная матрица ) масштаб ( положительно-определенная действительная матрица ) п × п {\ Displaystyle п \ раз р} U {\ displaystyle \ mathbf {U}} п × п {\ Displaystyle п \ раз п}

V {\ displaystyle \ mathbf {V}} масштаб ( положительно-определенная вещественная матрица ) п × п {\ displaystyle p \ times p}
Служба поддержки Икс р п × п {\ Displaystyle \ mathbf {X} \ in \ mathbb {R} ^ {п \ раз p}}
PDF exp ( - 1 2 т р [ V - 1 ( Икс - M ) Т U - 1 ( Икс - M ) ] ) ( 2 π ) п п / 2 | V | п / 2 | U | п / 2 {\ displaystyle {\ frac {\ exp \ left (- {\ frac {1} {2}} \, \ mathrm {tr} \ left [\ mathbf {V} ^ {- 1} (\ mathbf {X} - \ mathbf {M}) ^ {T} \ mathbf {U} ^ {- 1} (\ mathbf {X} - \ mathbf {M}) \ right] \ right)} {(2 \ pi) ^ {np / 2} | \ mathbf {V} | ^ {n / 2} | \ mathbf {U} | ^ {p / 2}}}}
Иметь в виду M {\ displaystyle \ mathbf {M}}
Дисперсия U {\ displaystyle \ mathbf {U}} (среди строк) и (среди столбцов) V {\ displaystyle \ mathbf {V}}

В статистике, то матрица нормального распределения или матрица распределения Gaussian является распределение вероятностей, что представляет собой обобщение многомерного нормального распределения для матричных случайных величин.

СОДЕРЖАНИЕ

  • 1 Определение
    • 1.1 Доказательство
  • 2 свойства
    • 2.1 Ожидаемые значения
    • 2.2 Преобразование
  • 3 Пример
  • 4 Оценка параметра максимального правдоподобия
  • 5 Получение значений из распределения
  • 6 Отношение к другим дистрибутивам
  • 7 См. Также
  • 8 ссылки

Определение

Функция плотности вероятности для случайной матрицы X ( n  ×  p ), которая следует нормальному распределению матрицы, имеет вид: M N п , п ( M , U , V ) {\ displaystyle {\ mathcal {MN}} _ {n, p} (\ mathbf {M}, \ mathbf {U}, \ mathbf {V})}

п ( Икс M , U , V ) знак равно exp ( - 1 2 т р [ V - 1 ( Икс - M ) Т U - 1 ( Икс - M ) ] ) ( 2 π ) п п / 2 | V | п / 2 | U | п / 2 {\ displaystyle p (\ mathbf {X} \ mid \ mathbf {M}, \ mathbf {U}, \ mathbf {V}) = {\ frac {\ exp \ left (- {\ frac {1} {2}) } \, \ mathrm {tr} \ left [\ mathbf {V} ^ {- 1} (\ mathbf {X} - \ mathbf {M}) ^ {T} \ mathbf {U} ^ {- 1} (\ mathbf {X} - \ mathbf {M}) \ right] \ right)} {(2 \ pi) ^ {np / 2} | \ mathbf {V} | ^ {n / 2} | \ mathbf {U} | ^ {p / 2}}}}

где обозначает след, а M - n  ×  p, U - n  ×  n, а V - p  ×  p. т р {\ displaystyle \ mathrm {tr}}

Нормаль матрицы связана с многомерным нормальным распределением следующим образом:

Икс M N п × п ( M , U , V ) , {\ displaystyle \ mathbf {X} \ sim {\ mathcal {MN}} _ {n \ times p} (\ mathbf {M}, \ mathbf {U}, \ mathbf {V}),}

если и только если

v е c ( Икс ) N п п ( v е c ( M ) , V U ) {\ displaystyle \ mathrm {vec} (\ mathbf {X}) \ sim {\ mathcal {N}} _ {np} (\ mathrm {vec} (\ mathbf {M}), \ mathbf {V} \ otimes \ mathbf {U})}

где обозначает произведение Кронекера и обозначает векторизации из. {\ displaystyle \ otimes} v е c ( M ) {\ Displaystyle \ mathrm {vec} (\ mathbf {M})} M {\ displaystyle \ mathbf {M}}

Доказательство

Эквивалентность между вышеуказанными матричными нормальными и многомерными нормальными функциями плотности может быть показана с использованием следующих свойств следа и произведения Кронекера. Начнем с аргумента экспоненты нормальной матрицы PDF:

- 1 2 tr [ V - 1 ( Икс - M ) Т U - 1 ( Икс - M ) ] знак равно - 1 2 vec ( Икс - M ) Т vec ( U - 1 ( Икс - M ) V - 1 ) знак равно - 1 2 vec ( Икс - M ) Т ( V - 1 U - 1 ) vec ( Икс - M ) знак равно - 1 2 [ vec ( Икс ) - vec ( M ) ] Т ( V U ) - 1 [ vec ( Икс ) - vec ( M ) ] {\ displaystyle {\ begin {align} amp; \; \; \; \; - {\ frac {1} {2}} {\ text {tr}} \ left [\ mathbf {V} ^ {- 1} ( \ mathbf {X} - \ mathbf {M}) ^ {T} \ mathbf {U} ^ {- 1} (\ mathbf {X} - \ mathbf {M}) \ right] \\ amp; = - {\ frac {1} {2}} {\ text {vec}} \ left (\ mathbf {X} - \ mathbf {M} \ right) ^ {T} {\ text {vec}} \ left (\ mathbf {U} ^ {- 1} (\ mathbf {X} - \ mathbf {M}) \ mathbf {V} ^ {- 1} \ right) \\ amp; = - {\ frac {1} {2}} {\ text { vec}} \ left (\ mathbf {X} - \ mathbf {M} \ right) ^ {T} \ left (\ mathbf {V} ^ {- 1} \ otimes \ mathbf {U} ^ {- 1} \ right) {\ text {vec}} \ left (\ mathbf {X} - \ mathbf {M} \ right) \\ amp; = - {\ frac {1} {2}} \ left [{\ text {vec} } (\ mathbf {X}) - {\ text {vec}} (\ mathbf {M}) \ right] ^ {T} \ left (\ mathbf {V} \ otimes \ mathbf {U} \ right) ^ { -1} \ left [{\ text {vec}} (\ mathbf {X}) - {\ text {vec}} (\ mathbf {M}) \ right] \ end {выровнено}}}

который является аргументом экспоненты многомерной нормальной PDF. Доказательство завершается использованием детерминантного свойства: | V U | знак равно | V | п | U | п . {\ displaystyle | \ mathbf {V} \ otimes \ mathbf {U} | = | \ mathbf {V} | ^ {n} | \ mathbf {U} | ^ {p}.}

Характеристики

Если, то у нас есть следующие свойства: Икс M N п × п ( M , U , V ) {\ Displaystyle \ mathbf {X} \ sim {\ mathcal {MN}} _ {п \ раз p} (\ mathbf {M}, \ mathbf {U}, \ mathbf {V})}

Ожидаемые значения

Среднее или ожидаемое значение :

E [ Икс ] знак равно M {\ Displaystyle E [\ mathbf {X}] = \ mathbf {M}}

и у нас есть следующие ожидания второго порядка:

E [ ( Икс - M ) ( Икс - M ) Т ] знак равно U tr ( V ) {\ Displaystyle E [(\ mathbf {X} - \ mathbf {M}) (\ mathbf {X} - \ mathbf {M}) ^ {T}] = \ mathbf {U} \ OperatorName {tr} (\ mathbf {V})}
E [ ( Икс - M ) Т ( Икс - M ) ] знак равно V tr ( U ) {\ Displaystyle E [(\ mathbf {X} - \ mathbf {M}) ^ {T} (\ mathbf {X} - \ mathbf {M})] = \ mathbf {V} \ OperatorName {tr} (\ mathbf {U})}

где обозначает след. tr {\ displaystyle \ operatorname {tr}}

В более общем смысле, для матриц A, B, C подходящего размера:

E [ Икс А Икс Т ] знак равно U tr ( А Т V ) + M А M Т E [ Икс Т B Икс ] знак равно V tr ( U B Т ) + M Т B M E [ Икс C Икс ] знак равно V C Т U + M C M {\ displaystyle {\ begin {align} E [\ mathbf {X} \ mathbf {A} \ mathbf {X} ^ {T}] amp; = \ mathbf {U} \ operatorname {tr} (\ mathbf {A} ^ {T} \ mathbf {V}) + \ mathbf {MAM} ^ {T} \\ E [\ mathbf {X} ^ {T} \ mathbf {B} \ mathbf {X}] amp; = \ mathbf {V} \ operatorname {tr} (\ mathbf {U} \ mathbf {B} ^ {T}) + \ mathbf {M} ^ {T} \ mathbf {BM} \\ E [\ mathbf {X} \ mathbf {C} \ mathbf {X}] amp; = \ mathbf {V} \ mathbf {C} ^ {T} \ mathbf {U} + \ mathbf {MCM} \ end {align}}}

Трансформация

Транспонировать преобразование:

Икс Т M N п × п ( M Т , V , U ) {\ Displaystyle \ mathbf {X} ^ {T} \ sim {\ mathcal {MN}} _ {p \ times n} (\ mathbf {M} ^ {T}, \ mathbf {V}, \ mathbf {U})}

Линейное преобразование: пусть D ( r -by- n ) имеет полный ранг r ≤ n и C ( p -by- s ) имеет полный ранг s ≤ p, тогда:

D Икс C M N р × s ( D M C , D U D Т , C Т V C ) {\ displaystyle \ mathbf {DXC} \ sim {\ mathcal {MN}} _ {r \ times s} (\ mathbf {DMC}, \ mathbf {DUD} ^ {T}, \ mathbf {C} ^ {T} \ mathbf {VC})}

Пример

Представим себе выборку из n независимых p -мерных случайных величин, одинаково распределенных согласно многомерному нормальному распределению :

Y я N п ( μ , Σ )  с участием  я { 1 , , п } {\ displaystyle \ mathbf {Y} _ {i} \ sim {\ mathcal {N}} _ {p} ({\ boldsymbol {\ mu}}, {\ boldsymbol {\ Sigma}}) {\ text {with} } i \ in \ {1, \ ldots, n \}}.

При определении матрицы размера n  ×  p, для которой находится i- я строка, получаем: Икс {\ displaystyle \ mathbf {X}} Y я {\ Displaystyle \ mathbf {Y} _ {я}}

Икс M N п × п ( M , U , V ) {\ Displaystyle \ mathbf {X} \ sim {\ mathcal {MN}} _ {п \ раз p} (\ mathbf {M}, \ mathbf {U}, \ mathbf {V})}

где каждая строка равна, то есть, это п  ×  п единичная матрица, то есть строки являются независимыми, и. M {\ displaystyle \ mathbf {M}} μ {\ displaystyle {\ boldsymbol {\ mu}}} M знак равно 1 п × μ Т {\ displaystyle \ mathbf {M} = \ mathbf {1} _ {n} \ times {\ boldsymbol {\ mu}} ^ {T}} U {\ displaystyle \ mathbf {U}} V знак равно Σ {\ Displaystyle \ mathbf {V} = {\ boldsymbol {\ Sigma}}}

Оценка параметра максимального правдоподобия

Для обозначенных k матриц, каждая размером n  ×  p, которые, как мы предполагаем, были выбраны iid из нормального распределения матриц, оценка максимального правдоподобия параметров может быть получена путем максимизации: Икс 1 , Икс 2 , , Икс k {\ Displaystyle \ mathbf {X} _ {1}, \ mathbf {X} _ {2}, \ ldots, \ mathbf {X} _ {k}}

я знак равно 1 k M N п × п ( Икс я M , U , V ) . {\ displaystyle \ prod _ {i = 1} ^ {k} {\ mathcal {MN}} _ {n \ times p} (\ mathbf {X} _ {i} \ mid \ mathbf {M}, \ mathbf { U}, \ mathbf {V}).}

Решение для среднего имеет замкнутый вид, а именно

M знак равно 1 k я знак равно 1 k Икс я {\ displaystyle \ mathbf {M} = {\ frac {1} {k}} \ sum _ {i = 1} ^ {k} \ mathbf {X} _ {i}}

но параметры ковариации - нет. Однако эти параметры можно итеративно максимизировать путем обнуления их градиентов на:

U знак равно 1 k п я знак равно 1 k ( Икс я - M ) V - 1 ( Икс я - M ) Т {\ displaystyle \ mathbf {U} = {\ frac {1} {kp}} \ sum _ {i = 1} ^ {k} (\ mathbf {X} _ {i} - \ mathbf {M}) \ mathbf {V} ^ {- 1} (\ mathbf {X} _ {i} - \ mathbf {M}) ^ {T}}

а также

V знак равно 1 k п я знак равно 1 k ( Икс я - M ) Т U - 1 ( Икс я - M ) , {\ displaystyle \ mathbf {V} = {\ frac {1} {kn}} \ sum _ {i = 1} ^ {k} (\ mathbf {X} _ {i} - \ mathbf {M}) ^ { T} \ mathbf {U} ^ {- 1} (\ mathbf {X} _ {i} - \ mathbf {M}),}

См., Например, и ссылки в нем. Параметры ковариации не идентифицируются в том смысле, что для любого масштабного коэффициента sgt; 0 мы имеем:

M N п × п ( Икс M , U , V ) знак равно M N п × п ( Икс M , s U , 1 s V ) . {\ displaystyle {\ mathcal {MN}} _ {n \ times p} (\ mathbf {X} \ mid \ mathbf {M}, \ mathbf {U}, \ mathbf {V}) = {\ mathcal {MN} } _ {n \ times p} (\ mathbf {X} \ mid \ mathbf {M}, s \ mathbf {U}, {\ tfrac {1} {s}} \ mathbf {V}).}

Получение значений из распределения

Выборка из матричного нормального распределения является частным случаем процедуры выборки для многомерного нормального распределения. Пусть будет n x p- матрицей np независимых выборок из стандартного нормального распределения, так что Икс {\ displaystyle \ mathbf {X}}

Икс M N п × п ( 0 , я , я ) . {\ displaystyle \ mathbf {X} \ sim {\ mathcal {MN}} _ {n \ times p} (\ mathbf {0}, \ mathbf {I}, \ mathbf {I}).}

Тогда пусть

Y знак равно M + А Икс B , {\ Displaystyle \ mathbf {Y} = \ mathbf {M} + \ mathbf {A} \ mathbf {X} \ mathbf {B},}

чтобы

Y M N п × п ( M , А А Т , B Т B ) , {\ displaystyle \ mathbf {Y} \ sim {\ mathcal {MN}} _ {n \ times p} (\ mathbf {M}, \ mathbf {AA} ^ {T}, \ mathbf {B} ^ {T} \ mathbf {B}),}

где A и B могут быть выбраны разложением Холецкого или аналогичной операцией извлечения квадратного корня из матрицы.

Отношение к другим дистрибутивам

Давид (1981) предоставляет обсуждение связи матричного нормального распределения с другими распределениями, включая распределение Уишарта, обратное распределение Уишарта и матричное t-распределение, но использует другие обозначения, чем используемые здесь.

Смотрите также

Рекомендации

Последняя правка сделана 2024-01-01 11:51:43
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте