Матрица рассеяния

редактировать

Для получения информации о квантовой механике см. рассеяние матрица.

В многомерной статистике и теории вероятностей матрица разброса - это статистика, которая используется для оценок ковариационной матрицы , например, многомерного нормального распределения.

Определение

Дано n выборок m-мерных данных, представленных как t матрица размером m на n, $X = [x 1, x 2,…, xn] {\ displaystyle X = [\ mathbf {x} _ {1}, \ mathbf {x} _ {2}, \ ldots, \ mathbf {x} _ {n}]}$ $X = [{\ mathbf {x} } _ {1}, {\ mathbf {x}} _ {2}, \ ldots, {\ mathbf {x}} _ {n}]$ , выборочное среднее равно

x ¯ = 1 n ∑ j = 1 nxj {\ displaystyle {\ overline {\ mathbf {x}}} = {\ frac {1} {n}} \ sum _ {j = 1} ^ {n} \ mathbf {x} _ {j}}

\ overline {{\ mathbf {x}}} = {\ frac {1} {n}} \ sum _ {{j = 1}} ^ {n} { \ mathbf {x}} _ {j}

где $xj { \ displaystyle \ mathbf {x} _ {j}}$ $\ mathbf {x} _ {j}$ - это j-й столбец $X {\ displaystyle X}$ $X$ .

матрица разброса - это m- by-m положительная полуопределенная матрица

S = ∑ j = 1 n (xj - x ¯) (xj - x ¯) T = ∑ j = 1 n (xj - x ¯) ⊗ (xj - x ¯) знак равно (∑ j = 1 nxjxj T) - nx ¯ x ¯ T {\ displaystyle S = \ sum _ {j = 1} ^ {n} (\ mathbf {x} _ {j} - { \ overline {\ mathbf {x}}}) (\ mathbf {x} _ {j} - {\ overline {\ mathbf {x}}}) ^ {T} = \ sum _ {j = 1} ^ {n } (\ mathbf {x} _ {j} - {\ overline {\ mathbf {x}}}) \ otimes (\ mathbf {x} _ {j} - {\ overline {\ mathbf {x}}}) = \ left (\ sum _ {j = 1} ^ {n} \ mathbf {x} _ {j} \ mathbf {x} _ {j} ^ {T} \ right) -n {\ overline {\ mathbf {x }}} {\ overline {\ mathbf {x}}} ^ {T}}

S = \ sum_ {j = 1} ^ n (\ mathbf {x} _j- \ overline {\ mathbf {x}}) (\ mathbf {x} _j- \ overline {\ mathbf {x}}) ^ T = \ sum_ {j = 1} ^ n (\ mathbf {x} _j- \ overline {\ mathbf {x}}) \ otimes (\ mathbf {x} _j- \ overline {\ mathbf {x}}) = \ left (\ sum_ {j = 1} ^ n \ mathbf {x} _j \ mathbf {x} _j ^ T \ right) - n \ overline {\ mathbf {x}} \ overline {\ mathbf {x}} ^ T

где $T {\ displaystyle T}$ $T$ обозначает транспонирование матрицы, а умножение относится к внешнему произведению. Матрица рассеяния может быть выражена более кратко как

S = XC n XT {\ displaystyle S = X \, C_ {n} \, X ^ {T}}

S = X \, C_ {n} \, X ^ {T}

где $C n {\ displaystyle \, C_ {n}}$ $\, C_ { n}$ - это центрирующая матрица n x n .

Application

Оценка максимального правдоподобия для данных n выборок для ковариационная матрица многомерного нормального распределения может быть выражена как нормализованная матрица рассеяния

CML = 1 n S. {\ displaystyle C_ {ML} = {\ frac {1} {n}} S.}

C _ {{ML}} = {\ frac {1} {n}} S.

Когда столбцы $X {\ displaystyle X}$ $X$ независимо выбираются из многомерной нормали распределения, тогда $S {\ displaystyle S}$ $S$ имеет распределение Уишарта.

См. также

Оценка ковариационных матриц
Примерная ковариационная матрица
Распределение Уишарта
Внешний продукт - $XX ⊤ {\ displaystyle XX ^ {\ top}}$ $XX ^ {\ top}$ или X⊗X - внешнее произведение X с самим собой.
Матрица грамма