Матрица рассеяния

редактировать
Для получения информации о квантовой механике см. рассеяние матрица.

В многомерной статистике и теории вероятностей матрица разброса - это статистика, которая используется для оценок ковариационной матрицы , например, многомерного нормального распределения.

Определение

Дано n выборок m-мерных данных, представленных как t матрица размером m на n, X = [x 1, x 2,…, xn] {\ displaystyle X = [\ mathbf {x} _ {1}, \ mathbf {x} _ {2}, \ ldots, \ mathbf {x} _ {n}]}X = [{\ mathbf {x} } _ {1}, {\ mathbf {x}} _ {2}, \ ldots, {\ mathbf {x}} _ {n}] , выборочное среднее равно

x ¯ = 1 n ∑ j = 1 nxj {\ displaystyle {\ overline {\ mathbf {x}}} = {\ frac {1} {n}} \ sum _ {j = 1} ^ {n} \ mathbf {x} _ {j}}\ overline {{\ mathbf {x}}} = {\ frac {1} {n}} \ sum _ {{j = 1}} ^ {n} { \ mathbf {x}} _ {j}

где xj { \ displaystyle \ mathbf {x} _ {j}}\ mathbf {x} _ {j} - это j-й столбец X {\ displaystyle X}X .

матрица разброса - это m- by-m положительная полуопределенная матрица

S = ∑ j = 1 n (xj - x ¯) (xj - x ¯) T = ∑ j = 1 n (xj - x ¯) ⊗ (xj - x ¯) знак равно (∑ j = 1 nxjxj T) - nx ¯ x ¯ T {\ displaystyle S = \ sum _ {j = 1} ^ {n} (\ mathbf {x} _ {j} - { \ overline {\ mathbf {x}}}) (\ mathbf {x} _ {j} - {\ overline {\ mathbf {x}}}) ^ {T} = \ sum _ {j = 1} ^ {n } (\ mathbf {x} _ {j} - {\ overline {\ mathbf {x}}}) \ otimes (\ mathbf {x} _ {j} - {\ overline {\ mathbf {x}}}) = \ left (\ sum _ {j = 1} ^ {n} \ mathbf {x} _ {j} \ mathbf {x} _ {j} ^ {T} \ right) -n {\ overline {\ mathbf {x }}} {\ overline {\ mathbf {x}}} ^ {T}}S = \ sum_ {j = 1} ^ n (\ mathbf {x} _j- \ overline {\ mathbf {x}}) (\ mathbf {x} _j- \ overline {\ mathbf {x}}) ^ T = \ sum_ {j = 1} ^ n (\ mathbf {x} _j- \ overline {\ mathbf {x}}) \ otimes (\ mathbf {x} _j- \ overline {\ mathbf {x}}) = \ left (\ sum_ {j = 1} ^ n \ mathbf {x} _j \ mathbf {x} _j ^ T \ right) - n \ overline {\ mathbf {x}} \ overline {\ mathbf {x}} ^ T

где T {\ displaystyle T}T обозначает транспонирование матрицы, а умножение относится к внешнему произведению. Матрица рассеяния может быть выражена более кратко как

S = XC n XT {\ displaystyle S = X \, C_ {n} \, X ^ {T}}S = X \, C_ {n} \, X ^ {T}

где C n {\ displaystyle \, C_ {n}}\, C_ { n} - это центрирующая матрица n x n .

Application

Оценка максимального правдоподобия для данных n выборок для ковариационная матрица многомерного нормального распределения может быть выражена как нормализованная матрица рассеяния

CML = 1 n S. {\ displaystyle C_ {ML} = {\ frac {1} {n}} S.}C _ {{ML}} = {\ frac {1} {n}} S.

Когда столбцы X {\ displaystyle X}X независимо выбираются из многомерной нормали распределения, тогда S {\ displaystyle S}S имеет распределение Уишарта.

См. также

.

Последняя правка сделана 2021-06-07 04:46:05
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте