фон Мизес – Фишер распределение - von Mises–Fisher distribution

редактировать

В направленной статистике распределение фон Мизеса – Фишера (названо в честь Рональда Фишера и Ричард фон Мизес ), является распределением вероятностей на (p - 1) {\ displaystyle (p-1)}(p-1) -сфере в R p {\ displaystyle \ mathbb {R} ^ {p}}\ mathbb {R} ^ {p} . Если p = 2 {\ displaystyle p = 2}p=2, распределение сводится к распределению фон Мизеса на круге .

плотность вероятности функция распределения фон Мизеса – Фишера для случайного p-мерного единичного вектора x {\ displaystyle \ mathbf {x} \,}\ mathbf {x} \, определяется как:

fp (x; μ, κ) знак равно С п (κ) ехр ⁡ (κ μ T x), {\ displaystyle f_ {p} (\ mathbf {x}; {\ boldsymbol {\ mu}}, \ kappa) = C_ {p} (\ kappa) \ exp \ left ({\ kappa {\ boldsymbol {\ mu}} ^ {T} \ mathbf {x}} \ right),}{\ displaystyle f_ {p} (\ mathbf {x}; {\ boldsymbol {\ mu}}, \ kappa) = C_ {p} (\ kappa) \ exp \ left ({\ kappa { \ boldsymbol {\ mu}} ^ {T} \ mathbf {x}} \ right),}

где κ ≥ 0, ‖ μ ‖ = 1 {\ displaystyle \ kappa \ geq 0, \ left \ Vert {\ boldsymbol {\ mu}} \ right \ Vert = 1 \,}{\ displaystyle \ kappa \ geq 0, \ left \ Vert {\ boldsymbol {\ mu}} \ right \ Vert = 1 \,} и константа нормализации C p (κ) { \ Displaystyle C_ {p} (\ kappa) \,}C_ {p} (\ каппа) \, равно

C p (κ) = κ p / 2 - 1 (2 π) p / 2 I p / 2 - 1 (κ), {\ Displaystyle C_ {p} (\ kappa) = {\ frac {\ kappa ^ {p / 2-1}} {(2 \ pi) ^ {p / 2} I_ {p / 2-1 } (\ kappa)}},}{\ displaystyle C_ {p} (\ kappa) = {\ frac {\ kappa ^ { p / 2-1}} {(2 \ pi) ^ {p / 2} I_ {p / 2-1} (\ kappa)}},}

где I v {\ displaystyle I_ {v}}I_{v}обозначает модифицированную функцию Бесселя первого рода d в порядке v {\ displaystyle v}v . Если p = 3 {\ displaystyle p = 3}p = 3 , константа нормализации уменьшается до

C 3 (κ) = κ 4 π sinh ⁡ κ = κ 2 π (e κ - e - κ). {\ displaystyle C_ {3} (\ kappa) = {\ frac {\ kappa} {4 \ pi \ sinh \ kappa}} = {\ frac {\ kappa} {2 \ pi (e ^ {\ kappa} -e ^ {- \ kappa})}}.}{\ displaystyle C_ {3} (\ kappa) = {\ frac {\ kappa} {4 \ pi \ sinh \ kappa}} = {\ frac {\ kappa} {2 \ pi (e ^ {\ kappa} -e ^ {- \ kappa})}}.}

Параметры μ {\ displaystyle \ mu \,}\ mu \, и κ {\ displaystyle \ kappa \,}\ kappa \, называются средним направлением и параметром концентрации соответственно. Чем больше значение κ {\ displaystyle \ kappa \,}\ kappa \, , тем выше концентрация распределения вокруг среднего направления μ {\ displaystyle \ mu \,}\ mu \, . Распределение унимодальное для κ>0 {\ displaystyle \ kappa>0 \,}\kappa>0 \, и единообразно на сфере для κ = 0 {\ displaystyle \ kappa = 0 \, }\ kappa = 0 \, .

Распределение фон Мизеса – Фишера для p = 3 {\ displaystyle p = 3}p = 3 , также называемое распределением Фишера, впервые было использовано для моделирования взаимодействия электрических диполей. в электрическом поле (Mardia Jupp, 1999). Другие приложения можно найти в геологии, биоинформатике и интеллектуальном анализе текста.

Содержание

  • 1 Отношение к нормальному распределению
  • 2 Оценка параметров
  • 3 Обобщения
  • 4 См. Также
  • 5 Ссылки

Отношение к нормальному распределению

Начиная с нормальное распределение

G p (x; μ, κ) = (κ 2 π) p exp ⁡ (- κ (x - μ) 2 2), {\ displaystyle G_ {p} (\ mathbf {x}; { \ boldsymbol {\ mu}}, \ kappa) = \ left ({\ sqrt {\ frac {\ kappa} {2 \ pi}}} \ right) ^ {p} \ exp \ left (- \ kappa {\ frac {(\ mathbf {x} - {\ boldsymbol {\ mu}}) ^ {2}} {2}} \ right),}{\ displaystyle G_ {p} (\ mathbf {x}; {\ boldsymbol {\ mu}}, \ kappa) = \ left ({\ sqrt {\ frac {\ kappa} {2 \ pi}}} \ right) ^ {p} \ exp \ left (- \ kappa {\ frac {(\ mathbf {x} - {\ boldsymbol {\ mu}}) ^ {2}} {2}} \ right),}

распределение фон Мизеса-Фишера получается разложением

(x - μ) 2 = x 2 + μ 2 - 2 μ T Икс, {\ Displaystyle (\ mathbf {x} - {\ boldsymbol {\ mu}}) ^ {2} = \ mathbf {x} ^ {2} + {\ boldsymbol {\ mu}} ^ {2} -2 {\ boldsymbol {\ mu}} ^ {T} \ mathbf {x},}{\ displaystyle (\ mathbf {x} - {\ boldsymbol {\ mu}}) ^ {2} = \ mathbf {x} ^ {2} + {\ boldsymbol {\ mu}} ^ {2} -2 {\ boldsymbol {\ mu}} ^ {T} \ mathbf {x},}

, используя тот факт, что x {\ displaystyle \ mathbf {x}}\ mathbf {x} и μ {\ displaystyle {\ boldsymbol {\ mu}}}{\ boldsymbol {\ mu}} - единичные векторы, и пересчет константы нормализации путем интегрирования x {\ displaystyle \ mathbf {x}}\ mathbf {x} над единичной сферой.

Оценка параметров

Серия из N независимых измерений xi {\ displaystyle x_ {i}}x_ {i} , взятых из фон Распределение Мизеса – Фишера. Определим

A p (κ) = I p / 2 (κ) I p / 2 - 1 (κ). {\ displaystyle A_ {p} (\ kappa) = {\ frac {I_ {p / 2} (\ kappa)} {I_ {p / 2-1} (\ kappa)}}. \,}A_ {p} (\ kappa) = \ frac {I_ {p / 2} (\ kappa)} {I_ {p / 2-1} ( \ каппа)}. \,

Тогда (Mardia Jupp, 1999) оценки максимального правдоподобия для μ {\ displaystyle \ mu \,}\ mu \, и κ {\ displaystyle \ kappa \,}\ kappa \, задаются достаточной статистикой

x ¯ = 1 N ∑ i N xi, {\ displaystyle {\ bar {x}} = {\ frac {1} {N}} \ sum _ { i} ^ {N} x_ {i},}{\ displaystyle {\ bar {x}} = {\ frac {1} {N}} \ sum _ {i} ^ {N} x_ {i},}

как

μ = x ¯ / R ¯, где R ¯ = ‖ x ¯ ‖, {\ displaystyle \ mu = {\ bar {x}} / {\ bar {R}}, {\ text {where}} {\ bar {R}} = \ | {\ bar {x}} \ |,}{\ displaystyle \ mu = {\ bar {x}} / {\ bar {R}}, {\ text {where}} {\ bar {R}} = \ | {\ bar {x}} \ |,}

и

κ = A p - 1 ( Р). {\ displaystyle \ kappa = A_ {p} ^ {- 1} ({\ bar {R}}).}\ kappa = A_p ^ {- 1} (\ bar {R}).

Таким образом, κ {\ displaystyle \ kappa \,}\ kappa \, является решение

A p (κ) = ‖ ∑ i N xi ‖ N = R ¯. {\ displaystyle A_ {p} (\ kappa) = {\ frac {\ | \ sum _ {i} ^ {N} x_ {i} \ |} {N}} = {\ bar {R}}.}A_p (\ kappa) = \ frac {\ | \ sum_i ^ N x_i \ |} {N} = \ bar {R}.

Простое приближение к κ {\ displaystyle \ kappa}\ kappa : (Sra, 2011)

κ ^ = R ¯ (p - R ¯ 2) 1 - R ¯ 2, { \ displaystyle {\ hat {\ kappa}} = {\ frac {{\ bar {R}} (p - {\ bar {R}} ^ {2})} {1 - {\ bar {R}} ^ { 2}}},}\ hat {\ kappa} = \ frac {\ bar {R} (p- \ bar {R} ^ 2)} {1- \ bar {R} ^ 2},

но более точную меру можно получить, повторив метод Ньютона несколько раз

κ ^ 1 = κ ^ - A p (κ ^) - R ¯ 1 - A p (κ ^) 2 - п - 1 κ ^ A п (κ ^), {\ displaystyle {\ hat {\ kappa}} _ {1} = {\ hat {\ kappa}} - {\ frac {A_ {p} ( {\ hat {\ kappa}}) - {\ bar {R}}} {1-A_ {p} ({\ hat {\ kappa}}) ^ {2} - {\ frac {p-1} {\ шляпа {\ kappa}}} A_ {p} ({\ hat {\ kappa}})}},}\ hat {\ kappa} _1 = \ hat {\ kappa} - \ frac { A_p (\ hat {\ kappa}) - \ bar {R}} {1-A_p (\ hat {\ kappa}) ^ 2- \ frac {p-1} {\ hat {\ kappa}} A_p (\ hat {\ kappa})},
κ ^ 2 = κ ^ 1 - A p (κ ^ 1) - R ¯ 1 - A p (κ ^ 1) 2 - p - 1 κ ^ 1 A p (κ ^ 1). {\ displaystyle {\ hat {\ kappa}} _ {2} = {\ hat {\ kappa}} _ {1} - {\ frac {A_ {p} ({\ hat {\ kappa}} _ {1}) - {\ bar {R}}} {1-A_ {p} ({\ hat {\ kappa}} _ {1}) ^ {2} - {\ frac {p-1} {{\ hat {\ каппа}} _ {1}}} A_ {p} ({\ hat {\ kappa}} _ {1})}}.}\ hat {\ kappa} _2 = \ hat {\ kappa} _1 - \ frac {A_p (\ hat {\ kappa} _1) - \ бар {R}} {1-A_p (\ hat {\ kappa} _1) ^ 2- \ frac {p-1} {\ hat {\ kappa} _1} A_p (\ hat {\ kappa} _1)}.

Для N ≥ 25 расчетная сферическая стандартная ошибка выборочного среднего направления может вычисляется как

σ ^ = (d NR ¯ 2) 1/2 {\ displaystyle {\ hat {\ sigma}} = \ left ({\ frac {d} {N {\ bar {R}} ^ { 2}}} \ right) ^ {1/2}}\ hat {\ sigma} = \ left (\ frac {d} {N \ bar {R} ^ 2} \ right) ^ {1/2}

где

d = 1 - 1 N ∑ i N (μ T xi) 2 {\ displaystyle d = 1 - {\ frac {1} { N}} \ sum _ {i} ^ {N} (\ mu ^ {T} x_ {i}) ^ {2}}d = 1 - \ frac {1} {N} \ sum_i ^ N (\ mu ^ Tx_i) ^ 2

Тогда можно приблизительно определить 100 (1 - α)% { \ displaystyle 100 (1- \ alpha) \%}100 (1- \ alpha) \% доверительный конус около μ {\ displaystyle \ mu}\ mu с полувертикальным углом

q = arcsin ⁡ ( е α 1/2 σ ^), {\ displaystyle q = \ arcsin (e _ {\ alpha} ^ {1/2} {\ hat {\ sigma}}),}q = \ arcsin (e_ \ alpha ^ {1/2} \ hat {\ sigma}), где e α = - ln ⁡ (α). {\ displaystyle e _ {\ alpha} = - \ ln (\ alpha).}e_ \ alpha = - \ ln (\ alpha).

Например, для конуса доверительной вероятности 95% α = 0,05, e α = - ln ⁡ (0,05) = 2,996, {\ displaystyle \ alpha = 0,05, e _ {\ alpha} = - \ ln (0,05) = 2,996,}\ альфа = 0,05, e_ \ альфа = - \ ln (0,05) = 2,996, и, следовательно, q = arcsin ⁡ (1,731 σ ^). {\ displaystyle q = \ arcsin (1.731 {\ hat {\ sigma}}).}q = \ arcsin (1.731 \ hat {\ sigma}).

Обобщения

Матричное распределение фон Мизеса-Фишера имеет плотность

fn, p (X; F) ∝ ехр ⁡ (тр ⁡ (FTX)) {\ displaystyle f_ {n, p} (\ mathbf {X}; \ mathbf {F}) \ propto \ exp (\ operatorname {tr} (\ mathbf {F} ^ {T} \ mathbf {X}))}{\ displaystyle f_ {n, p} (\ mathbf {X}; \ mathbf {F}) \ propto \ exp (\ operatorname {tr} (\ mathbf {F} ^ {T} \ mathbf {X }))}

поддерживается на многообразии Штифеля из n × p {\ displaystyle n \ times p}n \ times p orthonormal p-frames X {\ displaystyle \ mathbf {X}}\ mathbf {X} , где F {\ displaystyle \ mathbf {F}}\ mathbf {F} - произвольное n × p {\ displaystyle n \ times p}n \ times p вещественная матрица.

См. Также

Литература

  • Dhillon, I., Sra, С. (2003) "Моделирование данных с использованием направленных распределений". Tech. представитель Техасского университета, Остин.
  • Банерджи, А., Диллон, И.С., Гош, Дж., Сра, С. (2005). «Кластеризация на единичной гиперсфере с использованием распределений фон Мизеса-Фишера». Journal of Machine Learning Research, 6 (сентябрь), 1345-1382.
  • Фишер, Р.А., "Дисперсия на сфере". (1953) Proc. Рой. Soc. Лондон сер. А., 217: 295–305
  • Мардиа, Канти ; Юпп, П. Э. (1999). Направленная статистика. John Wiley Sons Ltd. ISBN 978-0-471-95333-3.
  • Sra, S. (2011). «Небольшая заметка о приближении параметров для распределений фон Мизеса-Фишера: и быстрая реализация I s (x)». Вычислительная статистика. 27 : 177–190. CiteSeerX 10.1.1.186.1887. doi :10.1007/s00180-011-0232-x.
Последняя правка сделана 2021-06-18 05:26:59
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте