Мультиканонический ансамбль

редактировать

В статистике и физике, multicanonical ансамбль (также называемый multicanonical выборки или плоской гистограмма ) является цепь Маркова Монте - Карло метод выборки, который использует алгоритм Метрополиса-Гастингса для вычисления интегралов, где подынтегральная функция имеет грубый ландшафт с несколькими локальными минимумами. Он выбирает состояния в соответствии с обратной плотностью состояний, которая должна быть известна априори или вычисляться с использованием других методов, таких как алгоритм Ванга и Ландау. Многоканоническая выборка - важный метод для спиновых систем, таких как модель Изинга или спиновые очки.

Содержание
  • 1 Мотивация
  • 2 Обзор
  • 3 Мотивация
  • 4 Многоканонический ансамбль
  • 5 Время туннелирования и критическое замедление
  • 6 Ссылки
Мотивация

В системах с большим количеством степеней свободы, таких как спиновые системы, требуется интегрирование Монте-Карло. В этой интеграции очень важным методом является выборка по важности и, в частности, алгоритм Metropolis. Однако алгоритм Метрополиса производит выборку состояний в соответствии с тем, где бета - величина, обратная температуре. Это означает, что энергетический барьер от от энергетического спектра экспоненциально трудно преодолеть. Системы с множественными локальными минимумами энергии, такими как модель Поттса, становятся трудными для выборки, поскольку алгоритм застревает в локальных минимумах системы. Это мотивирует другие подходы, а именно другие распределения выборки. exp ( - β E ) {\ Displaystyle \ ехр (- \ бета E)} Δ E {\ displaystyle \ Delta E}

Обзор

Мультиканонический ансамбль использует алгоритм Метрополиса – Гастингса с распределением выборки, заданным обратной плотностью состояний системы, в отличие от распределения выборки алгоритма Метрополиса. При таком выборе, в среднем, количество состояний, отобранных для каждой энергии, является постоянным, т.е. это моделирование с «плоской гистограммой» энергии. Это приводит к алгоритму, для которого уже нетрудно преодолеть энергетические барьеры. Еще одно преимущество перед алгоритмом Метрополиса состоит в том, что отбор проб не зависит от температуры системы, что означает, что одно моделирование позволяет оценить термодинамические переменные для всех температур (отсюда и название «многоканонический»: несколько температур). Это большое улучшение в изучении фазовых переходов первого рода. exp ( - β E ) {\ Displaystyle \ ехр (- \ бета E)}

Самая большая проблема при выполнении мультиканонического ансамбля состоит в том, что плотность состояний должна быть известна априори. Одним из важных вкладов в мультиканоническую выборку был алгоритм Ванга и Ландау, который асимптотически сходится к мультиканоническому ансамблю при вычислении плотности состояний во время сходимости.

Мультиканонический ансамбль не ограничивается физическими системами. Он может быть использован на абстрактных системах, которые имеют функцию стоимости F. Используя плотность состояний по отношению к F, метод становится общим для вычисления многомерных интегралов или нахождения локальных минимумов.

Мотивация

Рассмотрим систему и ее фазового пространства характеризуется конфигурацией в и функции «стоимость» F от фазового пространства системы на одномерном пространстве: спектр F. Ω {\ displaystyle \ Omega} р {\ displaystyle {\ boldsymbol {r}}} Ω {\ displaystyle \ Omega} Γ {\ displaystyle \ Gamma} F ( Ω ) знак равно Γ знак равно [ Γ мин , Γ Максимум ] {\ Displaystyle F (\ Omega) = \ Gamma = [\ Gamma _ {\ min}, \ Gamma _ {\ max}]}

пример:

Модель Изинга с N узлами является примером такой системы; фазовое пространство - это дискретное фазовое пространство, определяемое всеми возможными конфигурациями N спинов, где. Функция стоимости - это гамильтониан системы: р знак равно ( σ 1 , , σ я , , σ N ) {\ displaystyle {\ boldsymbol {r}} = (\ sigma _ {1}, \ ldots, \ sigma _ {i}, \ ldots, \ sigma _ {N})} σ я { - 1 , 1 } {\ displaystyle \ sigma _ {i} \ in \ {- 1,1 \}}

ЧАС ( р ) знак равно - я   j J я j ( 1 - σ я σ j ) , {\ displaystyle H ({\ boldsymbol {r}}) = - \ sum _ {\ langle i ~ j \ rangle} J_ {ij} (1- \ sigma _ {i} \ sigma _ {j}),}

где - сумма по окрестностям, - матрица взаимодействия. lt; я , j gt; {\ displaystyle lt;я, jgt;} J я j {\ displaystyle J_ {ij}}

Энергетический спектр в данном случае зависит от конкретного используемого устройства. Если все равны 1 (ферромагнитная модель Изинга) (например, все спины равны 1) и (половина спинов вверх, половина спинов вниз). Также обратите внимание, что в этой системе Γ знак равно [ E мин , E Максимум ] {\ displaystyle \ Gamma = [E _ {\ min}, E _ {\ max}]} J я j {\ displaystyle J_ {ij}} J я j {\ displaystyle J_ {ij}} E мин знак равно 0 {\ displaystyle E _ {\ min} = 0} E Максимум знак равно 2 D N {\ displaystyle E _ {\ max} = 2DN} Γ Z {\ displaystyle \ Gamma \ in \ mathbb {Z}}

Вычисление средней величины по фазовому пространству требует вычисления интеграла: Q {\ displaystyle \ langle Q \ rangle}

Q знак равно Ω Q ( р ) п р ( р ) d р {\ displaystyle \ langle Q \ rangle = \ int _ {\ Omega} Q ({\ boldsymbol {r}}) P_ {r} ({\ boldsymbol {r}}) \, d {\ boldsymbol {r}}}

где - вес каждого состояния (например, соответствует равномерно распределенным состояниям). п р ( р ) {\ displaystyle P_ {r} ({\ boldsymbol {r}})} п р ( р ) знак равно 1 / V {\ Displaystyle P_ {r} ({\ boldsymbol {r}}) = 1 / V}

Когда Q не зависит от конкретного состояния, а только от конкретного значения F состояния, формулу для можно проинтегрировать по f, добавив дельта-функцию Дирака, и записать ее как F ( р ) знак равно F р {\ Displaystyle F ({\ boldsymbol {r}}) = F _ {\ boldsymbol {r}}} Q {\ displaystyle \ langle Q \ rangle}

Q знак равно Γ мин Γ Максимум Ω Q ( F р ) п р ( F р ) δ ( ж - F р ) d р d ж знак равно Γ мин Γ Максимум Q ( ж ) Ω δ ( ж - F р ) п р ( F р ) d р d ж знак равно Γ мин Γ Максимум Q ( ж ) п ( ж ) d ж {\ displaystyle {\ begin {align} \ langle Q \ rangle amp; = \ int _ {\ Gamma _ {\ min}} ^ {\ Gamma _ {\ max}} \ int _ {\ Omega} Q (F _ {\ boldsymbol {r}}) P_ {r} (F _ {\ boldsymbol {r}}) \ delta (f-F _ {\ boldsymbol {r}}) \, d {\ boldsymbol {r}} \, df \\ amp; = \ int _ {\ Gamma _ {\ min}} ^ {\ Gamma _ {\ max}} Q (f) \ int _ {\ Omega} \ delta (f-F _ {\ boldsymbol {r}}) P_ { r} (F _ {\ boldsymbol {r}}) \, d {\ boldsymbol {r}} \, df \\ amp; = \ int _ {\ Gamma _ {\ min}} ^ {\ Gamma _ {\ max} } Q (f) P (f) \, df \\\ конец {выровнено}}}

где

п ( ж ) знак равно Ω п р ( р ) δ ( ж - F ( р ) ) d р {\ displaystyle P (f) = \ int _ {\ Omega} P_ {r} (r) \ delta (fF ({\ boldsymbol {r}})) \, d {\ boldsymbol {r}}}

- маргинальное распределение F.

пример:

Система, контактирующая с термостатом при обратной температуре, является примером для вычисления такого интеграла. Например, средняя энергия системы взвешивается фактором Больцмана : β {\ displaystyle \ beta}

E знак равно 1 V Ω ЧАС р е - β ЧАС р Z d р {\ displaystyle \ langle E \ rangle = {\ frac {1} {V}} \ int _ {\ Omega} H _ {\ boldsymbol {r}} {\ frac {e ^ {- \ beta H _ {\ boldsymbol {r }}}} {Z}} d {\ boldsymbol {r}}}

где

Z знак равно 1 V Ω е - β ЧАС р d р . {\ displaystyle Z = {\ frac {1} {V}} \ int _ {\ Omega} e ^ {- \ beta H _ {\ boldsymbol {r}}} d {\ boldsymbol {r}}.}

Маржинальное распределение определяется выражением п ( E ) {\ Displaystyle P (E)}

п ( E ) знак равно 1 V Ω е - β ЧАС р δ ( E - ЧАС р ) d р знак равно е - β E 1 V Ω δ ( E - ЧАС р ) d р знак равно е - β E ρ ( E ) {\ displaystyle P (E) = {\ frac {1} {V}} \ int _ {\ Omega} e ^ {- \ beta H _ {\ boldsymbol {r}}} \ delta (E-H _ {\ boldsymbol { r}}) d {\ boldsymbol {r}} = e ^ {- \ beta E} {\ frac {1} {V}} \ int _ {\ Omega} \ delta (E-H _ {\ boldsymbol {r} }) d {\ boldsymbol {r}} = e ^ {- \ beta E} \ rho (E)}

где - плотность состояний. ρ ( E ) {\ displaystyle \ rho (E)}

Средняя энергия тогда определяется как E {\ displaystyle \ langle E \ rangle}

E знак равно E мин E Максимум E п ( E ) d E {\ Displaystyle \ langle E \ rangle = \ int _ {E _ {\ min}} ^ {E _ {\ max}} EP (E) \, dE}

Когда система имеет большое количество степеней свободы, аналитическое выражение для часто бывает трудно получить, и для вычисления обычно используется интегрирование Монте-Карло. В простейшей формулировке метод выбирает N равномерно распределенных состояний и использует оценку Q {\ displaystyle \ langle Q \ rangle} Q {\ displaystyle \ langle Q \ rangle} р я Ω {\ displaystyle {\ boldsymbol {r}} _ {i} \ in \ Omega}

Q ¯ N знак равно я знак равно 1 N Q ( р я ) V п р ( р я ) {\ displaystyle {\ overline {Q}} _ {N} = \ sum _ {i = 1} ^ {N} Q ({\ boldsymbol {r}} _ {i}) VP_ {r} ({\ boldsymbol { r}} _ {i})}

для вычисления, так как сходится почти наверное к по усиленному закону больших чисел : Q {\ displaystyle \ langle Q \ rangle} Q ¯ N {\ displaystyle {\ overline {Q}} _ {N}} Q {\ displaystyle \ langle Q \ rangle}

Lim N Q ¯ N знак равно Q . {\ displaystyle \ lim _ {N \ rightarrow \ infty} {\ overline {Q}} _ {N} = \ langle Q \ rangle.}

Одна типичная проблема такой сходимости состоит в том, что дисперсия Q может быть очень высокой, что приводит к большим вычислительным усилиям для достижения разумных результатов.

пример

В предыдущем примере наибольший вклад в интеграл вносят состояния с низкой энергией. Если состояния отбираются равномерно, в среднем, количество состояний, которые отбираются с энергией E, определяется плотностью состояний. Эта плотность состояний может быть центрирована далеко от минимумов энергии, и поэтому получить среднее значение может быть трудно.

Чтобы улучшить эту сходимость, был предложен алгоритм Метрополиса – Гастингса. Как правило, идея методов Монте-Карло состоит в использовании выборки по важности для улучшения сходимости оценки путем выборки состояний в соответствии с произвольным распределением и использования соответствующей оценки: Q ¯ N {\ displaystyle {\ overline {Q}} _ {N}} π ( р ) {\ displaystyle \ pi ({\ boldsymbol {r}})}

Q ¯ N знак равно я знак равно 1 N Q ( р я ) π - 1 ( р я ) п р ( р я ) {\ displaystyle {\ overline {Q}} _ {N} = \ sum _ {i = 1} ^ {N} Q ({\ boldsymbol {r}} _ {i}) \ pi ^ {- 1} ({ \ boldsymbol {r}} _ {i}) P_ {r} ({\ boldsymbol {r}} _ {i})}.

Эта оценка обобщает оценку среднего для выборок, взятых из произвольного распределения. Следовательно, когда это равномерное распределение, оно соответствует тому, которое использовалось для однородной выборки выше. π ( р ) {\ displaystyle \ pi ({\ boldsymbol {r}})}

Когда система находится физическая система в контакте с термостатом, каждое состояние взвешивают в соответствии с коэффициентом Больцмана,. В Монте-Карло канонический ансамбль определяется пропорциональностью. В этой ситуации оценщик соответствует простому среднему арифметическому: р {\ displaystyle {\ boldsymbol {r}}} п р ( р я ) exp ( - β F р ) {\ displaystyle P_ {r} ({\ boldsymbol {r}} _ {i}) \ propto \ exp (- \ beta F _ {\ boldsymbol {r}})} π ( р ) {\ displaystyle \ pi ({\ boldsymbol {r}})} п р ( р я ) {\ displaystyle P_ {r} ({\ boldsymbol {r}} _ {i})}

Q ¯ N знак равно 1 N я знак равно 1 N Q ( р я ) {\ displaystyle {\ overline {Q}} _ {N} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} Q ({\ boldsymbol {r}} _ {i})}

Исторически сложилось, что это произошло потому, что первоначальная идея заключалась в использовании Метрополиса-Гастингса алгоритм для вычисления средних значений в системе в контакте с термостатом, где вес задается коэффициент Больцмана,. п ( Икс ) exp ( - β E ( р ) ) {\ displaystyle P ({\ boldsymbol {x}}) \ propto \ exp (- \ beta E ({\ boldsymbol {r}}))}

Хотя зачастую распределение выборки выбирается в качестве распределения веса, это не обязательно. Одна ситуация, когда канонический ансамбль не является эффективным выбором, - это когда для схождения требуется сколь угодно много времени. Одна из ситуаций, когда это происходит, - это когда функция F имеет несколько локальных минимумов. Вычислительные затраты для алгоритма выхода из определенной области с локальным минимумом экспоненциально возрастают с увеличением значения функции стоимости минимума. То есть чем глубже минимум, тем больше времени алгоритм там проводит, и тем сложнее будет уйти (экспоненциально возрастает с глубиной локального минимума). π {\ displaystyle \ pi} п р {\ displaystyle P_ {r}}

Один из способов избежать застревания в локальных минимумах функции стоимости - сделать метод выборки «невидимым» для локальных минимумов. Это основа мультиканонического ансамбля.

Многоканонический ансамбль

Мультиканонический ансамбль определяется путем выбора распределения выборки

π ( р ) 1 п ( F р ) {\ displaystyle \ pi ({\ boldsymbol {r}}) \ propto {\ frac {1} {P (F _ {\ boldsymbol {r}})}}}

где - предельное распределение F, определенное выше. Следствием этого выбора является то, что среднее количество выборок с заданным значением f, m (f), определяется как п ( ж ) {\ Displaystyle P (f)}

м ( ж ) знак равно Ω δ ( ж - F р ) π ( р ) п р ( р ) d р Ω δ ( ж - F р ) п р ( р ) 1 п ( F р ) d р знак равно 1 п ( ж ) Ω δ ( ж - F р ) п р ( р ) d р знак равно 1 {\ displaystyle m (f) = \ int _ {\ Omega} \ delta (f-F _ {\ boldsymbol {r}}) \ pi ({\ boldsymbol {r}}) P_ {r} ({\ boldsymbol {r }}) \, d {\ boldsymbol {r}} \ propto \ int _ {\ Omega} \ delta (f-F _ {\ boldsymbol {r}}) P_ {r} ({\ boldsymbol {r}}) { \ frac {1} {P (F _ {\ boldsymbol {r}})}} d {\ boldsymbol {r}} = {\ frac {1} {P (f)}} \ int _ {\ Omega} \ delta (f-F _ {\ boldsymbol {r}}) P_ {r} ({\ boldsymbol {r}}) d {\ boldsymbol {r}} = 1}

то есть среднее количество выборок не зависит от f : все затраты f выбираются одинаково, независимо от того, являются ли они более или менее вероятными. Это мотивирует название «плоская гистограмма». Для систем, находящихся в контакте с термостатом, отбор проб не зависит от температуры, и одно моделирование позволяет изучить все температуры.

пример:

В ферромагнитной модели Изинга с N узлами (пример в предыдущем разделе) плотность состояний может быть вычислена аналитически. В этом случае многоканонический ансамбль может использоваться для вычисления любой другой величины Q путем выборки системы в соответствии с и с использованием надлежащего оценщика, определенного в предыдущем разделе. п ( р ) {\ Displaystyle P ({\ boldsymbol {r}})} Q ¯ {\ displaystyle {\ overline {Q}}}

Время туннелирования и критическое замедление

Как и в любом другом методе Монте-Карло, существуют корреляции взятых образцов. Типичным измерением корреляции является время туннелирования. Время туннелирования определяется количеством шагов Маркова (цепи Маркова) моделирование должно выполнить туда-обратно между минимумом и максимумом спектра F. Одним из мотивов использования времени туннелирования является то, что, когда оно пересекает спектры, оно проходит через область максимума плотности состояний, тем самым декоррелируя процесс. С другой стороны, использование круговых обходов гарантирует, что система посещает весь спектр. п ( р ) {\ Displaystyle P ({\ boldsymbol {r}})}

Поскольку гистограмма плоская по переменной F, мультиканонический ансамбль можно рассматривать как процесс распространения (т.е. случайное блуждание ) на одномерной линии значений F. Детальный баланс процесса требует, чтобы в процессе не было отклонений. Это означает, что время туннелирования в локальной динамике должно масштабироваться как процесс диффузии, и, следовательно, время туннелирования должно масштабироваться квадратично с размером спектра N :

τ т т N 2 {\ Displaystyle \ тау _ {тт} \ propto N ^ {2}}

Однако, в некоторых системах (модель Изинга является наиболее парадигматической), скейлинговым страдает от критического замедления: это где зависит от конкретной системы. N 2 + z {\ displaystyle N ^ {2 + z}} z gt; 0 {\ displaystyle zgt; 0}

Нелокальная динамика была разработана для улучшения масштабирования до квадратичного масштабирования (см. Алгоритм Вольфа ), преодолевая критическое замедление. Однако остается открытым вопрос, существует ли локальная динамика, которая не страдает от критического замедления в спиновых системах, подобных модели Изинга.

Рекомендации
Последняя правка сделана 2023-04-17 04:37:54
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте