Метод крутого спуска

редактировать
Для алгоритма оптимизации см. Градиентный спуск.

В математике метод градиентного спуска или методом перевала является продолжением метода Лапласа для аппроксимации интеграла, где один деформируется интегральный контур в комплексной плоскости проходить вблизи стационарной точки ( седловой точки ), примерно в том направлении наискорейший спуск или стационарная фаза. Приближение перевала используется с интегралами в комплексной плоскости, тогда как метод Лапласа используется с вещественными интегралами.

Подлежащий оценке интеграл часто имеет вид

C ж ( z ) е λ грамм ( z ) d z , {\ Displaystyle \ int _ {C} е (г) е ^ {\ лямбда г (г)} \, дз,}

где C - контур, а λ большое. Один из вариантов метода наискорейшего спуска деформирует контур интегрирования C в новый путь интегрирования C ' так, чтобы выполнялись следующие условия:

  1. C ′ проходит через один или несколько нулей производной g ′ ( z),
  2. мнимая часть g ( z) постоянна на C ′.

Метод наискорейшего спуска был впервые опубликован Дебаем (1909), который использовал его для оценки функций Бесселя и указал, что он имел место в неопубликованной заметке Римана (1863) о гипергеометрических функциях. Контур наискорейшего спуска обладает свойством минимаксности, см. Федорюк (2001). Сигель (1932) описал некоторые другие неопубликованные заметки Римана, в которых он использовал этот метод для вывода формулы Римана – Зигеля. ошибка harvtxt: нет цели: CITEREFFedoryuk2001 ( помощь )

СОДЕРЖАНИЕ
  • 1 Основная идея
  • 2 Этимология
  • 3 Простая оценка [2]
  • 4 Случай единственной невырожденной седловой точки
    • 4.1 Основные понятия и обозначения
    • 4.2 Комплексная лемма Морса
    • 4.3. Асимптотическое разложение в случае одной невырожденной седловой точки.
  • 5 Случай кратных невырожденных седловых точек
  • 6 Другие случаи
  • 7 Расширения и обобщения
  • 8 См. Также
  • 9 Примечания
  • 10 Ссылки
Основная идея

Метод наискорейшего спуска - это метод аппроксимации комплексного интеграла вида

я ( λ ) знак равно C ж ( z ) е λ грамм ( z ) d z {\ Displaystyle I (\ lambda) = \ int _ {C} f (z) e ^ {\ lambda g (z)} \, \ mathrm {d} z} для больших, где и - аналитические функции от. Поскольку подынтегральное выражение является аналитическим, контур можно деформировать в новый контур без изменения интеграла. В частности, ищут новый контур, на котором мнимая часть постоянна. потом λ {\ displaystyle \ lambda \ rightarrow \ infty} ж ( z ) {\ displaystyle f (z)} грамм ( z ) {\ displaystyle g (z)} z {\ displaystyle z} C {\ displaystyle C} C {\ displaystyle C '} грамм ( z ) знак равно Re { грамм ( z ) } + я Я { грамм ( z ) } {\ displaystyle g (z) = {\ text {Re}} \ {g (z) \} + i \, {\ text {Im}} \ {g (z) \}} я ( λ ) знак равно е я λ Я { грамм ( z ) } C ж ( z ) е λ Re { грамм ( z ) } d z , {\ displaystyle I (\ lambda) = e ^ {i \ lambda {\ text {Im}} \ {g (z) \}} \ int _ {C '} f (z) e ^ {\ lambda {\ text {Re}} \ {g (z) \}} \, \ mathrm {d} z,} а оставшийся интеграл можно аппроксимировать другими методами, например методом Лапласа.
Этимология

Этот метод называется методом наискорейшего спуска, потому что для аналитических контуров с постоянной фазой они эквивалентны контурам наискорейшего спуска. грамм ( z ) {\ displaystyle g (z)}

Если -

аналитическая функция от, она удовлетворяет уравнениям Коши – Римана грамм ( z ) знак равно Икс ( z ) + я Y ( z ) {\ Displaystyle г (г) = Икс (г) + iY (г)} z знак равно Икс + я у {\ displaystyle z = x + iy} Икс Икс знак равно Y у а также Икс у знак равно - Y Икс . {\ displaystyle {\ frac {\ partial X} {\ partial x}} = {\ frac {\ partial Y} {\ partial y}} \ qquad {\ text {and}} \ qquad {\ frac {\ partial X } {\ partial y}} = - {\ frac {\ partial Y} {\ partial x}}.} потом Икс Икс Y Икс + Икс у Y у знак равно Икс Y знак равно 0 , {\ displaystyle {\ frac {\ partial X} {\ partial x}} {\ frac {\ partial Y} {\ partial x}} + {\ frac {\ partial X} {\ partial y}} {\ frac { \ partial Y} {\ partial y}} = \ nabla X \ cdot \ nabla Y = 0,} Таким образом, контуры постоянной фазы также являются контурами наискорейшего спуска.
Простая оценка

Пусть f, S  : C n → C и C ⊂ C n. Если  

M знак равно Как дела Икс C ( S ( Икс ) ) lt; , {\ Displaystyle М = \ sup _ {х \ в C} \ Re (S (x)) lt;\ infty,}

где обозначает действительную часть, и существует положительное вещественное число λ 0 такое, что ( ) {\ Displaystyle \ Re (\ cdot)}

C | ж ( Икс ) е λ 0 S ( Икс ) | d Икс lt; , {\ displaystyle \ int _ {C} \ left | f (x) e ^ {\ lambda _ {0} S (x)} \ right | dx lt;\ infty,}

то справедлива следующая оценка:

| C ж ( Икс ) е λ S ( Икс ) d Икс | const е λ M , λ р , λ λ 0 . {\ displaystyle \ left | \ int _ {C} f (x) e ^ {\ lambda S (x)} dx \ right | \ leqslant {\ text {const}} \ cdot e ^ {\ lambda M}, \ qquad \ forall \ lambda \ in \ mathbb {R}, \ quad \ lambda \ geqslant \ lambda _ {0}.}.

Доказательство простой оценки:

| C ж ( Икс ) е λ S ( Икс ) d Икс | C | ж ( Икс ) | | е λ S ( Икс ) | d Икс C | ж ( Икс ) | е λ M | е λ 0 ( S ( Икс ) - M ) е ( λ - λ 0 ) ( S ( Икс ) - M ) | d Икс C | ж ( Икс ) | е λ M | е λ 0 ( S ( Икс ) - M ) | d Икс | е ( λ - λ 0 ) ( S ( Икс ) - M ) | 1 знак равно е - λ 0 M C | ж ( Икс ) е λ 0 S ( Икс ) | d Икс const е λ M . {\ Displaystyle {\ begin {align} \ left | \ int _ {C} f (x) e ^ {\ lambda S (x)} dx \ right | amp; \ leqslant \ int _ {C} | f (x) | \ left | e ^ {\ lambda S (x)} \ right | dx \\ amp; \ Equiv \ int _ {C} | f (x) | e ^ {\ lambda M} \ left | e ^ {\ lambda _ {0} (S (x) -M)} e ^ {(\ lambda - \ lambda _ {0}) (S (x) -M)} \ right | dx \\ amp; \ leqslant \ int _ {C } | f (x) | e ^ {\ lambda M} \ left | e ^ {\ lambda _ {0} (S (x) -M)} \ right | dx amp;amp; \ left | e ^ {(\ lambda - \ лямбда _ {0}) (S (x) -M)} \ right | \ leqslant 1 \\ amp; = \ underbrace {e ^ {- \ lambda _ {0} M} \ int _ {C} \ left | f (x) e ^ {\ lambda _ {0} S (x)} \ right | dx} _ {\ text {const}} \ cdot e ^ {\ lambda M}. \ end {выравнивается}}}
Случай единственной невырожденной седловой точки

Основные понятия и обозначения

Пусть x - комплексный n -мерный вектор и

S Икс Икс ( Икс ) ( 2 S ( Икс ) Икс я Икс j ) , 1 я , j п , {\ Displaystyle S '' _ {xx} (x) \ Equiv \ left ({\ frac {\ partial ^ {2} S (x)} {\ partial x_ {i} \ partial x_ {j}}} \ right), \ qquad 1 \ leqslant i, \, j \ leqslant n,}

обозначают матрицу Гессе для функции S ( x). Если

φ ( Икс ) знак равно ( φ 1 ( Икс ) , φ 2 ( Икс ) , , φ k ( Икс ) ) {\ displaystyle {\ boldsymbol {\ varphi}} (x) = (\ varphi _ {1} (x), \ varphi _ {2} (x), \ ldots, \ varphi _ {k} (x))}

является векторной функцией, то ее матрица Якоби определяется как

φ Икс ( Икс ) ( φ я ( Икс ) Икс j ) , 1 я k , 1 j п . {\ displaystyle {\ boldsymbol {\ varphi}} _ {x} '(x) \ Equiv \ left ({\ frac {\ partial \ varphi _ {i} (x)} {\ partial x_ {j}}} \ справа), \ qquad 1 \ leqslant i \ leqslant k, \ quad 1 \ leqslant j \ leqslant n.}

Невырожденная седловая точка, г 0 ∈ С п, голоморфная функцией S ( г) является критической точкой функции (т.е. ∇ S ( г 0) = 0), где матрица Гесса функции имеет в неисчезающей определитель (т.е.). Det S z z ( z 0 ) 0 {\ Displaystyle \ Det S '' _ {zz} (z ^ {0}) \ neq 0}

Следующее является основным инструментом для построения асимптотики интегралов в случае невырожденной седловой точки:

Комплексная лемма Морса

Морзе лемма для вещественных функций обобщают следующий образом для голоморфных функций : вблизи невырожденной седловой точки г 0 голоморфной функции S ( г), существует координаты в терминах которых S ( г) - С ( г 0) точно квадратичный. Чтобы сделать это точным, пусть S - голоморфная функция с областью определения W ⊂ C n, и пусть z 0 в W - невырожденная седловая точка S, то есть ∇ S ( z 0) = 0 и. Тогда существуют окрестности U ⊂ W из г 0 и V ⊂ C п о ш = 0, и биективном голоморфной функции ф  : V → U с ф (0) = г 0 такое, что Det S z z ( z 0 ) 0 {\ Displaystyle \ Det S '' _ {zz} (z ^ {0}) \ neq 0}

ш V : S ( φ ( ш ) ) знак равно S ( z 0 ) + 1 2 j знак равно 1 п μ j ш j 2 , Det φ ш ( 0 ) знак равно 1 , {\ displaystyle \ forall w \ in V: \ qquad S ({\ boldsymbol {\ varphi}} (w)) = S (z ^ {0}) + {\ frac {1} {2}} \ sum _ { j = 1} ^ {n} \ mu _ {j} w_ {j} ^ {2}, \ quad \ det {\ boldsymbol {\ varphi}} _ {w} '(0) = 1,}

Здесь μ j - собственные значения матрицы. S z z ( z 0 ) {\ displaystyle S_ {zz} '' (z ^ {0})}

Иллюстрация комплексной леммы Морса Доказательство комплексной леммы Морса  -

Следующее доказательство является прямым обобщением доказательства действительной леммы Морса, которое можно найти в. Начнем с демонстрации

Вспомогательное заявление. Пусть F   : С п → С быть голоморфна в окрестности начала координат и F  (0) = 0. Тогда в некоторой окрестности существуют функции g i  : C n → C такие, что  
ж ( z ) знак равно я знак равно 1 п z я грамм я ( z ) , {\ Displaystyle е (г) = \ сумма _ {я = 1} ^ {п} г_ {я} г_ {я} (г),}
где каждый г я является голоморфным и
грамм я ( 0 ) знак равно ж ( z ) z я | z знак равно 0 . {\ displaystyle g_ {i} (0) = \ left. {\ tfrac {\ partial f (z)} {\ partial z_ {i}}} \ right | _ {z = 0}.}

От личности

ж ( z ) знак равно 0 1 d d т ж ( т z 1 , , т z п ) d т знак равно я знак равно 1 п z я 0 1 ж ( z ) z я | z знак равно ( т z 1 , , т z п ) d т , {\ displaystyle f (z) = \ int _ {0} ^ {1} {\ frac {d} {dt}} f \ left (tz_ {1}, \ cdots, tz_ {n} \ right) dt = \ sum _ {i = 1} ^ {n} z_ {i} \ int _ {0} ^ {1} \ left. {\ frac {\ partial f (z)} {\ partial z_ {i}}} \ right | _ {z = (tz_ {1}, \ ldots, tz_ {n})} dt,}

мы заключаем, что

грамм я ( z ) знак равно 0 1 ж ( z ) z я | z знак равно ( т z 1 , , т z п ) d т {\ displaystyle g_ {i} (z) = \ int _ {0} ^ {1} \ left. {\ frac {\ partial f (z)} {\ partial z_ {i}}} \ right | _ {z = (tz_ {1}, \ ldots, tz_ {n})} dt}

а также

грамм я ( 0 ) знак равно ж ( z ) z я | z знак равно 0 . {\ displaystyle g_ {i} (0) = \ left. {\ frac {\ partial f (z)} {\ partial z_ {i}}} \ right | _ {z = 0}.}

Без ограничения общности переводим начало координат в z 0, так что z 0 = 0 и S (0) = 0. Используя вспомогательное утверждение, имеем

S ( z ) знак равно я знак равно 1 п z я грамм я ( z ) . {\ displaystyle S (z) = \ sum _ {i = 1} ^ {n} z_ {i} g_ {i} (z).}

Поскольку начало координат - седловая точка,

S ( z ) z я | z знак равно 0 знак равно грамм я ( 0 ) знак равно 0 , {\ displaystyle \ left. {\ frac {\ partial S (z)} {\ partial z_ {i}}} \ right | _ {z = 0} = g_ {i} (0) = 0,}

мы также можем применить вспомогательное утверждение к функциям g i ( z) и получить

S ( z ) знак равно я , j знак равно 1 п z я z j час я j ( z ) . {\ Displaystyle S (z) = \ sum _ {i, j = 1} ^ {n} z_ {i} z_ {j} h_ {ij} (z).} (1)

Напомним, что произвольная матрица A может быть представлена ​​как сумма симметричной A ( s) и антисимметричной A ( a) матриц,

А я j знак равно А я j ( s ) + А я j ( а ) , А я j ( s ) знак равно 1 2 ( А я j + А j я ) , А я j ( а ) знак равно 1 2 ( А я j - А j я ) . {\ Displaystyle A_ {ij} = A_ {ij} ^ {(s)} + A_ {ij} ^ {(a)}, \ qquad A_ {ij} ^ {(s)} = {\ tfrac {1} { 2}} \ left (A_ {ij} + A_ {ji} \ right), \ qquad A_ {ij} ^ {(a)} = {\ tfrac {1} {2}} \ left (A_ {ij} - A_ {ji} \ right).}

Сжатие любой симметричной матрицы B с произвольной матрицей A есть

я , j B я j А я j знак равно я , j B я j А я j ( s ) , {\ displaystyle \ sum _ {i, j} B_ {ij} A_ {ij} = \ sum _ {i, j} B_ {ij} A_ {ij} ^ {(s)},}
(2)

т.е. антисимметричный компонент A не вносит вклада, потому что

я , j B я j C я j знак равно я , j B j я C j я знак равно - я , j B я j C я j знак равно 0. {\ displaystyle \ sum _ {i, j} B_ {ij} C_ {ij} = \ sum _ {i, j} B_ {ji} C_ {ji} = - \ sum _ {i, j} B_ {ij} C_ {ij} = 0.}

Таким образом, h ij ( z) в уравнении (1) можно считать симметричным относительно перестановки индексов i и j. Обратите внимание, что

2 S ( z ) z я z j | z знак равно 0 знак равно 2 час я j ( 0 ) ; {\ displaystyle \ left. {\ frac {\ partial ^ {2} S (z)} {\ partial z_ {i} \ partial z_ {j}}} \ right | _ {z = 0} = 2h_ {ij} (0);}

следовательно, det ( h ij (0)) ≠ 0, поскольку начало координат - невырожденная седловая точка.

Покажем по индукции, что существуют локальные координаты u = ( u 1,... u n), z = ψ ( u), 0 = ψ (0), такие, что

S ( ψ ( ты ) ) знак равно я знак равно 1 п ты я 2 . {\ displaystyle S ({\ boldsymbol {\ psi}} (u)) = \ sum _ {i = 1} ^ {n} u_ {i} ^ {2}.} (3)

Сначала предположим, что существуют локальные координаты y = ( y 1,... y n), z = φ ( y), 0 = φ (0), такие, что

S ( ϕ ( у ) ) знак равно у 1 2 + + у р - 1 2 + я , j знак равно р п у я у j ЧАС я j ( у ) , {\ displaystyle S ({\ boldsymbol {\ phi}} (y)) = y_ {1} ^ {2} + \ cdots + y_ {r-1} ^ {2} + \ sum _ {i, j = r } ^ {n} y_ {i} y_ {j} H_ {ij} (y),} (4)

где H ij симметричен в силу уравнения (2). Линейной заменой переменных ( y r,... y n) можно гарантировать, что H rr (0) ≠ 0. Из цепного правила имеем

2 S ( ϕ ( у ) ) у я у j знак равно л , k знак равно 1 п 2 S ( z ) z k z л | z знак равно ϕ ( у ) ϕ k у я ϕ л у j + k знак равно 1 п S ( z ) z k | z знак равно ϕ ( у ) 2 ϕ k у я у j {\ displaystyle {\ frac {\ partial ^ {2} S ({\ boldsymbol {\ phi}} (y))} {\ partial y_ {i} \ partial y_ {j}}} = \ sum _ {l, k = 1} ^ {n} \ left. {\ frac {\ partial ^ {2} S (z)} {\ partial z_ {k} \ partial z_ {l}}} \ right | _ {z = {\ boldsymbol {\ phi}} (y)} {\ frac {\ partial \ phi _ {k}} {\ partial y_ {i}}} {\ frac {\ partial \ phi _ {l}} {\ partial \ phi_ { j}}} + \ sum _ {k = 1} ^ {n} \ left. {\ frac {\ partial S (z)} {\ partial z_ {k}}} \ right | _ {z = {\ boldsymbol {\ phi}} (y)} {\ frac {\ partial ^ {2} \ phi _ {k}} {\ partial y_ {i} \ partial y_ {j}}}}

Следовательно:

S у у ( ϕ ( 0 ) ) знак равно ϕ у ( 0 ) Т S z z ( 0 ) ϕ у ( 0 ) , Det ϕ у ( 0 ) 0 ; {\ displaystyle S '' _ {yy} ({\ boldsymbol {\ phi}} (0)) = {\ boldsymbol {\ phi}} '_ {y} (0) ^ {T} S' '_ {zz } (0) {\ boldsymbol {\ phi}} '_ {y} (0), \ qquad \ det {\ boldsymbol {\ phi}}' _ {y} (0) \ neq 0;}

откуда,

0 Det S у у ( ϕ ( 0 ) ) знак равно 2 р - 1 Det ( 2 ЧАС я j ( 0 ) ) . {\ displaystyle 0 \ neq \ det S '' _ {yy} ({\ boldsymbol {\ phi}} (0)) = 2 ^ {r-1} \ det \ left (2H_ {ij} (0) \ right).}

Матрица ( H ij (0)) может быть преобразована в нормальную форму Жордана : ( H ij (0)) = LJL −1, если L дает желаемое невырожденное линейное преобразование, а диагональ матрицы J содержит ненулевые собственные значения из ( H ij (0)). Если H ij (0) ≠ 0, то в силу непрерывности H ij ( y) оно также должно быть отличным от нуля в некоторой окрестности начала координат. Введя, пишем ЧАС ~ я j ( у ) знак равно ЧАС я j ( у ) / ЧАС р р ( у ) {\ Displaystyle {\ тильда {H}} _ {ij} (y) = H_ {ij} (y) / H_ {rr} (y)}

S ( φ ( у ) ) знак равно у 1 2 + + у р - 1 2 + ЧАС р р ( у ) я , j знак равно р п у я у j ЧАС ~ я j ( у ) знак равно у 1 2 + + у р - 1 2 + ЧАС р р ( у ) [ у р 2 + 2 у р j знак равно р + 1 п у j ЧАС ~ р j ( у ) + я , j знак равно р + 1 п у я у j ЧАС ~ я j ( у ) ] знак равно у 1 2 + + у р - 1 2 + ЧАС р р ( у ) [ ( у р + j знак равно р + 1 п у j ЧАС ~ р j ( у ) ) 2 - ( j знак равно р + 1 п у j ЧАС ~ р j ( у ) ) 2 ] + ЧАС р р ( у ) я , j знак равно р + 1 п у я у j ЧАС ~ я j ( у ) {\ Displaystyle {\ begin {align} S ({\ boldsymbol {\ varphi}} (y)) = amp; y_ {1} ^ {2} + \ cdots + y_ {r-1} ^ {2} + H_ {rr } (y) \ sum _ {i, j = r} ^ {n} y_ {i} y_ {j} {\ tilde {H}} _ {ij} (y) \\ = amp; y_ {1} ^ {2 } + \ cdots + y_ {r-1} ^ {2} + H_ {rr} (y) \ left [y_ {r} ^ {2} + 2y_ {r} \ sum _ {j = r + 1} ^ {n} y_ {j} {\ tilde {H}} _ {rj} (y) + \ sum _ {i, j = r + 1} ^ {n} y_ {i} y_ {j} {\ tilde { H}} _ {ij} (y) \ right] \\ = amp; y_ {1} ^ {2} + \ cdots + y_ {r-1} ^ {2} + H_ {rr} (y) \ left [\ left (y_ {r} + \ sum _ {j = r + 1} ^ {n} y_ {j} {\ tilde {H}} _ {rj} (y) \ right) ^ {2} - \ left ( \ sum _ {j = r + 1} ^ {n} y_ {j} {\ tilde {H}} _ {rj} (y) \ right) ^ {2} \ right] + H_ {rr} (y) \ sum _ {i, j = r + 1} ^ {n} y_ {i} y_ {j} {\ tilde {H}} _ {ij} (y) \ end {выровнено}}}

Руководствуясь последним выражением, введем новые координаты z = η ( x), 0 = η (0),

Икс р знак равно ЧАС р р ( у ) ( у р + j знак равно р + 1 п у j ЧАС ~ р j ( у ) ) , Икс j знак равно у j , j р . {\ displaystyle x_ {r} = {\ sqrt {H_ {rr} (y)}} \ left (y_ {r} + \ sum _ {j = r + 1} ^ {n} y_ {j} {\ tilde) {H}} _ {rj} (y) \ right), \ qquad x_ {j} = y_ {j}, \ quad \ forall j \ neq r.}

Замена переменных y ↔ x локально обратима, поскольку соответствующий якобиан отличен от нуля,

Икс р у k | у знак равно 0 знак равно ЧАС р р ( 0 ) [ δ р , k + j знак равно р + 1 п δ j , k ЧАС ~ j р ( 0 ) ] . {\ displaystyle \ left. {\ frac {\ partial x_ {r}} {\ partial y_ {k}}} \ right | _ {y = 0} = {\ sqrt {H_ {rr} (0)}} \ left [\ delta _ {r, \, k} + \ sum _ {j = r + 1} ^ {n} \ delta _ {j, \, k} {\ tilde {H}} _ {jr} (0)\Правильно].}

Следовательно,

S ( η ( Икс ) ) знак равно Икс 1 2 + + Икс р 2 + я , j знак равно р + 1 п Икс я Икс j W я j ( Икс ) . {\ displaystyle S ({\ boldsymbol {\ eta}} (x)) = {x} _ {1} ^ {2} + \ cdots + {x} _ {r} ^ {2} + \ sum _ {i, j = r + 1} ^ {n} {x} _ {i} {x} _ {j} W_ {ij} (x).} (5)

Сравнивая уравнения (4) и (5), заключаем, что уравнение (3) проверено. Обозначая собственные значения из по ц J, уравнение (3) можно переписать в виде S z z ( 0 ) {\ displaystyle S '' _ {zz} (0)}

S ( φ ( ш ) ) знак равно 1 2 j знак равно 1 п μ j ш j 2 . {\ displaystyle S ({\ boldsymbol {\ varphi}} (w)) = {\ frac {1} {2}} \ sum _ {j = 1} ^ {n} \ mu _ {j} w_ {j} ^ {2}.} (6)

Следовательно,

S ш ш ( φ ( 0 ) ) знак равно φ ш ( 0 ) Т S z z ( 0 ) φ ш ( 0 ) , {\ displaystyle S '' _ {ww} ({\ boldsymbol {\ varphi}} (0)) = {\ boldsymbol {\ varphi}} '_ {w} (0) ^ {T} S' '_ {zz } (0) {\ boldsymbol {\ varphi}} '_ {w} (0),} (7)

Из уравнения (6) следует, что. Джордан нормальная форма из гласит, где J г является верхней диагональная матрица, содержащая собственные значения и DET P ≠ 0 ; следовательно,. Из уравнения (7) получаем Det S ш ш ( φ ( 0 ) ) знак равно μ 1 μ п {\ Displaystyle \ Det S '' _ {ww} ({\ boldsymbol {\ varphi}} (0)) = \ mu _ {1} \ cdots \ mu _ {n}} S z z ( 0 ) {\ displaystyle S '' _ {zz} (0)} S z z ( 0 ) знак равно п J z п - 1 {\ Displaystyle S '' _ {zz} (0) = PJ_ {z} P ^ {- 1}} Det S z z ( 0 ) знак равно μ 1 μ п {\ Displaystyle \ Det S '' _ {zz} (0) = \ mu _ {1} \ cdots \ mu _ {n}}

Det S ш ш ( φ ( 0 ) ) знак равно [ Det φ ш ( 0 ) ] 2 Det S z z ( 0 ) Det φ ш ( 0 ) знак равно ± 1. {\ displaystyle \ det S '' _ {ww} ({\ boldsymbol {\ varphi}} (0)) = \ left [\ det {\ boldsymbol {\ varphi}} '_ {w} (0) \ right] ^ {2} \ det S '' _ {zz} (0) \ Longrightarrow \ det {\ boldsymbol {\ varphi}} '_ {w} (0) = \ pm 1.}

Если, то замена двух переменных гарантирует это. Det φ ш ( 0 ) знак равно - 1 {\ displaystyle \ det {\ boldsymbol {\ varphi}} '_ {w} (0) = - 1} Det φ ш ( 0 ) знак равно + 1 {\ displaystyle \ det {\ boldsymbol {\ varphi}} '_ {w} (0) = + 1}

Асимптотическое разложение в случае одной невырожденной седловой точки

Предполагать

  1.  е  ( г) и С ( г) являются голоморфными функциями в открытом, ограниченном, и просто подсоединенном множестве Ω х ⊂ С п такоечто я х = Ω х ∩ R п буду подключен ;
  2. ( S ( z ) ) {\ Displaystyle \ Re (S (г))}имеет единственный максимум: ровно для одной точки x 0 ∈ I x ; Максимум z я Икс ( S ( z ) ) знак равно ( S ( Икс 0 ) ) {\ displaystyle \ max _ {z \ in I_ {x}} \ Re (S (z)) = \ Re (S (x ^ {0}))}
  3. x 0 - невырожденная седловая точка (т. е. ∇ S ( x 0) = 0 и). Det S Икс Икс ( Икс 0 ) 0 {\ Displaystyle \ Det S '' _ {хх} (х ^ {0}) \ neq 0}

Тогда имеет место следующая асимптотика

я ( λ ) я Икс ж ( Икс ) е λ S ( Икс ) d Икс знак равно ( 2 π λ ) п 2 е λ S ( Икс 0 ) ( ж ( Икс 0 ) + О ( λ - 1 ) ) j знак равно 1 п ( - μ j ) - 1 2 , λ , {\ Displaystyle I (\ lambda) \ Equiv \ int _ {I_ {x}} f (x) e ^ {\ lambda S (x)} dx = \ left ({\ frac {2 \ pi} {\ lambda}) } \ right) ^ {\ frac {n} {2}} e ^ {\ lambda S (x ^ {0})} \ left (f (x ^ {0}) + O \ left (\ lambda ^ {- 1} \ right) \ right) \ prod _ {j = 1} ^ {n} (- \ mu _ {j}) ^ {- {\ frac {1} {2}}}, \ qquad \ lambda \ to \ infty,} (8)

где μ J являются собственными значениями матрицы Гессе и определяются с аргументами S Икс Икс ( Икс 0 ) {\ Displaystyle S '' _ {хх} (х ^ {0})} ( - μ j ) - 1 2 {\ displaystyle (- \ mu _ {j}) ^ {- {\ frac {1} {2}}}}

| аргумент - μ j | lt; π 4 . {\ displaystyle \ left | \ arg {\ sqrt {- \ mu _ {j}}} \ right | lt;{\ tfrac {\ pi} {4}}.}
(9)

Это утверждение является частным случаем более общих результатов, представленных в работе Федорюка (1987).

Вывод уравнения (8)  - Иллюстрация к выводу уравнения (8)

Сначала мы деформируем контур I x в новый контур, проходящий через седловую точку x 0 и разделяющий границу с I x. Эта деформация не меняет значения интеграла I ( λ). Мы используем комплексную лемму Морса для замены переменных интегрирования. Согласно лемме функция φ ( w) отображает окрестность x 0 ∈ U ⊂ Ω x на окрестность Ω w, содержащую начало координат. Интеграл I ( λ) можно разбить на два: I ( λ) = I 0 ( λ) + I 1 ( λ), где I 0 ( λ) - интеграл по, а I 1 ( λ) - по окончанию (т. Е., оставшаяся часть контура I ′ x). Поскольку последняя область не содержит седловой точки x 0, значение I 1 ( λ) экспоненциально меньше, чем I 0 ( λ) при λ → ∞ ; таким образом, I 1 ( λ) игнорируется. Вводя контур I w так, чтобы имеем я Икс Ω Икс {\ displaystyle I '_ {x} \ subset \ Omega _ {x}} U я Икс {\ displaystyle U \ cap I '_ {x}} я Икс ( U я Икс ) {\ displaystyle I '_ {x} \ setminus (U \ cap I' _ {x})} U я Икс знак равно φ ( я ш ) {\ Displaystyle U \ cap I '_ {x} = {\ boldsymbol {\ varphi}} (I_ {w})}

я 0 ( λ ) знак равно е λ S ( Икс 0 ) я ш ж [ φ ( ш ) ] exp ( λ j знак равно 1 п μ j 2 ш j 2 ) | Det φ ш ( ш ) | d ш . {\ displaystyle I_ {0} (\ lambda) = e ^ {\ lambda S (x ^ {0})} \ int _ {I_ {w}} f [{\ boldsymbol {\ varphi}} (w)] \ exp \ left (\ lambda \ sum _ {j = 1} ^ {n} {\ tfrac {\ mu _ {j}} {2}} w_ {j} ^ {2} \ right) \ left | \ det { \ boldsymbol {\ varphi}} _ {w} '(w) \ right | dw.} (10)

Напоминая, что x 0 = φ (0), а также, мы разложим предэкспоненциальную функцию в ряд Тейлора и оставим только старший член нулевого порядка Det φ ш ( 0 ) знак равно 1 {\ displaystyle \ det {\ boldsymbol {\ varphi}} _ {w} '(0) = 1} ж [ φ ( ш ) ] {\ displaystyle f [{\ boldsymbol {\ varphi}} (ш)]}

я 0 ( λ ) ж ( Икс 0 ) е λ S ( Икс 0 ) р п exp ( λ j знак равно 1 п μ j 2 ш j 2 ) d ш знак равно ж ( Икс 0 ) е λ S ( Икс 0 ) j знак равно 1 п - е 1 2 λ μ j у 2 d у . {\ displaystyle I_ {0} (\ lambda) \ приблизительно f (x ^ {0}) e ^ {\ lambda S (x ^ {0})} \ int _ {\ mathbf {R} ^ {n}} \ exp \ left (\ lambda \ sum _ {j = 1} ^ {n} {\ tfrac {\ mu _ {j}} {2}} w_ {j} ^ {2} \ right) dw = f (x ^ {0}) e ^ {\ lambda S (x ^ {0})} \ prod _ {j = 1} ^ {n} \ int _ {- \ infty} ^ {\ infty} e ^ {{\ frac { 1} {2}} \ lambda \ mu _ {j} y ^ {2}} dy.} (11)

Здесь мы заменили область интегрирования I w на R n, потому что обе содержат начало координат, которое является седловой точкой, следовательно, они равны с точностью до экспоненциально малого члена. Интегралы в правой части уравнения (11) могут быть выражены как

я j знак равно - е 1 2 λ μ j у 2 d у знак равно 2 0 е - 1 2 λ ( - μ j у ) 2 d у знак равно 2 0 е - 1 2 λ | - μ j | 2 у 2 exp ( 2 я аргумент - μ j ) d у . {\ displaystyle {\ mathcal {I}} _ {j} = \ int _ {- \ infty} ^ {\ infty} e ^ {{\ frac {1} {2}} \ lambda \ mu _ {j} y ^ {2}} dy = 2 \ int _ {0} ^ {\ infty} e ^ {- {\ frac {1} {2}} \ lambda \ left ({\ sqrt {- \ mu _ {j}} } y \ right) ^ {2}} dy = 2 \ int _ {0} ^ {\ infty} e ^ {- {\ frac {1} {2}} \ lambda \ left | {\ sqrt {- \ mu _ {j}}} \ right | ^ {2} y ^ {2} \ exp \ left (2i \ arg {\ sqrt {- \ mu _ {j}}} \ right)} dy.} (12)

Из этого представления мы заключаем, что условие (9) должно быть выполнено для того, чтобы правая и левая части уравнения (12) совпадали. Согласно предположению 2, это отрицательно определенная квадратичная форма (а именно,), подразумевающая существование интеграла, который легко вычисляется ( S Икс Икс ( Икс 0 ) ) {\ Displaystyle \ Re \ left (S_ {xx} '' (x ^ {0}) \ right)} ( μ j ) lt; 0 {\ Displaystyle \ Re (\ му _ {j}) lt;0} я j {\ displaystyle {\ mathcal {I}} _ {j}}

я j знак равно 2 - μ j λ 0 е - ξ 2 2 d ξ знак равно 2 π λ ( - μ j ) - 1 2 . {\ displaystyle {\ mathcal {I}} _ {j} = {\ frac {2} {{\ sqrt {- \ mu _ {j}}} {\ sqrt {\ lambda}}}} \ int _ {0 } ^ {\ infty} e ^ {- {\ frac {\ xi ^ {2}} {2}}} d \ xi = {\ sqrt {\ frac {2 \ pi} {\ lambda}}} (- \ mu _ {j}) ^ {- {\ frac {1} {2}}}.}

Уравнение (8) также можно записать в виде

я ( λ ) знак равно ( 2 π λ ) п 2 е λ S ( Икс 0 ) ( Det ( - S Икс Икс ( Икс 0 ) ) ) - 1 2 ( ж ( Икс 0 ) + О ( λ - 1 ) ) , {\ displaystyle I (\ lambda) = \ left ({\ frac {2 \ pi} {\ lambda}} \ right) ^ {\ frac {n} {2}} e ^ {\ lambda S (x ^ {0 })} \ left (\ det (-S_ {xx} '' (x ^ {0})) \ right) ^ {- {\ frac {1} {2}}} \ left (f (x ^ {0 }) + O \ left (\ lambda ^ {- 1} \ right) \ right),} (13)

где филиал

Det ( - S Икс Икс ( Икс 0 ) ) {\ displaystyle {\ sqrt {\ det \ left (-S_ {xx} '' (x ^ {0}) \ right)}}}

выбирается следующим образом

( Det ( - S Икс Икс ( Икс 0 ) ) ) - 1 2 знак равно exp ( - я  Ind ( - S Икс Икс ( Икс 0 ) ) ) j знак равно 1 п | μ j | - 1 2 , Ind ( - S Икс Икс ( Икс 0 ) ) знак равно 1 2 j знак равно 1 п аргумент ( - μ j ) , | аргумент ( - μ j ) | lt; π 2 . {\ displaystyle {\ begin {align} \ left (\ det \ left (-S_ {xx} '' (x ^ {0}) \ right) \ right) ^ {- {\ frac {1} {2}} } amp; = \ exp \ left (-i {\ text {Ind}} \ left (-S_ {xx} '' (x ^ {0}) \ right) \ right) \ prod _ {j = 1} ^ { n} \ left | \ mu _ {j} \ right | ^ {- {\ frac {1} {2}}}, \\ {\ text {Ind}} \ left (-S_ {xx} '' (x ^ {0}) \ right) amp; = {\ tfrac {1} {2}} \ sum _ {j = 1} ^ {n} \ arg (- \ mu _ {j}), amp;amp; | \ arg (- \ mu _ {j}) | lt;{\ tfrac {\ pi} {2}}. \ end {align}}}

Рассмотрим важные частные случаи:

  • Если S ( x) является действительным знаком для действительного x и x 0 в R n (он же многомерный метод Лапласа), то
Ind ( - S Икс Икс ( Икс 0 ) ) знак равно 0. {\ displaystyle {\ text {Ind}} \ left (-S_ {xx} '' (x ^ {0}) \ right) = 0.}
  • Если S ( x) чисто мнимый для действительного x (т. Е. Для всех x в R n) и x 0 в R n (также известный как метод многомерной стационарной фазы), то ( S ( Икс ) ) знак равно 0 {\ Displaystyle \ Re (S (х)) = 0}
Ind ( - S Икс Икс ( Икс 0 ) ) знак равно π 4 подписать  S Икс Икс ( Икс 0 ) , {\ displaystyle {\ text {Ind}} \ left (-S_ {xx} '' (x ^ {0}) \ right) = {\ frac {\ pi} {4}} {\ text {sign}} S_ {xx} '' (x_ {0}),}
где обозначает сигнатуру матрицы, равную количеству отрицательных собственных значений минус количество положительных. Примечательно, что в приложениях метода стационарной фазы к многомерному ВКБ-приближению в квантовой механике (а также в оптике) Ind связан с индексом Маслова, см., Например, Chaichian amp; Demichev (2001) и Schulman (2005). подписать  S Икс Икс ( Икс 0 ) {\ displaystyle {\ text {sign}} S_ {xx} '' (x_ {0})} S Икс Икс ( Икс 0 ) {\ displaystyle S_ {xx} '' (x_ {0})}
Случай кратных невырожденных седловых точек

Если функция S ( x) имеет несколько изолированных невырожденных седловых точек, т. Е.

S ( Икс ( k ) ) знак равно 0 , Det S Икс Икс ( Икс ( k ) ) 0 , Икс ( k ) Ω Икс ( k ) , {\ displaystyle \ nabla S \ left (x ^ {(k)} \ right) = 0, \ quad \ det S '' _ {xx} \ left (x ^ {(k)} \ right) \ neq 0, \ quad x ^ {(k)} \ in \ Omega _ {x} ^ {(k)},}

куда

{ Ω Икс ( k ) } k знак равно 1 K {\ displaystyle \ left \ {\ Omega _ {x} ^ {(k)} \ right \} _ {k = 1} ^ {K}}

приведено открытое покрытие из Ом х, то вычисление интегральной асимптотики сводятся к случаю одной седловой точки посредством использования разбиения единицы. Разбиение единицы позволяет построить множество непрерывных функций р к ( х): Ω х → [0, 1], 1 ≤ K ≤ K, такой, что

k знак равно 1 K ρ k ( Икс ) знак равно 1 , Икс Ω Икс , ρ k ( Икс ) знак равно 0 Икс Ω Икс Ω Икс ( k ) . {\ displaystyle {\ begin {align} \ sum _ {k = 1} ^ {K} \ rho _ {k} (x) amp; = 1, amp;amp; \ forall x \ in \ Omega _ {x}, \\\ rho _ {k} (x) amp; = 0 amp;amp; \ forall x \ in \ Omega _ {x} \ setminus \ Omega _ {x} ^ {(k)}. \ end {align}}}

Откуда,

я Икс Ω Икс ж ( Икс ) е λ S ( Икс ) d Икс k знак равно 1 K я Икс Ω Икс ρ k ( Икс ) ж ( Икс ) е λ S ( Икс ) d Икс . {\ displaystyle \ int _ {I_ {x} \ subset \ Omega _ {x}} f (x) e ^ {\ lambda S (x)} dx \ Equiv \ sum _ {k = 1} ^ {K} \ int _ {I_ {x} \ subset \ Omega _ {x}} \ rho _ {k} (x) f (x) e ^ {\ lambda S (x)} dx.}

Следовательно, при λ → ∞ имеем:

k знак равно 1 K окрестности  Икс ( k ) ж ( Икс ) е λ S ( Икс ) d Икс знак равно ( 2 π λ ) п 2 k знак равно 1 K е λ S ( Икс ( k ) ) ( Det ( - S Икс Икс ( Икс ( k ) ) ) ) - 1 2 ж ( Икс ( k ) ) , {\ displaystyle \ sum _ {k = 1} ^ {K} \ int _ {{\ text {окрестность}} x ^ {(k)}} f (x) e ^ {\ lambda S (x)} dx = \ left ({\ frac {2 \ pi} {\ lambda}} \ right) ^ {\ frac {n} {2}} \ sum _ {k = 1} ^ {K} e ^ {\ lambda S \ left (x ^ {(k)} \ right)} \ left (\ det \ left (-S_ {xx} '' \ left (x ^ {(k)} \ right) \ right) \ right) ^ { - {\ frac {1} {2}}} f \ left (x ^ {(k)} \ right),}

где уравнение (13) использовалось на последнем этапе, а предэкспоненциальная функция f  ( x) по крайней мере должна быть непрерывной.  

Остальные случаи

Когда ∇ S ( z 0) = 0 и, точка z 0 ∈ C n называется вырожденной седловой точкой функции S ( z). Det S z z ( z 0 ) знак равно 0 {\ Displaystyle \ Det S '' _ {zz} (z ^ {0}) = 0}

Вычисление асимптотики

ж ( Икс ) е λ S ( Икс ) d Икс , {\ Displaystyle \ int е (х) е ^ {\ лямбда S (х)} dx,}

когда λ → ∞, функция   f  ( x) непрерывна и S ( z) имеет вырожденную седловую точку, это очень сложная задача, решение которой во многом опирается на теорию катастроф. Здесь теория катастроф заменяет лемму Морса, справедливую только в невырожденном случае, для преобразования функции S ( z) в одно из множества канонических представлений. Подробнее см., Например, Poston amp; Stewart (1978) и Fedoryuk (1987).

Интегралы с вырожденными седловыми точками естественным образом появляются во многих приложениях, включая оптические каустики и многомерное ВКБ-приближение в квантовой механике.

Другие случаи, такие как, например, f  ( x) и / или S ( x), являются разрывными или когда экстремум S ( x) находится на границе области интеграции, требуют особой осторожности (см., Например, Fedoryuk (1987) и Вонг (1989)).  

Расширения и обобщения

Расширением метода наискорейшего спуска является так называемый метод нелинейной стационарной фазы / наискорейшего спуска. Здесь вместо интегралов необходимо асимптотически оценивать решения задач факторизации Римана – Гильберта.

Учитывая контур C в комплексной сфере, функцию f, определенную на этом контуре и особую точку, скажем бесконечность, ищется функция M, голоморфная вдали от контура C, с заданным скачком через C и с заданной нормализацией на бесконечности. Если f и, следовательно, M являются матрицами, а не скалярами, это проблема, которая, как правило, не допускает явного решения.

Тогда возможна асимптотическая оценка в соответствии с методом линейной стационарной фазы / наискорейшего спуска. Идея состоит в том, чтобы асимптотически свести решение данной проблемы Римана – Гильберта к решению более простой, явно решаемой проблемы Римана – Гильберта. Теорема Коши используется для обоснования деформаций контура скачка.

Нелинейная стационарная фаза была введена Дейфтом и Чжоу в 1993 году на основе более ранней работы русского математика Александра Итца. (Собственно говоря) нелинейный метод наискорейшего спуска был введен Камвиссисом, К. Маклафлином и П. Миллером в 2003 году на основе предыдущей работы Лакса, Левермора, Дейфта, Венакидеса и Чжоу. Как и в линейном случае, контуры наискорейшего спуска решают задачу минимума-максимума. В нелинейном случае они оказываются «S-образными кривыми» (определенными в другом контексте еще в 80-х годах Шталем, Гончаром и Рахмановым).

Метод нелинейной стационарной фазы / наискорейшего спуска имеет приложения к теории солитонных уравнений и интегрируемым моделям, случайным матрицам и комбинаторике.

Смотрите также
Примечания
использованная литература
  • Чайчян, М.; Демичев А. (2001), Интегралы по траекториям в физике, том 1: Стохастический процесс и квантовая механика, Тейлор и Фрэнсис, с. 174, ISBN   075030801X
  • Дебай, П. (1909), "Näherungsformeln für die Zylinderfunktionen für große Werte des Arguments und unbeschränkt veränderliche Werte des Index", Mathematische Annalen, 67 (4): 535–558, doi : 10.1007 / BF01450097 Английский перевод в Дебай, Питер Дж. У. (1954), Сборник статей Питера Дж. В. Дебая, Interscience Publishers, Inc., Нью-Йорк, ISBN   978-0-918024-58-9, Руководство по ремонту   0063975
  • Deift, P.; Чжоу, X. (1993), "Метод наискорейшего спуска для осцилляторных задач Римана-Гильберта. Асимптотика для уравнения MKdV", Ann. математики., Анналы математики, Vol. 137, No. 2, 137 (2), стр. 295–368, arXiv : math / 9201261, doi : 10.2307 / 2946540, JSTOR   2946540.
  • Эрдели А. (1956), Асимптотические разложения, Дувр..
  • Федорюк, М.В. (2001) [1994], "Метод перевала", Энциклопедия математики, EMS Press.
  • Федорюк М. В. Асимптотика: интегралы и ряды, Наука, М., 1987. [на русском].
  • Kamvissis, S.; McLaughlin, KT-R.; Миллер, П. (2003), "Полуклассические солитонные ансамбли для фокусирующего нелинейного уравнения Шредингера", Annals of Mathematics Studies, Princeton University Press, 154.
  • Риман, Б. (1863), Sullo svolgimento del quoziente di due serie ipergeometriche in frazione contina infinita (Неопубликованная заметка, воспроизведенная в сборнике статей Римана.)
  • Siegel, CL (1932), "Uber Riemanns Nachlaß zur analytischen Zahlentheorie", Quellen und Studien zur Geschichte der Mathematik, Astronomie und Physik, 2: 45–80Перепечатано в Gesammelte Abhandlungen, Vol. 1. Берлин: Springer-Verlag, 1966.
    • Переведено на Deift, Перси; Чжоу, Синь (2018), «О Riemanns Nachlass для аналитической теории чисел: перевод Uber Зигеля», arXiv : 1810.05198 [ math.HO ].
  • Постон, Т.; Стюарт И. (1978), Теория катастроф и ее приложения, Pitman.
  • Шульман, LS (2005), "Глава 17: Фаза квазиклассической амплитуды", Методы и приложения интеграции путей, Дувр, ISBN   0486445283
  • Вонг Р. (1989), Асимптотические приближения интегралов, Academic Press.
Последняя правка сделана 2024-01-02 08:40:26
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте