Теорема Канторовича

редактировать
Начальные условия, обеспечивающие сходимость метода Ньютона

Теорема Канторовича, или теорема Ньютона – Канторовича, представляет собой математическое утверждение о полулокальной сходимости метода метода Ньютона. Впервые это было сформулировано Леонидом Канторовичем в 1948 году. Оно похоже на форму теоремы Банаха о неподвижной точке, хотя и утверждает существование и единственность нуля вместо фиксированной точки.

Метод Ньютона строит последовательность точек, которая при определенных условиях сходится к решению x {\ displaystyle x}x уравнения f (x) = 0 {\ displaystyle f (x) = 0}f (x) = 0 или векторное решение системы уравнений F (x) = 0 {\ displaystyle F (x) = 0}F (x) = 0 . Теорема Канторовича дает условия на начальную точку этой последовательности. Если эти условия выполнены, то решение существует близко к начальной точке, и последовательность сходится к этой точке.

Содержание
  • 1 Допущения
  • 2 Утверждение
  • 3 Следствие
  • 4 Обобщения
  • 5 Приложения
  • 6 Ссылки
  • 7 Дополнительная литература
Допущения

Пусть X ⊂ R n {\ displaystyle X \ subset \ mathbb {R} ^ {n}}X \ subset \ R ^ n быть открытым подмножеством и F: X ⊂ R n → R n {\ displaystyle F: X \ subset \ mathbb {R} ^ {n} \ to \ mathbb {R} ^ {n}}{\ displaystyle F: X \ subset \ mathbb {R} ^ {n} \ to \ mathbb {R} ^ {n}} a дифференцируемая функция с якобианом F '(x) {\ displaystyle F ^ {\ prime} (\ mathbf {x})}{\ displaystyle F ^ {\ prime} (\ mathbf {x})} , который локально непрерывный по липшицу (например, если F {\ displaystyle F}F дважды дифференцируемый). То есть предполагается, что для любого открытого подмножества U ⊂ X {\ displaystyle U \ subset X}U \ subset X существует константа L>0 {\ displaystyle L>0}L>0 такой, что для любого Икс, Y ∈ U {\ Displaystyle \ mathbf {x}, \ mathbf {y} \ in U}\ mathbf x, \ mathbf y \ in U

‖ F ′ (x) - F ′ (y) ‖ ≤ L ‖ x - y ‖ { \ Displaystyle \ | F '(\ mathbf {x}) -F' (\ mathbf {y}) \ | \ leq L \; \ | \ mathbf {x} - \ mathbf {y} \ |}\|F'(\mathbf x)-F'(\mathbf y)\|\le L\;\|\mathbf x-\mathbf y\|

удерживает. Норма слева - это некоторая операторная норма, совместимая с векторной нормой справа. Это неравенство можно переписать, чтобы использовать только векторную норму. Тогда для любого вектора v ∈ R n {\ displaystyle \ mathbf { v} \ in \ mathbb {R} ^ {n}}{\ displaystyle \ mathbf {v} \ in \ mathbb {R} ^ {n}} выполняется неравенство

‖ F ′ (x) (v) - F ′ (y) (v) ‖ ≤ L ‖ x - y ‖ ‖ V ‖ {\ displaystyle \ | F '(\ mathbf {x}) (\ mathbf {v}) -F' (\ mathbf {y}) (\ mathbf {v}) \ | \ leq L \; \ | \ mathbf {x} - \ mathbf {y} \ | \, \ | \ mathbf {v} \ |}{\displaystyle \|F'(\mathbf {x})(\mathbf {v})-F'(\mathbf {y})(\mathbf {v})\|\leq L\;\|\mathbf {x} -\mathbf {y} \|\,\|\mathbf {v} \|}

должен держать.

Теперь выберите любую начальную точку x 0 ∈ X {\ displaystyle \ mathbf {x} _ {0} \ in X}\ mathbf x_0 \ in X . Предположим, что F ′ (x 0) {\ displaystyle F '(\ mathbf {x} _ {0})}F'(\mathbf x_0)обратимо, и построим шаг Ньютона h 0 = - F ′ (x 0) - 1 F (x 0). {\ displaystyle \ mathbf {h} _ {0} = - F '(\ mathbf {x} _ {0}) ^ {- 1} F (\ mathbf {x} _ {0}).}\mathbf h_0=-F'(\mathbf x_0)^{-1}F(\mathbf x_0).

следующее предположение состоит в том, что не только следующая точка x 1 = x 0 + h 0 {\ displaystyle \ mathbf {x} _ {1} = \ mathbf {x} _ {0} + \ mathbf {h} _ { 0}}\ mathbf x_1 = \ mathbf x_0 + \ mathbf h_0 , но весь мяч B (x 1, ‖ h 0 ‖) {\ displaystyle B (\ mathbf {x} _ {1}, \ | \ mathbf {h} _ { 0} \ |)}B (\ mathbf x_1, \ | \ mathbf h_0 \ |) содержится внутри набора X {\ displaystyle X}X . Пусть M ≤ L {\ displaystyle M \ leq L}M \ le L - константа Липшица для якобиана над этим шаром.

В качестве последней подготовки постройте рекурсивно, насколько это возможно, последовательности (xk) k {\ displaystyle (\ mathbf {x} _ {k}) _ {k}}(\ mathbf x_k) _k , (hk) к {\ displaystyle (\ mathbf {h} _ {k}) _ {k}}(\ mathbf h_k) _k , (α k) k {\ displaystyle (\ alpha _ {k}) _ {k}}(\ alpha_k) _k согласно

hk = - F ′ (xk) - 1 F (xk) α k = M ‖ F ′ (xk) - 1 ‖ ‖ hk ‖ xk + 1 = xk + hk. {\ displaystyle {\ begin {alignat} {2} \ mathbf {h} _ {k} = - F '(\ mathbf {x} _ {k}) ^ {- 1} F (\ mathbf {x} _ {k}) \\ [0.4em] \ alpha _ {k} = M \, \ | F '(\ mathbf {x} _ {k}) ^ {- 1} \ | \, \ | \ mathbf { h} _ {k} \ | \\ [0.4em] \ mathbf {x} _ {k + 1} = \ mathbf {x} _ {k} + \ mathbf {h} _ {k}. \ end { alignat}}}{\displaystyle {\begin{alignedat}{2}\mathbf {h} _{k}=-F'(\mathbf {x} _{k})^{-1}F(\mathbf {x} _{k})\\[0.4em]\alpha _{k}=M\,\|F'(\mathbf {x} _{k})^{-1}\|\,\|\mathbf {h} _{k}\|\\[0.4em]\mathbf {x} _{k+1}=\mathbf {x} _{k}+\mathbf {h} _{k}.\end{alignedat}}}
Оператор

Теперь, если α 0 ≤ 1 2 {\ displaystyle \ alpha _ {0} \ leq {\ tfrac {1} {2}}}\ alpha_0 \ le \ tfrac12 , затем

  1. решение x ∗ {\ displaystyle \ mathbf {x} ^ {*}}\ mathbf x ^ * из F (x ∗) = 0 {\ displaystyle F (\ mathbf {x} ^ {*}) = 0}F (\ mathbf x ^ *) = 0 существует внутри замкнутого шара B ¯ (x 1, ‖ h 0 ‖) {\ displaystyle {\ bar {B}} (\ mathbf { x} _ {1}, \ | \ mathbf {h} _ {0} \ |)}\ bar B (\ mathbf x_1, \ | \ mathbf h_0 \ |) и
  2. итерация Ньютона, начиная с x 0 {\ displaystyle \ mathbf {x} _ {0}}\ mathbf x_0 сходится к x ∗ {\ displaystyle \ mathbf {x} ^ {*}}\ mathbf x ^ * как минимум с линейным порядком сходимости.

В более точном, но немного более сложном для доказательства утверждении используются корни t ∗ ≤ t ∗ ∗ {\ displaystyle t ^ {\ ast} \ leq t ^ {**}}t ^ \ ast \ le t ^ {**} из квадратичный полином al

п (t) = (1 2 L ‖ F ′ (x 0) - 1 ‖ - 1) t 2 - t + ‖ час 0 ‖ {\ displaystyle p (t) = \ left ({\ tfrac { 1} {2}} L \ | F '(\ mathbf {x} _ {0}) ^ {- 1} \ | ^ {- 1} \ right) t ^ {2} -t + \ | \ mathbf {h } _ {0} \ |} p(t) =\left(\tfrac12L\|F'(\mathbf x_0)^{-1}\|^{-1}\right)t^2 -t+\|\mathbf h_0\| ,
t ∗ / ∗ ∗ = 2 ‖ час 0 ‖ 1 ± 1-2 α {\ displaystyle t ^ {\ ast / **} = {\ frac {2 \ | \ mathbf {h} _ {0} \ |} {1 \ pm {\ sqrt {1-2 \ alpha}}}}}t ^ {\ ast / **} = \ frac {2 \ | \ mathbf h_0 \ |} {1 \ pm \ sqrt {1-2 \ alpha}}

и их соотношение

θ = t ∗ t ∗ ∗ = 1 - 1 - 2 α 1 + 1 - 2 α. {\ displaystyle \ theta = {\ frac {t ^ {*}} {t ^ {**}}} = {\ frac {1 - {\ sqrt {1-2 \ alpha}}} {1 + {\ sqrt {1-2 \ alpha}}}}.}\ theta = \ frac {t ^ *} {t ^ {**}} = \ frac {1- \ sqrt {1-2 \ alpha}} {1+ \ sqrt {1-2 \ alpha} }}.

Тогда

  1. решение x ∗ {\ displaystyle \ mathbf {x} ^ {*}}\ mathbf x ^ * существует внутри замкнутого шара В ¯ (Икс 1, θ ‖ час 0 ‖) ⊂ B ¯ (x 0, t ∗) {\ displaystyle {\ bar {B}} (\ mathbf {x} _ {1}, \ theta \ | \ mathbf {h} _ {0} \ |) \ subset {\ bar {B}} (\ mathbf {x} _ {0}, t ^ {*})}\ bar B (\ mathbf x_1, \ theta \ | \ mathbf h_0 \ |) \ subset \ bar B (\ mathbf x_0, t ^ *)
  2. он уникален внутри большего шара B (x 0, t ∗ ∗) {\ displaystyle B (\ mathbf {x} _ {0}, t ^ {* \ ast})}B (\ mathbf x_0, t ^ {* \ ast})
  3. и сходимость к решению F { \ displaystyle F}F определяется сходимостью итерации Ньютона квадратного многочлена p (t) {\ displaystyle p (t)}p (t) к его наименьшему корню t ∗ {\ displaystyle t ^ {\ ast}}t^\ast, если t 0 = 0, tk + 1 = tk - p (tk) p ′ (tk) {\ displaystyle t_ {0 } = 0, \, t_ {k + 1} = t_ {k} - {\ tfrac {p (t_ {k})} {p '(t_ {k})}}}t_0=0,\,t_{k+1}=t_k-\tfrac{p(t_k)}{p'(t_k)}, тогда
    xk + p - xk ‖ ≤ tk + p - tk. {\ displaystyle \ | \ mathbf {x} _ {k + p} - \ mathbf {x} _ {k} \ | \ leq t_ {k + p} -t_ {k}.}\ | \ mathbf x_ {k + p} - \ mathbf x_k \ | \ le t_ {k + p} -t_k.
  4. Квадратичная сходимость полученная из оценки погрешности
    ‖ xn + 1 - x ∗ ‖ ≤ θ 2 n ‖ xn + 1 - xn ‖ ≤ θ 2 n 2 n ‖ h 0 ‖. {\ displaystyle \ | \ mathbf {x} _ {n + 1} - \ mathbf {x} ^ {*} \ | \ leq \ theta ^ {2 ^ {n}} \ | \ mathbf {x} _ {n +1} - \ mathbf {x} _ {n} \ | \ leq {\ frac {\ theta ^ {2 ^ {n}}} {2 ^ {n}}} \ | \ mathbf {h} _ {0 } \ |.}\ | \ mathbf x_ {n + 1} - \ mathbf x ^ * \ | \ le \ theta ^ {2 ^ n} \ | \ mathbf x_ {n + 1} - \ mathbf x_n \ | \ le \ frac {\ theta ^ {2 ^ n}} {2 ^ n} \ | \ mathbf h_0 \ |.
Следствие

В 1986 году Ямамото доказал, что оценки ошибок метода Ньютона, такие как Doring (1969), Ostrowski (1971, 1973), Gragg-Tapia (1974), Potra -Ptak (1980), Miel (1981), Potra (1984) могут быть выведены из теоремы Канторовича.

Обобщения

Существует q-аналог для теорема Канторовича. Другие обобщения / варианты см. В Ortega Rheinboldt (1970).

Приложения

Оиши и Танабе утверждали, что теорему Канторовича можно применить для получения надежных решений линейного программирования.

Ссылки
Дополнительная литература
  • Джон Хаббард и Барбара Берк Хаббард: векторное исчисление, линейная алгебра и дифференциальные формы: унифицированный подход, выпуски матриц, ISBN 978-0-9715766-3-6 (предварительный просмотр 3. издания и образцы материалов, включая Kant.-thm. )
  • Ямамото, Тетсуро (2001). «Исторические достижения в анализе сходимости для Ньютона. и ньютоноподобные методы ». In Brezinski, C.; Wuytack, L. (eds.). Numerical Analysis: Historical Developments in 20 Century. North-Holland. pp. 241–263. ISBN 0-444-50617-9.
Последняя правка сделана 2021-05-25 11:43:46
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте