Теорема о неявной функции

редактировать
Преобразование отношений в функции нескольких вещественных переменных

В математике, более конкретно в исчислении с несколькими переменными, теорема о неявной функции - это инструмент, который позволяет преобразовывать отношения в функции нескольких вещественных переменных. Это достигается путем представления отношения в виде графика функции. Может не быть единственной функции, график которой может представлять все отношение, но такая функция может существовать в ограничении области отношения. Теорема о неявной функции дает достаточное условие, чтобы гарантировать, что такая функция существует.

Точнее, учитывая систему m уравнений f i(x1,..., x n, y 1,..., y m) = 0, i = 1,..., m (часто сокращенно F (x, y) = 0), теорема утверждает, что при мягком условии на частных производных (относительно y i s) в точке, m переменных y i являются дифференцируемыми функциями x j в некоторой окрестности по сути. Поскольку эти функции, как правило, не могут быть выражены в закрытой форме, они неявно определяются уравнениями, и это послужило причиной названия теоремы.

Другими словами, при мягком условии на частные производные, набор нулей системы уравнений - это локально график функции.

Содержание

  • 1 История
  • 2 Первый пример
  • 3 Определения
  • 4 Формулировка теоремы
    • 4.1 Высшие производные
  • 5 Доказательство для двумерного случая
  • 6 Пример круга
  • 7 Применение: изменение координат
    • 7.1 Пример: полярный координаты
  • 8 Обобщения
    • 8.1 Версия в банаховом пространстве
    • 8.2 Неявные функции из недифференцируемых функций
  • 9 См. также
  • 10 Ссылки
  • 11 Дополнительная литература

История

Августин- Луи Коши (1789–1857) приписывают первую строгую форму теоремы о неявной функции. Улисс Дини (1845–1918) обобщил версию теоремы о неявных функциях для вещественных переменных на контекст функций любого числа действительных переменных.

Первый пример

Единичный круг может быть задан как линия уровня f (x, y) = 1 функции f (x, y) = x 2 + y 2. {\ displaystyle f (x, y) = x ^ {2} + y ^ {2}.}{\ displaystyle f (x, y) = x ^ {2} + y ^ {2}.} Около точки A y может быть выражено как функция y (x). В этом примере эту функцию можно явно записать как g 1 (x) = 1 - x 2; {\ displaystyle g_ {1} (x) = {\ sqrt {1-x ^ {2}}};}{\ displaystyle g_ {1} (x) = {\ sqrt {1- x ^ {2}}};} во многих случаях такого явного выражения не существует, но все же можно ссылаться на неявную функцию у (х). Такой функции не существует около точки B.

Если мы определим функцию f (x, y) = x 2 + y 2 {\ displaystyle f (x, y) = x ^ {2} + y ^ { 2}}f (x, y) = x ^ 2 + y ^ 2 , тогда уравнение f (x, y) = 1 вырезает единичный круг как набор уровней {(x, y) | f (x, y) = 1}. Невозможно представить единичный круг как график функции одной переменной y = g (x), потому что для каждого выбора x ∈ (−1, 1) есть два варианта y, а именно ± 1 - x 2 {\ displaystyle \ pm {\ sqrt {1-x ^ {2}}}}\ pm \ sqrt {1-x ^ 2} .

Однако можно представить часть круга как график функции одной переменной. Если мы положим g 1 (x) = 1 - x 2 {\ displaystyle g_ {1} (x) = {\ sqrt {1-x ^ {2}}}}g_1 (x) = \ sqrt {1-x ^ 2} для −1 ≤ x ≤ 1, то график y = g 1 (x) {\ displaystyle y = g_ {1} (x)}y = g_1 (x) дает верхнюю половину круга. Аналогично, если g 2 (x) = - 1 - x 2 {\ displaystyle g_ {2} (x) = - {\ sqrt {1-x ^ {2}}}}g_2 (x) = - \ sqrt {1-x ^ 2} , тогда график y = g 2 (x) {\ displaystyle y = g_ {2} (x)}y = g_2 (x) дает нижнюю половину круга.

Цель теоремы о неявной функции - сообщить нам о существовании таких функций, как g 1 (x) {\ displaystyle g_ {1} (x)}g_1 (x) и g 2 (x) {\ displaystyle g_ {2} (x)}g_2 (x) , даже в ситуациях, когда мы не можем записать явные формулы. Он гарантирует, что g 1 (x) {\ displaystyle g_ {1} (x)}g_1 (x) и g 2 (x) {\ displaystyle g_ {2} (x)}g_2 (x) дифференцируемы, и это работает даже в ситуациях, когда у нас нет формулы для f (x, y).

Определения

Пусть f: R n + m → R m {\ displaystyle f: \ mathbb {R} ^ {n + m} \ to \ mathbb {R} ^ {m}}{\ displaystyle f: \ mathbb {R} ^ {n + m} \ to \ mathbb {R} ^ {m}} быть непрерывно дифференцируемой функцией. Мы думаем о R n + m {\ displaystyle \ mathbb {R} ^ {n + m}}{\ displaystyle \ mathbb {R} ^ {n + m}} как о декартовом произведении R n × R m, {\ displaystyle \ mathbb {R} ^ {n} \ times \ mathbb {R} ^ {m},}{\ displaystyle \ mathbb {R} ^ {n} \ times \ mathbb {R} ^ {m},} и запишем точку этого продукта как (x, y) = ( x 1,…, xn, y 1,… ym). {\ displaystyle (\ mathbf {x}, \ mathbf {y}) = (x_ {1}, \ ldots, x_ {n}, y_ {1}, \ ldots y_ {m}).}{\ displaystyle (\ mathbf {x}, \ mathbf {y}) = (x_ {1}, \ ldots, x_ {n}, y_ {1}, \ ldots y_ {m}).} Начиная с заданной функции f, наша цель - построить функцию g: R n → R m {\ displaystyle g: \ mathbb {R} ^ {n} \ to \ mathbb {R} ^ {m} }{\ displaystyle g: \ mathbb {R} ^ {n} \ to \ mathbb {R} ^ {m}} , график которого (x, g (x )) является в точности набором всех (x, y) таких, что f (x, y) = 0.

Как отмечалось выше, это не всегда возможно. Поэтому мы зафиксируем точку (a, b) = (a 1,..., a n, b 1,..., b m), который удовлетворяет f (a, b) = 0, и мы запросим ag, который работает около точки (a, b). Другими словами, нам нужен открытый набор U ⊂ R n {\ displaystyle U \ subset \ mathbb {R} ^ {n}}{\ displaystyle U \ subset \ mathbb {R} ^ {n}} , содержащий a, открытое множество V ⊂ R m {\ displaystyle V \ subset \ mathbb {R} ^ {m}}{\ displaystyle V \ subset \ mathbb {R} ^ {m}} , содержащее b, и функция g: U → V такое, что график g удовлетворяет соотношению f = 0 на U × V, и что никакие другие точки в пределах U × V этого не делают. В символах

{(x, g (x)) ∣ x ∈ U} = {(x, y) ∈ U × V ∣ f (x, y) = 0}. {\ displaystyle \ {(\ mathbf {x}, g (\ mathbf {x})) \ mid \ mathbf {x} \ in U \} = \ {(\ mathbf {x}, \ mathbf {y}) \ in U \ times V \ mid f (\ mathbf {x}, \ mathbf {y}) = \ mathbf {0} \}.}{\ displaystyle \ {(\ mathbf {x}, g (\ mathbf {x})) \ mid \ mathbf {x} \ in U \} = \ {(\ mathbf {x}, \ mathbf {y}) \ in U \ times V \ mid f (\ mathbf {x}, \ mathbf {y}) = \ mathbf {0} \ }.}

Чтобы сформулировать теорему о неявной функции, нам понадобится матрица Якоби функции f, которая является матрицей частных производных функции f. Сокращение (a 1,..., a n, b 1,..., b m) до (a, b) матрица Якоби имеет вид

(D f) (a, b) = [∂ f 1 ∂ x 1 (a, b) ⋯ ∂ f 1 ∂ xn (a, b) ⋮ ⋱ ⋮ ∂ fm ∂ x 1 (a, b) ⋯ ∂ fm ∂ xn (a, b) | ∂ f 1 ∂ y 1 (a, b) ⋯ ∂ f 1 ∂ y m (a, b) ⋮ ⋱ ⋮ ∂ f m ∂ y 1 (a, b) ⋯ ∂ f m ∂ y m (a, b)] = [X | Y] {\ displaystyle (Df) (\ mathbf {a}, \ mathbf {b}) = \ left [{\ begin {matrix} {\ frac {\ partial f_ {1}} {\ partial x_ {1}} } (\ mathbf {a}, \ mathbf {b}) \ cdots {\ frac {\ partial f_ {1}} {\ partial x_ {n}}} (\ mathbf {a}, \ mathbf {b}) \\\ vdots \ ddots \ vdots \\ {\ frac {\ partial f_ {m}} {\ partial x_ {1}}} (\ mathbf {a}, \ mathbf {b}) \ cdots {\ frac {\ partial f_ {m}} {\ partial x_ {n}}} (\ mathbf {a}, \ mathbf {b}) \ end {matrix}} \ right | \ left. {\ begin {matrix } {\ frac {\ partial f_ {1}} {\ partial y_ {1}}} (\ mathbf {a}, \ mathbf {b}) \ cdots {\ frac {\ partial f_ {1}} { \ partial y_ {m}}} (\ mathbf {a}, \ mathbf {b}) \\\ vdots \ ddots \ vdots \\ {\ frac {\ partial f_ {m}} {\ partial y_ {1 }}} (\ mathbf {a}, \ mathbf {b}) \ cdots {\ frac {\ partial f_ {m}} {\ partial y_ {m}}} (\ mathbf {a}, \ mathbf { b}) \\\ end {matrix}} \ right] = [X | Y]}{\ displaystyle (Df) (\ mathbf {a}, \ mathbf {b}) = \ left [{\ begin {matrix} {\ frac {\ partial f_ {1}} {\ partial x_ {1}}} ( \ mathbf {a}, \ mathbf {b}) \ cdots {\ frac {\ partial f_ {1}} {\ partial x_ {n}}} (\ mathbf {a}, \ mathbf {b}) \ \\ vdots \ ddots \ vdots \\ {\ frac {\ partial f_ {m}} {\ partial x_ {1}}} (\ mathbf {a}, \ mathbf {b}) \ cdots {\ frac {\ partial f_ {m}} {\ partial x_ {n}}} (\ mathbf {a}, \ mathbf {b}) \ end {matrix}} \ right | \ left. {\ begin {matrix} {\ frac {\ partial f_ {1}} {\ partial y_ {1}}} (\ mathbf {a}, \ mathbf {b}) \ cdots {\ frac {\ partial f_ {1}} {\ partial y_ {m}}} (\ mathbf {a}, \ mathbf {b}) \\\ vdots \ ddots \ vdots \\ {\ frac {\ partial f_ {m}} {\ partial y_ {1}}} (\ mathbf {a}, \ mathbf {b}) \ cdots {\ frac {\ partial f_ { m}} {\ partial y_ {m}}} (\ mathbf {a}, \ mathbf {b}) \\\ end {matrix}} \ right] = [X | Y]}

где X - матрица частных производных от переменных x i, а Y - матрица частичных производные по переменным y j. Теорема о неявной функции гласит, что если Y - обратимая матрица, то есть U, V и g по желанию. Запись всех гипотез вместе дает следующее утверждение.

Формулировка теоремы

Пусть f: R n + m → R m {\ displaystyle f: \ mathbb {R} ^ {n + m} \ to \ mathbb { R} ^ {m}}{\ displaystyle f: \ mathbb {R} ^ {n + m} \ to \ mathbb {R} ^ {m}} будет непрерывно дифференцируемой функцией, и пусть R n + m {\ displaystyle \ mathbb {R} ^ {n + m}}{\ displaystyle \ mathbb {R} ^ {n + m}} имеют координаты (x, y). Зафиксируйте точку (a, b) = (a 1,..., a n, b 1,..., b m) с f (a, b) = 0, где 0 ∈ R m {\ displaystyle \ mathbf {0} \ in \ mathbb {R} ^ {m}}{\ displaystyle \ mathbf {0} \ in \ mathbb {R} ^ {m} } - нулевой вектор. Если матрица Якоби (это правая панель матрицы Якоби, показанной в предыдущем разделе):

J f, y (a, b) = [∂ fi ∂ yj (a, б)] {\ Displaystyle J_ {е, \ mathbf {y}} (\ mathbf {a}, \ mathbf {b}) = \ left [{\ frac {\ partial f_ {i}} {\ partial y_ {j }}} (\ mathbf {a}, \ mathbf {b}) \ right]}{\ displaystyle J_ {f, \ mathbf {y}} (\ mathbf {a}, \ mathbf {b}) = \ left [{\ frac {\ partial f_ {i}} {\ partial y_ {j}}} (\ mathbf {a}, \ mathbf {b}) \ right]}

обратимый, тогда существует открытое множество U ⊂ R n {\ displaystyle U \ подмножество \ mathbb {R} ^ {n}}{\ displaystyle U \ subset \ mathbb {R} ^ {n}} , содержащее a такое, что существует уникальная непрерывно дифференцируемая функция g: U → R m {\ displaystyle g: U \ в \ mathbb {R} ^ {m}}{\ displaystyle g: U \ to \ mathbb {R} ^ {m}} так, что

g (a) = b {\ displaystyle g (\ mathbf {a}) = \ mathbf {b}}{\ displaystyle г (\ mathbf {a}) = \ mathbf {b}}

и

f (x, g (x)) = 0 для всех x ∈ U. {\ displaystyle f (\ mathbf {x}, g (\ mathbf {x})) = \ mathbf {0} \ quad {\ text {для всех}} \ quad \ mathbf {x} \ in U.}{\ displaystyle f (\ mathbf {x}, g (\ mathbf {x})) = \ mathbf {0} \ quad {\ text {для всех}} \ quad \ mathbf { x} \ в U.}

Более того, частные производные g в U даются матричным произведением

∂ g ∂ xj (x) = - [J f, y (x, g (x))] m × m - 1 [∂ f ∂ xj (x, g (x))] м × 1. {\ displaystyle {\ frac {\ partial g} {\ partial x_ {j}}} (\ mathbf {x}) = - \ left [J_ {f, \ mathbf {y}} (\ mathbf {x}, g (\ mathbf {x})) \ right] _ {m \ times m} ^ {- 1} \ left [{\ frac {\ partial f} {\ partial x_ {j}}} (\ mathbf {x}, g (\ mathbf {x})) \ right] _ {m \ times 1}.}{\ displaystyle {\ f rac {\ partial g} {\ partial x_ {j}}} (\ mathbf {x}) = - \ left [J_ {f, \ mathbf {y}} (\ mathbf {x}, g (\ mathbf {x })) \ right] _ {m \ times m} ^ {- 1} \ left [{\ frac {\ partial f} {\ partial x_ {j}}} (\ mathbf {x}, g (\ mathbf { x})) \ right] _ {m \ times 1}.}

Старшие производные

Если, кроме того, f является аналитическим или непрерывно дифференцируемым k раз в окрестности (a, b), то можно выбрать U, чтобы то же самое было верно для g внутри U. В аналитическом случае это называется теоремой об аналитической неявной функции .

Доказательство для двумерного случая

Предположим, что F: R 2 → R {\ displaystyle F: \ mathbb {R} ^ {2} \ to \ mathbb {R}}{\ displaystyle F: \ mathbb {R} ^ {2} \ to \ mathbb {R}} - непрерывно дифференцируемая функция, определяющая кривая F (x, y) = 0. {\ displaystyle F (x, y) = 0.}{\ displaystyle F (x, y) = 0.} Пусть (x 0, y 0) {\ displaystyle (x_ { 0}, y_ {0})}(x_0, y_0) - точка на кривой. Утверждение теоремы выше для этого простого случая можно переписать следующим образом:

Если
∂ F ∂ y | (Икс 0, Y 0) ≠ 0 {\ Displaystyle \ left. {\ frac {\ partial F} {\ partial y}} \ right | _ {(x_ {0}, y_ {0})} \ neq 0}{ \ displaystyle \ left. {\ frac {\ partial F} {\ partial y}} \ right | _ {(x_ {0}, y_ {0})} \ neq 0}
тогда для кривой вокруг (x 0, y 0) {\ displaystyle (x_ {0}, y_ {0})}(x_0, y_0) мы можем написать y = f (x) {\ displaystyle y = f (x)}y = f (x) , где f {\ displaystyle f}f - вещественная функция.

Доказательство. Поскольку F - дифференцируемые, запишем дифференциал F через частные производные:

d F = grad ⁡ F ⋅ dx → = ∂ F ∂ xdx + ∂ F ∂ ydy. {\ displaystyle \ mathrm {d} F = \ operatorname {grad} F \ cdot \ mathrm {d} {\ vec {x}} = {\ partial F \ over \ partial x} \ mathrm {d} x + {\ partial F \ over \ partial y} \ mathrm {d} y.}{\ displaystyle \ mathrm {d} F = \ operatorname {grad} F \ cdot \ mathrm {d} {\ vec {x}} = {\ partial F \ over \ partial x } \ mathrm {d} x + {\ partial F \ over \ partial y} \ mathrm {d} y.}

Поскольку мы ограничены движением по кривой d F = 0 {\ displaystyle \ mathrm {d} F = 0}\ mathrm {d} F = 0 и по предположению ∂ F ∂ Y ≠ 0 {\ displaystyle {\ tfrac {\ partial F} {\ partial y}} \ neq 0}{\ displaystyle {\ tfrac {\ partial F} {\ partial y}} \ neq 0} вокруг точки (x 0, у 0). {\ displaystyle (x_ {0}, y_ {0}).}{\ displaystyle (x_ {0}, y_ {0}).} Следовательно, мы имеем обыкновенное дифференциальное уравнение первого порядка :

∂ x F dx + ∂ y F dy = 0, Y (Икс 0) знак равно Y 0 {\ Displaystyle \ partial _ {x} F \ mathrm {d} x + \ partial _ {y} F \ mathrm {d} y = 0, \ quad y (x_ {0}) = y_ {0}}{\ displaystyle \ partial _ {x} F \ mathrm {d} x + \ partial _ {y} F \ mathrm {d} y = 0, \ четырехъядерный y (x_ {0}) = y_ {0}}

Теперь мы ищем решение этого ODE в открытом интервале вокруг точки (x 0, y 0) {\ displaystyle (x_ {0}, y_ {0})}(x_0, y_0) , для которого в каждой точке ∂ y F ≠ 0 {\ displaystyle \ partial _ {y} F \ neq 0}{ \ displaystyle \ partial _ {y} F \ neq 0} . Поскольку F непрерывно дифференцируема и по предположению

| ∂ x F | < ∞, | ∂ y F | < ∞, ∂ y F ≠ 0. {\displaystyle |\partial _{x}F|<\infty,|\partial _{y}F|<\infty,\partial _{y}F\neq 0.}{\ displaystyle | \ partial _ {x} F | <\ infty, | \ partial _ {y} F | <\ infty, \ partial _ {y} F \ neq 0.}

Из этого мы знаем, что ∂ x F ∂ y F {\ displaystyle {\ tfrac {\ partial _ {x} F} {\ partial _ {y} F}}}{\ displaystyle {\ tfrac {\ partial _ {x} F} {\ partial _ {y} F}}} непрерывный и ограниченный с обоих концов. Отсюда мы знаем, что - ∂ x F ∂ y F {\ displaystyle - {\ tfrac {\ partial _ {x} F} {\ partial _ {y} F}}}{\ displaystyle - {\ tfrac {\ partial _ {x} F} {\ partial _ {y} F}}} липшицево непрерывна как по x, так и по y. Следовательно, по теореме Коши-Липшица существует единственное y (x), которое является решением данного ОДУ с начальными условиями.

Пример круга

Вернемся к примеру с единичной окружностью. В этом случае n = m = 1 и f (x, y) = x 2 + y 2 - 1 {\ displaystyle f (x, y) = x ^ {2} + y ^ {2} -1}f (x, y) = x ^ 2 + y ^ 2-1 . Матрица частных производных - это просто матрица размером 1 × 2, заданная формулой

(D f) (a, b) = [∂ f ∂ x (a, b) ∂ f ∂ y (a, b)] = [ 2 a 2 b] {\ displaystyle (Df) (a, b) = \ left [{\ frac {\ partial f} {\ partial x}} (a, b) \ \ {\ frac {\ partial f} { \ partial y}} (a, b) \ right] = [2a \ \ 2b]}{\ displaystyle (Df) (a, b) = \ left [{\ frac {\ partial f} {\ partial x}} (a, b) \ \ {\ frac {\ частичный f} {\ partial y}} (a, b) \ right] = [2a \ \ 2b]}

Таким образом, здесь Y в формулировке теоремы - это просто число 2b; линейное отображение, определяемое им, обратимо тогда и только тогда, когда b ≠ 0. По теореме о неявной функции мы видим, что мы можем локально записать окружность в форме y = g (x) для всех точек, где y ≠ 0. Для (± 1, 0) мы столкнемся с проблемой, как отмечалось ранее. Теорема о неявной функции все еще может быть применена к этим двум точкам, записав x как функцию от y, то есть x = h (y) {\ displaystyle x = h (y)}x = h (y) ; теперь график функции будет (h (y), y) {\ displaystyle \ left (h (y), y \ right)}\ l eft (час (y), y \ вправо) , поскольку где b = 0, мы имеем = 1, и условия локального выражения функции в таком виде выполнены.

Неявная производная y по x и производная x по y может быть найдена путем полного дифференцирования неявной функции x 2 + y 2 - 1 {\ displaystyle x ^ {2} + y ^ {2} -1}x ^ 2 + y ^ 2-1 и приравнивая к 0:

2 xdx + 2 ydy = 0, {\ displaystyle 2xdx + 2ydy = 0,}2x dx + 2y dy Знак равно 0,

, что дает

dy / dx = - x / y {\ displaystyle dy / dx = -x / y}dy / dx = -x / y

и

dx / dy = - y / x. {\ displaystyle dx / dy = -y / x.}dx / dy = -y / x.

Приложение: изменение координат

Предположим, у нас есть m-мерное пространство, параметризованное набором координат (x 1,…, xm) {\ displaystyle (x_ {1}, \ ldots, x_ {m})}(x_1, \ ldots, x_m) . Мы можем ввести новую систему координат (x 1 ′,…, xm ′) {\ displaystyle (x '_ {1}, \ ldots, x' _ {m})} (x'_1,\ldots,x'_m) , указав m функций h 1… hm {\ displaystyle h_ {1} \ ldots h_ {m}}h_1 \ ldots h_m , каждая из которых непрерывно дифференцируема. Эти функции позволяют нам вычислять новые координаты (x 1 ′,…, xm ′) {\ displaystyle (x '_ {1}, \ ldots, x' _ {m})} (x'_1,\ldots,x'_m) точки с учетом старых координат точки (x 1,…, xm) {\ displaystyle (x_ {1}, \ ldots, x_ {m})}(x_1, \ ldots, x_m) с использованием x 1 ′ = Час 1 (x 1,…, xm),…, xm ′ = hm (x 1,…, xm) {\ displaystyle x '_ {1} = h_ {1} (x_ {1}, \ ldots, x_ {m}), \ ldots, x '_ {m} = h_ {m} (x_ {1}, \ ldots, x_ {m})}{\displaystyle x'_{1}=h_{1}(x_{1},\ldots,x_{m}),\ldots,x'_{m}=h_{m}(x_{1},\ldots,x_{m})}. Можно проверить, возможно ли обратное: с учетом координат (x 1 ′,…, xm ′) {\ displaystyle (x '_ {1}, \ ldots, x' _ {m})} (x'_1,\ldots,x'_m) , можем ли мы «вернуться назад» и вычислить исходные координаты той же точки (x 1,…, xm) {\ displaystyle (x_ {1}, \ ldots, x_ {m})}(x_1, \ ldots, x_m) ? Теорема о неявной функции даст ответ на этот вопрос. (Новые и старые) координаты (x 1 ′,…, xm ′, x 1,…, xm) {\ displaystyle (x '_ {1}, \ ldots, x' _ {m}, x_ { 1}, \ ldots, x_ {m})}(x'_1,\ldots,x'_m, x_1,\ldots,x_m)связаны соотношением f = 0 с

f (x 1 ′,…, xm ′, x 1,…, xm) = (h 1 (x 1,…, xm) - x 1 ′,…, hm (x 1,…, xm) - xm ′). {\ displaystyle f (x '_ {1}, \ ldots, x' _ {m}, x_ {1}, \ ldots, x_ {m}) = (h_ {1} (x_ {1}, \ ldots, x_ {m}) - x '_ {1}, \ ldots, h_ {m} (x_ {1}, \ ldots, x_ {m}) - x' _ {m}).}{\displaystyle f(x'_{1},\ldots,x'_{m},x_{1},\ldots,x_{m})=(h_{1}(x_{1},\ldots,x_{m})-x'_{1},\ldots,h_{m}(x_{1},\ldots,x_{m})-x'_{m}).}

Теперь якобиан матрица f в определенной точке (a, b) [где a = (x 1 ′,…, xm ′), b = (x 1,…, xm) {\ displaystyle a = (x '_ { 1}, \ ldots, x '_ {m}), b = (x_ {1}, \ ldots, x_ {m})}a=(x'_1,\ldots,x'_m), b=(x_1,\ldots,x_m)] задается как

(D f) (a, б) = [- 1 ⋯ 0 ⋮ ⋱ ⋮ 0 ⋯ - 1 | ∂ h 1 ∂ x 1 (b) ⋯ ∂ h 1 ∂ x m (b) ⋮ ⋱ ⋮ ∂ h m ∂ x 1 (b) ⋯ ∂ h m ∂ x m (b)] = [- I m | J]. {\ displaystyle (Df) (a, b) = \ left [{\ begin {matrix} -1 \ cdots 0 \\\ vdots \ ddots \ vdots \\ 0 \ cdots -1 \ end {matrix}} \ left | {\ begin {matrix} {\ frac {\ partial h_ {1}} {\ partial x_ {1}}} (b) \ cdots {\ frac {\ partial h_ {1}} {\ partial x_ {m}}} (b) \\\ vdots \ ddots \ vdots \\ {\ frac {\ partial h_ {m}} {\ partial x_ {1}}} (b) \ cdots {\ frac {\ partial h_ {m}} {\ partial x_ {m}}} (b) \\\ end {matrix}} \ right. \ right] = [- I_ {m} | J].}{\ displaystyle (Df) (a, b) = \ left [{\ begin {matrix} -1 \ cdots 0 \\\ vdots \ ddots \ vdots \\ 0 \ cdots -1 \ end {matrix}} \ left | {\ begin {matrix} { \ frac {\ partial h_ {1}} {\ partial x_ {1}}} (b) \ cdots {\ frac {\ partial h_ {1}} {\ partial x_ {m}}} (b) \ \\ vdots \ ddots \ vdots \\ {\ frac {\ partial h_ {m}} {\ partial x_ {1}}} (b) \ cdots {\ frac {\ partial h_ {m}} { \ partial x_ {m}}} (b) \\\ end {matrix}} \ right. \ right] = [- I_ {m} | J].}

где I m обозначает единичную матрицу размера m × m , а J - матрица частных производных размера m × m, вычисленная в (a, b). (Выше эти блоки были обозначены X и Y. Как оказалось, в этом конкретном приложении теоремы ни одна матрица не зависит от a.) Теорема неявной функции теперь утверждает, что мы можем локально выразить (x 1,…, Xm) {\ displaystyle (x_ {1}, \ ldots, x_ {m})}(x_1, \ ldots, x_m) как функция от (x 1 ′,…, xm ′) {\ displaystyle ( x '_ {1}, \ ldots, x' _ {m})} (x'_1,\ldots,x'_m) , если J обратим. Требование обратимости J эквивалентно det J ≠ 0, таким образом, мы видим, что мы можем вернуться от координат со штрихом к координатам без штриха, если определитель якобиана J не равен нулю. Это утверждение также известно как теорема обратной функции.

Пример: полярные координаты

В качестве простого приложения вышеизложенного рассмотрим плоскость, параметризованную полярными координатами (R, θ). Мы можем перейти в новую систему координат (декартовы координаты ), определив функции x (R, θ) = R cos (θ) и y (R, θ) = R sin (θ). Это позволяет для любой точки (R, θ) найти соответствующие декартовы координаты (x, y). Когда мы можем вернуться и преобразовать декартовы координаты в полярные? В предыдущем примере достаточно, чтобы det J ≠ 0, причем

J = [∂ x (R, θ) ∂ R ∂ x (R, θ) ∂ θ ∂ y (R, θ) ∂ R ∂ y (R, θ) ∂ θ] = [cos ⁡ θ - R sin ⁡ θ sin ⁡ θ R cos ⁡ θ]. {\ Displaystyle J = {\ begin {bmatrix} {\ frac {\ partial x (R, \ theta)} {\ partial R}} {\ frac {\ partial x (R, \ theta)} {\ partial \ theta}} \\ {\ frac {\ partial y (R, \ theta)} {\ partial R}} {\ frac {\ partial y (R, \ theta)} {\ partial \ theta}} \\\ end {bmatrix}} = {\ begin {bmatrix} \ cos \ theta -R \ sin \ theta \\\ sin \ theta R \ cos \ theta \ end {bmatrix}}.}{\ displaystyle J = {\ begin {bmatrix} {\ frac {\ partial x (R, \ theta)} {\ partial R}} {\ frac {\ partial x (R, \ theta)} {\ partial \ theta}} \\ {\ frac {\ partial y (R, \ theta)} {\ partial R}} {\ frac {\ partial y (R, \ theta)} {\ partial \ theta}} \\\ end {bmatrix}} = {\ begin {bmatrix} \ cos \ theta -R \ sin \ theta \\\ sin \ theta R \ cos \ theta \ end {bmatrix}}.}

Поскольку det J = R, преобразование обратно в полярные координаты возможно, если R ≠ 0. Поэтому остается проверить случай R = 0. Легко видеть, что в случае R = 0 наше преобразование координат необратимо: в начале координат значение θ не определен точно.

Обобщения

версия для банаховых пространств

На основании теоремы об обратной функции в банаховых пространствах можно расширить Теорема о неявной функции для отображений со значениями в банаховом пространстве.

Пусть X, Y, Z являются банаховыми пространствами. Пусть отображение f: X × Y → Z непрерывно дифференцируемо по Фреше. Если (x 0, y 0) ∈ X × Y {\ displaystyle (x_ {0}, y_ {0}) \ in X \ times Y}(x_0, y_0) \ in X \ times Y , f (x 0, y 0) = 0 { \ Displaystyle f (x_ {0}, y_ {0}) = 0}f (x_ {0}, y_ {0}) = 0 и y ↦ D f (x 0, y 0) (0, y) {\ displaystyle y \ mapsto Df (x_ {0}, y_ {0}) (0, y)}y \ mapsto Df (x_0, y_0) (0, y) является изоморфизмом банахова пространства Y на Z, тогда существуют окрестности U точек x 0 и V y 0 и дифференцируемой по Фреше функции g: U → V такой, что f (x, g (x)) = 0 и f (x, y) = 0 тогда и только тогда, когда y = g (x) для всех (x, y) ∈ U × V {\ displaystyle (x, y) \ in U \ times V}(x, y) \ in U \ times V .

Неявные функции от недифференцируемых функций

Различные формы Теорема о неявной функции существует для случая, когда функция f не дифференцируема. Стандартно, что локальной строгой монотонности достаточно в одном измерении. Следующая более общая форма была доказана Кумагаем на основе наблюдения Джитторнтрума.

Рассмотрим непрерывную функцию f: R n × R m → R n {\ displaystyle f: R ^ {n} \ умножить на R ^ {m} \ to R ^ {n}}f: R ^ n \ times R ^ m \ to R ^ n так, чтобы f (x 0, y 0) = 0 {\ displaystyle f (x_ {0}, y_ {0}) = 0}f (x_ {0}, y_ {0}) = 0 . Существуют открытые окрестности A ⊂ R n {\ displaystyle A \ subset R ^ {n}}A \ subset R ^ n и B ⊂ R m {\ displaystyle B \ subset R ^ {m}}B \ subset R ^ m из x 0 и y 0, соответственно, такие, что для всех y в B f (⋅, y): A → R n { \ displaystyle f (\ cdot, y): A \ to R ^ {n}}f (\ cdot, y): от A \ к R ^ n локально взаимно однозначно тогда и только тогда, когда существуют открытые окрестности A 0 ⊂ R n {\ displaystyle A_ {0} \ subset R ^ {n}}A_0 \ subset R ^ n и B 0 ⊂ R m {\ displaystyle B_ {0} \ subset R ^ {m}}B_0 \ подмножество R ^ m из x 0 и y 0, такие, что для всех y ∈ B 0 {\ displaystyle y \ in B_ {0}}y \ in B_0 уравнение f (x, y) = 0 имеет единственное решение

x = g (y) ∈ A 0 {\ displaystyle x = g (y) \ in A_ {0}}x = g (y) \ in A_0 ,

где g - непрерывная функция из B 0 в A 0.

См. Также

Литература

Дополнительная литература

Последняя правка сделана 2021-05-23 12:28:11
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте