Производная

редактировать
Операция в исчислении

График функции, нарисованный черным цветом, и касательная строка этой функции, нарисованная красным. Угол наклона касательной равен производной функции в отмеченной точке.

Производная функции действительной переменной измеряет чувствительность к изменению значения функции (выходного значения) по отношению к изменению ее аргумента (входного значения). Производные - это фундаментальный инструмент исчисления. Например, производная положения движущегося объекта по времени - это скорость объекта: это измеряет, насколько быстро положение объекта изменяется с течением времени.

Производная функции одной переменной при выбранном входном значении, если оно существует, представляет собой наклон касательной линии к графику . функции в этой точке. Касательная линия является наилучшим линейным приближением функции вблизи этого входного значения. По этой причине производная часто описывается как «мгновенная скорость изменения», то есть отношение мгновенного изменения зависимой переменной к изменению независимой переменной.

Производные могут быть обобщены на функции нескольких вещественных переменных. В этом обобщении производная интерпретируется как линейное преобразование, график которого (после соответствующего перевода) является наилучшим линейным приближением к графику исходной функции. Матрица Якоби - это матрица , которая представляет это линейное преобразование относительно базиса, заданного выбором независимых и зависимых переменных. Его можно вычислить в терминах частных производных по независимым переменным. Для действительной функции нескольких переменных матрица Якоби сводится к вектору градиента.

. Процесс поиска производной называется дифференцированием . Обратный процесс называется антидифференцировкой. фундаментальная теорема исчисления связывает антидифференциацию с интегрированием. Дифференцирование и интегрирование составляют две фундаментальные операции в исчислении одной переменной.

Содержание

  • 1 Дифференциация
    • 1.1 Обозначение
    • 1.2 Строгое определение
    • 1.3 Определение гиперреалов
    • 1.4 Пример
    • 1.5 Непрерывность и дифференцируемость
    • 1.6 Производная как функция
    • 1.7 Высшие производные
    • 1.8 Точка перегиба
  • 2 Обозначения (подробности)
    • 2.1 Обозначения Лейбница
    • 2.2 Обозначения Лагранжа
    • 2.3 Ньютона нотация
    • 2.4 нотация Эйлера
  • 3 Правила вычислений
    • 3.1 Правила для базовых функций
    • 3.2 Правила для комбинированных функций
    • 3.3 Пример вычисления
  • 4 В более высоких измерениях
    • 4.1 Векторные значения функции
    • 4.2 Частные производные
    • 4.3 Производные по направлениям
    • 4.4 Полная производная, полный дифференциал и матрица Якоби
  • 5 Обобщения
  • 6 История
  • 7 См. также
  • 8 Примечания
  • 9 Ссылки
  • 10 Библиография
    • 10.1 Печать
    • 10.2 Электронные книги
  • 11 Внешние ссылки

Дифференциация

Di дифференциация - это действие по вычислению производной. Производная функции y = f (x) переменной x является мерой скорости, с которой значение y функции изменяется по отношению к изменению переменной x. Она называется производной f по x. Если x и y являются действительными числами, и если график f нанесен на график x, производная представляет собой наклон этого графика в каждой точке.

Наклон линейной функции: m = Δ y Δ x {\ displaystyle m = {\ frac {\ Delta y} {\ Delta x}}}{\ displaystyle m = {\ frac {\ Delta y } {\ Delta x}}}

Простейший случай, кроме тривиального. постоянной функции , это когда y является линейной функцией от x, что означает, что график y представляет собой линию. В этом случае y = f (x) = mx + b для действительных чисел m и b, а наклон m определяется как

m = изменение y, изменение x = Δ y Δ x, {\ displaystyle m = {\ frac {{\ text {change in}} y} {{\ text {change in}} x}} = {\ frac {\ Delta y} {\ Delta x}},}m = {\ frac {{\ text {change in}} y} {{\ text {change in}} x}} = {\ frac {\ Delta y} {\ Delta x}},

где символ Δ (Дельта ) - это сокращение от «изменение в» и комбинации Δ x {\ displaystyle \ Delta x}\ Delta x и Δ y {\ displaystyle \ Delta y}\ Delta y относится к соответствующим изменениям, например: Δ y = f (x + Δ x) - f (x) {\ displaystyle \ Delta y = f (x + \ Delta x) -f (x)}{\ displaystyle \ Delta y = f (x + \ Delta x) -f (x)} . Приведенная выше формула верна, потому что

y + Δ y = f (x + Δ x) = m (x + Δ x) + b = m x + m Δ x + b = y + m Δ x. {\ Displaystyle {\ begin {align} y + \ Delta y = f \ left (x + \ Delta x \ right) \\ = m \ left (x + \ Delta x \ right) + b = mx + m \ Delta x + b \\ = y + m \ Delta x. \ end {align}}}{\ displaystyle {\ begin {align} y + \ Delta y = f \ осталось (x + \ Delta x \ right) \\ = m \ left (x + \ Delta x \ right) + b = mx + m \ Delta x + b \\ = y + m \ Delta x. \ end {выровнено} }}

Таким образом,

Δ y = m Δ x. {\ displaystyle \ Delta y = m \ Delta x.}\ Delta y = m \ Delta x.

Это дает значение для наклона линии.

Если функция f не является линейной (т. Е. Ее график не является прямой линией), то изменение y, деленное на изменение x, изменяется в рассматриваемом диапазоне: дифференцирование - это метод поиска уникального значения для этой скорости изменения не в определенном диапазоне (Δ x), {\ displaystyle (\ Delta x),}{\ displaystyle (\ Delta x),} , а при любом заданном значении x.

Скорость изменения как предельное значение Рисунок 1 . касательная прямая в точке (x, f (x)) Рисунок 2. Секущая кривой y = f (x), определяемая точками (x, f (x)) и (x + h, f (x + h)) Рисунок 3. Касательная линия как предел секущих Рисунок 4. Анимированная иллюстрация: касательная линия (производная) в качестве предела секущих

Идея, проиллюстрированная рисунками с 1 по 3, состоит в том, чтобы вычислить скорость изменения как предельное значение отношения разностей Δy / Δx, поскольку Δx стремится к 0.

Обозначение

Для производной обычно используются два разных обозначения: одно происходит от Готфрида Вильгельма Лейбница, а другое - от Джозефа. Луи Лагранж. Третье обозначение, впервые использованное Исааком Ньютоном, иногда встречается в физике.

В обозначениях Лейбница, бесконечно малое изменение x обозначается dx, а производная y по x записывается

dydx {\ displaystyle {\ frac {dy} {dx}}}{\ frac {dy} {dx}}

, предлагающий соотношение двух бесконечно малых величин. (Вышеупомянутое выражение читается как «производная y по отношению к x», «dy на dx» или «dy по dx». Устная форма «dy dx» часто используется в разговорной речи, хотя может привести к путанице.)

В нотации Лагранжа производная по x функции f (x) обозначается f '(x) (читается как "f простое число x") или f x ′ (x) (читается как «f, простое x из x») в случае неоднозначности переменной, подразумеваемой дифференцированием. Обозначение Лагранжа иногда неправильно приписывается Ньютону.

Обозначение Ньютона для дифференцирования (также называемое точечным обозначением для дифференцирования) ставит точку над зависимой переменной. То есть, если y является функцией t, то производная y по t равна

y ˙ {\ displaystyle {\ dot {y}}}{\ displaystyle {\ dot {y} }}

Высшие производные представлены с использованием нескольких точек, как в

у ¨, у... {\ displaystyle {\ ddot {y}}, {\ overset {...} {y}}}{\ displaystyle {\ ddot {y} }, {\ overset {...} {y}}}

Обычно используется ньютоновская нотация, когда независимая переменная обозначает время. Если положение y является функцией t, то y ˙ {\ displaystyle {\ dot {y}}}{\ displaystyle {\ dot {y} }} обозначает скорость и y ¨ {\ displaystyle { \ ddot {y}}}{\ displaystyle {\ ddot {y}}} обозначает ускорение.

Строгое определение

Секущая приближается к касательной, когда Δ x → 0 {\ displaystyle \ Delta x \ to 0}\ Delta x \ to 0 .

Наиболее распространенный подход к превращению этой интуитивной идеи в точное определение - определить производную как предел разностных отношений действительных чисел. Это подход, описанный ниже.

Пусть f будет вещественной функцией, определенной в открытой окрестности действительного числа a. В классической геометрии касательная линия к графику функции f в точке a была единственной линией, проходящей через точку (a, f (a)), которая не пересекалась с графиком f трансверсально, что означает, что линия не проходила прямо через график. Производная y по x в точке a геометрически представляет собой наклон касательной линии к графику функции f в точке (a, f (a)). Наклон касательной очень близок к наклону прямой, проходящей через (a, f (a)) и ближайшую точку на графике, например (a + h, f (a + h)). Эти линии называются секущими линиями. Значение h, близкое к нулю, дает хорошее приближение к наклону касательной, а меньшие значения (в абсолютном значении ) h, как правило, дают лучшие приближения. Наклон m секущей линии - это разница между значениями y этих точек, деленная на разницу между значениями x, то есть

m = Δ f (a) Δ a = f (a + h) - f (a) (a + h) - (a) = f (a + h) - f (a) h. {\ displaystyle m = {\ frac {\ Delta f (a)} {\ Delta a}} = {\ frac {f (a + h) -f (a)} {(a + h) - (a)} } = {\ frac {f (a + h) -f (a)} {h}}.}m = {\ frac {\ Delta f (a)} {\ Delta a}} = {\ frac {f (a + h) -f (a)} {(a + h) - (a)} } = {\ frac {f (a + h) -f (a)} {h}}.

Это выражение представляет собой коэффициент разности Ньютона . Переход от приближенного к точному ответу осуществляется с использованием предела . Геометрически предел секущих - касательная. Следовательно, предел отношения разности при приближении h к нулю, если он существует, должен представлять наклон касательной к (a, f (a)). Этот предел определяется как производная функции f при a:

f ′ (a) = lim h → 0 f (a + h) - f (a) h. {\ displaystyle f '(a) = \ lim _ {h \ to 0} {\ frac {f (a + h) -f (a)} {h}}.}f'(a)=\lim _{h\to 0}{\frac {f(a+h)-f(a)}{h}}.

Когда предел существует, f равно считается дифференцируемым в a. Здесь f ′ (a) - одно из нескольких общепринятых обозначений производной (см. Ниже ). Из этого определения очевидно, что дифференцируемая функция f увеличивает тогда и только тогда, когда ее производная положительна, и убывает тогда и только тогда, когда ее производная отрицательна. Этот факт широко используется при анализе поведения функций, например при нахождении локальных экстремумов.

Эквивалентно, производная удовлетворяет свойству

lim h → 0 f (a + h) - (f (a) + f ′ (a) ⋅ h) h = 0, {\ displaystyle \ lim _ {h \ to 0} {\ frac {f (a + h) - (f (a) + f '(a) \ cdot h)} {h}} = 0,}{\displaystyle \lim _{h\to 0}{\frac {f(a+h)-(f(a)+f'(a)\cdot h)}{h}}=0,}

которая интуитивно интерпретируется (см. рисунок 1), что касательная к f в точке a дает наилучшее линейное приближение

f (a + h) ≈ f (a) + f ′ (a) h {\ displaystyle f (a + h) \ приблизительно f (a) + f '(a) h}f(a+h)\approx f(a)+f'(a)h

до f рядом с a (т. е. для малого h). Эту интерпретацию проще всего обобщить на другие параметры (см. Ниже ).

Замена 0 на h в разностном коэффициенте вызывает деление на ноль, поэтому наклон касательной линии не может быть найден напрямую с помощью этого метода. Вместо этого определите Q (h) как коэффициент разности как функцию от h:

Q (h) = f (a + h) - f (a) h. {\ displaystyle Q (h) = {\ frac {f (a + h) -f (a)} {h}}.}Q (h) = {\ frac {f (a + h) -f (a)} {h}}.

Q (h) - наклон секущей линии между (a, f ( а)) и (а + h, f (a + h)). Если f является непрерывной функцией, что означает, что ее график представляет собой непрерывную кривую без промежутков, то Q является непрерывной функцией вне h = 0. Если предел lim h → 0 Q (h) существует, что означает, что существует способ выбора значения для Q (0), которое делает Q непрерывной функцией, тогда функция f дифференцируема в точке a, а ее производная в точке a равна Q (0).

На практике существование непрерывного расширения разностного отношения Q (h) до h = 0 демонстрируется изменением числителя для сокращения h в знаменателе. Такие манипуляции могут сделать предельное значение Q для малого h ясным, даже если Q все еще не определено при h = 0. Этот процесс может быть долгим и утомительным для сложных функций, и для его упрощения обычно используется множество сокращений.

Определение гиперреалов

Относительно гиперреального расширения R⊂ Rдействительных чисел, производная действительной функции y = f (x) при действительном точку x можно определить как тень частного ∆y / ∆x для бесконечно малого ∆x, где ∆y = f (x + ∆x) - f (x). Здесь естественное продолжение f на гиперреалы по-прежнему обозначается f. Здесь говорят, что производная существует, если тень не зависит от выбранной бесконечно малой величины.

Пример

Функция квадрата

Функция квадрата, заданная формулой f (x) = x, дифференцируема при x = 3, и ее производная равна 6. Этот результат устанавливается путем вычисления предела как h приближается к нулю разностного частного f (3):

f ′ (3) = lim h → 0 f (3 + h) - f (3) h = lim h → 0 (3 + h) 2 - 3 2 h = lim h → 0 9 + 6 h + h 2 - 9 h = lim h → 0 6 h + h 2 h = lim h → 0 (6 + h). {\ Displaystyle {\ begin {align} f '(3) = \ lim _ {h \ to 0} {\ frac {f (3 + h) -f (3)} {h}} = \ lim _ { h \ to 0} {\ frac {(3 + h) ^ {2} -3 ^ {2}} {h}} \\ [10pt] = \ lim _ {h \ to 0} {\ frac {9 + 6h + h ^ {2} -9} {h}} = \ lim _ {h \ to 0} {\ frac {6h + h ^ {2}} {h}} = \ lim _ {h \ to 0 } {(6 + h)}. \ End {align}}}{\begin{aligned}f'(3)=\lim _{h\to 0}{\frac {f(3+h)-f(3)}{h}}=\lim _{h\to 0}{\frac {(3+h)^{2}-3^{2}}{h}}\\[10pt]=\lim _{h\to 0}{\frac {9+6h+h^{2}-9}{h}}=\lim _{h\to 0}{\frac {6h+h^{2}}{h}}=\lim _{h\to 0}{(6+h)}.\end{aligned}}

Последнее выражение показывает, что коэффициент разности равен 6 + h, когда h 0, и не определен, когда h = 0, из-за определения разности частное. Однако в определении предела говорится, что коэффициент разности не нужно определять, когда h = 0. Предел является результатом того, что h становится равным нулю, что означает, что это значение, к которому стремится 6 + h, когда h становится очень маленьким. :

lim h → 0 (6 + h) = 6 + 0 = 6. {\ displaystyle \ lim _ {h \ to 0} {(6 + h)} = 6 + 0 = 6.}\ lim _ {h \ to 0} {(6 + h)} = 6 + 0 = 6.

Следовательно, наклон графика функции квадрата в точке (3, 9) равен 6, и поэтому его производная в точке x = 3 равна f ′ (3) = 6.

В общем, аналогичное вычисление показывает, что производная квадратной функции при x = a равна f ′ (a) = 2a:

f ′ (a) = lim h → 0 f (a + h) - f (a) h = lim h → 0 (a + h) 2 - a 2 h = lim h → 0 a 2 + 2 ah + h 2 - a 2 h = lim h → 0 2 ah + h 2 h = lim h → 0 (2 a + h) Знак равно 2 a {\ displaystyle {\ begin {align} f '(a) = \ lim _ {h \ to 0} {\ frac {f (a + h) -f (a)} {h}} = \ lim _ {h \ to 0} {\ frac {(a + h) ^ {2} -a ^ {2}} {h}} \\ [0.3em] = \ lim _ {h \ to 0} { \ frac {a ^ {2} + 2ah + h ^ {2} -a ^ {2}} {h}} = \ lim _ {h \ to 0} {\ frac {2ah + h ^ {2}} { h}} \\ [0.3em] = \ lim _ {h \ to 0} {(2a + h)} = 2a \ end {выровнено}}}{\displaystyle {\begin{aligned}f'(a)=\lim _{h\to 0}{\frac {f(a+h)-f(a)}{h}}=\lim _{h\to 0}{\frac {(a+h)^{2}-a^{2}}{h}}\\[0.3em]=\lim _{h\to 0}{\frac {a^{2}+2ah+h^{2}-a^{2}}{h}}=\lim _{h\to 0}{\frac {2ah+h^{2}}{h}}\\[0.3em]=\lim _{h\to 0}{(2a+h)}=2a\end{aligned}}}

Непрерывность и дифференцируемость

Эта функция не имеет производной в отмеченной точке, поскольку функция там не является непрерывной (в частности, у нее есть скачкообразный разрыв ).

Если f дифференцируемая в a, то f также должно быть непрерывным в a. В качестве примера выберите точку a и пусть f будет функцией шага , которая возвращает значение 1 для всех x, меньших a, и возвращает другое значение 10 для всех x, больших или равных a. f не может иметь производную в a. Если h отрицательно, то a + h находится в нижней части ступеньки, поэтому секущая линия от a до a + h очень крутая, и, когда h стремится к нулю, наклон стремится к бесконечности. Если h положительно, то a + h находится в верхней части ступеньки, поэтому секущая линия от a до a + h имеет нулевой наклон. Следовательно, секущие линии не приближаются ни к одному наклону, так что предела коэффициента разности не существует.

Функция абсолютного значения является непрерывной, но не может быть дифференцируемой при x = 0, поскольку наклоны касательных не приближаются к одному и тому же значению слева, как справа.

Однако, даже если функция является непрерывной в какой-то момент он не может быть дифференцируемым. Например, функция абсолютного значения, заданная как f (x) = | x | непрерывна в точке x = 0, но не дифференцируема там. Если h положительно, то наклон секущей от 0 до h равен единице, тогда как если h отрицателен, то наклон секущей от 0 до h отрицателен. Это можно увидеть графически как «изгиб» или «острие» на графике при x = 0. Даже функция с гладким графиком не дифференцируема в точке, где ее касательная вертикальна : Например,, функция, заданная формулой f (x) = x, не дифференцируема при x = 0.

Таким образом, функция, имеющая производную, является непрерывной, но существуют непрерывные функции, которые не имеют производной.

Большинство функций, которые встречаются на практике, имеют производные во всех точках или в почти в каждой точке. В начале истории исчисления многие математики предполагали, что непрерывная функция дифференцируема в большинстве точек. В мягких условиях, например, если функция является монотонной функцией или функцией Липшица, это верно. Однако в 1872 году Вейерштрасс нашел первый пример функции, непрерывной всюду, но нигде не дифференцируемой. Этот пример теперь известен как функция Вейерштрасса. В 1931 г. Стефан Банах доказал, что множество функций, имеющих производную в некоторой точке, является скудным множеством в пространстве всех непрерывных функций. Неформально это означает, что практически любые случайные непрерывные функции не имеют производной хотя бы в одной точке.

Производная как функция

Производная в разных точках дифференцируемой функции. В этом случае производная равна: sin ⁡ (x 2) + 2 x 2 cos ⁡ (x 2) {\ displaystyle \ sin \ left (x ^ {2} \ right) + 2x ^ {2 } \ cos \ left (x ^ {2} \ right)}{\ displaystyle \ sin \ left (x ^ {2} \ right) + 2x ^ {2} \ cos \ left (x ^ {2} \ right)}

Пусть f - функция, которая имеет производную в каждой точке в ее области. Затем мы можем определить функцию, которая отображает каждую точку x {\ displaystyle x}x на значение производной f {\ displaystyle f}е в х {\ displaystyle x}x . Эта функция записывается как f 'и называется производной функцией или производной от f.

Иногда f имеет производную в большинстве, но не во всех точках своей области определения. Функция, значение которой в a равно f ′ (a) всякий раз, когда f ′ (a) определено, а где-либо еще не определено, также называется производной f. Это все еще функция, но ее область определения строго меньше области определения f.

Используя эту идею, дифференцирование становится функцией функций: производная - это оператор, область определения которого представляет собой набор всех функций, которые имеют производные в каждой точке их области определения и диапазон которых является набор функций. Если обозначить этот оператор через D, то D (f) будет функцией f ′. Поскольку D (f) является функцией, ее можно вычислить в точке a. По определению производной функции D (f) (a) = f ′ (a).

Для сравнения рассмотрим функцию удвоения, задаваемую f (x) = 2x; f является функцией действительного числа с действительным знаком, что означает, что он принимает числа в качестве входных и имеет числа в качестве выходных:

1 ↦ 2, 2 ↦ 4, 3 ↦ 6. {\ displaystyle {\ begin {align} 1 {} \ mapsto 2, \\ 2 {} \ mapsto 4, \\ 3 {} \ mapsto 6. \ end {align}}}{\ begin {align} 1 {} \ mapsto 2, \\ 2 {} \ mapsto 4, \\ 3 {} \ mapsto 6. \ end {align}}

Оператор D, однако, не определен для отдельных чисел. Он определен только в функциях:

D (x ↦ 1) = (x ↦ 0), D (x ↦ x) = (x ↦ 1), D (x ↦ x 2) = (x ↦ 2 ⋅ x). {\ Displaystyle {\ begin {align} D (x \ mapsto 1) = (x \ mapsto 0), \\ D (x \ mapsto x) = (x \ mapsto 1), \\ D \ left (x \ mapsto x ^ {2} \ right) = (x \ mapsto 2 \ cdot x). \ end {align}}}{\ displaystyle {\ begin {align} D (x \ mapsto 1) = (x \ mapsto 0), \\ D (x \ mapsto x) = (x \ mapsto 1), \\ D \ слева (x \ mapsto x ^ {2} \ right) = (x \ mapsto 2 \ cdot x). \ end {align}}}

Поскольку вывод D является функцией, вывод D можно оценить в точка. Например, когда D применяется к функции квадрата, x ↦ x, D выводит функцию удвоения x ↦ 2x, которую мы назвали f (x). Затем эта функция вывода может быть вычислена, чтобы получить f (1) = 2, f (2) = 4 и так далее.

Высшие производные

Пусть f - дифференцируемая функция, а f ′ - ее производная. Производная f '(если она есть) записывается f' 'и называется второй производной f. Точно так же производная второй производной, если она существует, записывается как f ′ ′ ′ и называется третьей производной функции f. Продолжая этот процесс, можно определить, если она существует, n-ю производную как производную от (n-1) -й производной. Эти повторяющиеся производные называются производными более высокого порядка. N-я производная также называется производной порядка n .

Если x (t) представляет положение объекта в момент времени t, то производные x более высокого порядка имеют особую интерпретацию в физике. Первая производная от x - это скорость объекта. Вторая производная от x - это ускорение. Третья производная от x - это рывок. И, наконец, с четвертой по шестую производные x: щелчок, треск и треск ; наиболее применимо к астрофизике.

Функция f не обязательно должна иметь производную (например, если она не является непрерывной). Точно так же, даже если у f есть производная, у нее может не быть второй производной. Например, пусть

f (x) = {+ x 2, если x ≥ 0 - x 2, если x ≤ 0. {\ displaystyle f (x) = {\ begin {cases} + x ^ {2}, {\ text {if}} x \ geq 0 \\ - x ^ {2}, {\ text {if}} x \ leq 0. \ end {cases}}}f (x) = {\ begin {cases} + x ^ {2}, {\ text {if}} x \ geq 0 \\ -x ^ {2}, {\ text {if}} x \ leq 0. \ end {cases}}

Расчет показывает, что f равно дифференцируемая функция, производная которой в x {\ displaystyle x}x задается как

f ′ (x) = {+ 2 x, если x ≥ 0 - 2 x, если x ≤ 0. {\ displaystyle f '(x) = {\ begin {cases} + 2x, {\ text {if}} x \ geq 0 \\ - 2x, {\ text {if}} x \ leq 0. \ end {case}}}f'(x)={\begin{cases}+2x,{\text{if }}x\geq 0\\-2x,{\text{if }}x\leq 0.\end{cases}}

f '(x) в два раза больше функции абсолютного значения в x {\ displaystyle x}x , и у нее нет производной в нуле. Подобные примеры показывают, что функция может иметь k-ю производную для каждого неотрицательного целого числа k, но не (k + 1) -ю производную. Функция, которая имеет k последовательных производных, называется k раз дифференцируемой. Если вдобавок k-я производная непрерывна, то говорят, что функция имеет класс дифференцируемости C. (Это более сильное условие, чем наличие k производных, как показано во втором примере раздела Smoothness § Examples.) Функция, имеющая бесконечно много производных, называется бесконечно дифференцируемой или гладкой.

. вещественная линия, каждая полиномиальная функция бесконечно дифференцируема. По стандартным правилам дифференцирования, если полином степени n дифференцируется n раз, то он становится постоянной функцией. Все его последующие производные тождественно равны нулю. В частности, они существуют, поэтому многочлены являются гладкими функциями.

Производные функции f в точке x обеспечивают полиномиальные приближения к этой функции около x. Например, если f дважды дифференцируемо, то

f (x + h) ≈ f (x) + f ′ (x) h + 1 2 f ″ (x) h 2 {\ displaystyle f (x + h) \ приблизительно f (x) + f '(x) h + {\ tfrac {1} {2}} f' '(x) h ^ {2}}f(x+h)\approx f(x)+f'(x)h+{\tfrac {1}{2}}f''(x)h^{2}

в том смысле, что

lim h → 0 f (Икс + час) - е (Икс) - е ′ (Икс) час - 1 2 f ″ (x) час 2 час 2 = 0. {\ displaystyle \ lim _ {h \ to 0} {\ frac {f ( x + h) -f (x) -f '(x) h - {\ frac {1} {2}} f' '(x) h ^ {2}} {h ^ {2}}} = 0. }\lim _{h\to 0}{\frac {f(x+h)-f(x)-f'(x)h-{\frac {1}{2}}f''(x)h^{2}}{h^{2}}}=0.

Если f бесконечно дифференцируема, то это начало ряда Тейлора для f, вычисляемого в x + h вокруг x.

Точка перегиба

Точка, в которой вторая производная функции меняет знак, называется точкой перегиба. В точке перегиба вторая производная может быть равна нулю, как в случае точки перегиба x = 0 функции, заданной f (x) = x 3 {\ displaystyle f (x) = x ^ {3 }}f (x) = x ^ 3 , или он может не существовать, как в случае точки перегиба x = 0 функции, заданной как f (x) = x 1 3 {\ displaystyle f (x) = x ^ {\ frac {1} {3}}}{\ displaystyle f (x) = x ^ {\ frac {1} {3}}} . В точке перегиба функция переключается с выпуклой функции на вогнутую функцию или наоборот.

Обозначение (подробности)

Обозначение Лейбница

Символы dx {\ displaystyle dx}dx , dy {\ displaystyle dy}dy , и dydx {\ displaystyle {\ frac {dy} {dx}}}{\ frac {dy} {dx}} были введены Готфридом Вильгельмом Лейбницем в 1675 году. Оно до сих пор широко используется, когда уравнение y = f (x) рассматривается как функциональная связь между зависимыми и независимыми переменными. Тогда первая производная обозначается

dydx, dfdx или ddxf, {\ displaystyle {\ frac {dy} {dx}}, \ quad {\ frac {df} {dx}}, {\ text {или} } {\ frac {d} {dx}} f,}{\ displaystyle {\ frac { dy} {dx}}, \ quad {\ frac {df} {dx}}, {\ text {или}} {\ frac {d} {dx}} f,}

и когда-то считалось бесконечно малым частным. Высшие производные выражаются с помощью записи

dnydxn, dnfdxn или dndxnf {\ displaystyle {\ frac {d ^ {n} y} {dx ^ {n}}}, \ quad {\ frac {d ^ {n} f} {dx ^ {n}}}, {\ text {или}} {\ frac {d ^ {n}} {dx ^ {n}}} f}{\ displaystyle {\ frac {d ^ {n} y } {dx ^ {n}}}, \ quad {\ frac {d ^ {n} f} {dx ^ {n}}}, {\ text {или}} {\ frac {d ^ {n}} { dx ^ {n}}} f}

для n-й производной от y знак равно е (х) {\ Displaystyle у = е (х)}y = f (x) . Это сокращения для нескольких применений оператора производной. Например,

d 2 y d x 2 = d d x (d y d x). {\ displaystyle {\ frac {d ^ {2} y} {dx ^ {2}}} = {\ frac {d} {dx}} \ left ({\ frac {dy} {dx}} \ right). }{\ frac {d ^ {2 } y} {dx ^ {2}}} = {\ frac {d} {dx}} \ left ({\ frac {dy} {dx}} \ right).

Используя обозначения Лейбница, мы можем записать производную от y {\ displaystyle y}y в точке x = a {\ displaystyle x = a}x = a двумя разными способами:

dydx | х = а = д у д х (а). {\ displaystyle \ left. {\ frac {dy} {dx}} \ right | _ {x = a} = {\ frac {dy} {dx}} (a).}\ left. {\ frac {dy} {dx}} \ right | _ {x = a} = {\ frac {dy} {dx}} (a).

Нотация Лейбница позволяет указать переменная для дифференцирования (в знаменателе), которая актуальна в частном дифференцировании. Его также можно использовать для записи правила цепочки as

d y d x = d y d u ⋅ d u d x. {\ displaystyle {\ frac {dy} {dx}} = {\ frac {dy} {du}} \ cdot {\ frac {du} {dx}}.}{\ frac {dy} {dx}} = {\ frac {dy} {du}} \ cdot {\ frac {du} {dx} }.

Нотация Лагранжа

Иногда называемая простой нотацией, одна из наиболее распространенных современных нотаций для дифференцирования принадлежит Джозефу-Луи Лагранжу и использует знак штриха, так что производная функции f {\ displaystyle f}е обозначается f '{\ displaystyle f'}f'. Аналогичным образом вторая и третья производные обозначаются

(f ') ′ = f ″ {\ displaystyle (f') '= f' '}{\displaystyle (f')'=f''}и (f ″) ′ = f ‴. {\ displaystyle (f '') '= f' ''.}(f'')'=f'''.

Для обозначения количества производных за пределами этой точки некоторые авторы используют римские цифры в надстрочном индексе, тогда как другие помещают число в круглые скобки :

fiv {\ displaystyle f ^ {\ mathrm {iv}}}{\ dis стиль игры f ^ {\ mathrm {iv}}} или f (4). {\ displaystyle f ^ {(4)}.}f ^ {(4)}.

Последнее обозначение обобщается, чтобы получить обозначение f (n) {\ displaystyle f ^ {(n)}}f ^ {(n)} для n-го производная от f {\ displaystyle f}е - это обозначение наиболее полезно, когда мы хотим говорить о производной как о самой функции, поскольку в этом случае обозначение Лейбница может стать громоздким.

Обозначение Ньютона

Обозначение Ньютона для дифференцирования, также называемое точечным обозначением, помещает точку над именем функции, чтобы представить производную по времени. Если y = f (t) {\ displaystyle y = f (t)}{\ displaystyle y = f (t)} , то

y ˙ {\ displaystyle {\ dot {y}}}{\ dot {y}} и y ¨ {\ displaystyle {\ ddot {y}}}{\ ddot {y}}

обозначают соответственно первую и вторую производные от y {\ displaystyle y}y . Это обозначение используется исключительно для производных по времени или длине дуги. Обычно он используется в дифференциальных уравнениях в физике и дифференциальной геометрии. Однако точечная запись становится неуправляемой для производных высокого порядка (порядка 4 и более) и не может иметь дело с несколькими независимыми переменными.

Нотация Эйлера

Нотация Эйлера использует дифференциальный оператор D {\ displaystyle D}D , который применяется к функции f {\ displaystyle f}е , чтобы получить первую производную D f {\ displaystyle Df}Df . N-я производная обозначается D nf {\ displaystyle D ^ {n} f}{\ displaystyle D ^ {n} f} .

Если y = f (x) является зависимой переменной, то часто индекс x присоединяется к D, чтобы уточнить независимую переменную. Икс. Тогда обозначение Эйлера записывается как

D xy {\ displaystyle D_ {x} y}{\ displaystyle D_ {x} y} или D xf (x) {\ displaystyle D_ {x} f (x)}{\ displaystyle D_ { x} f (x)} ,

хотя этот индекс часто опускается, если переменная x понимается, например, когда это единственная независимая переменная, присутствующая в выражении.

Нотация Эйлера полезна для формулировки и решения линейных дифференциальных уравнений.

Правила вычисления

Производная функции в принципе может быть вычислена из определения с учетом фактор разницы и вычисление его предела. На практике, когда известны производные нескольких простых функций, производные других функций легче вычислить, используя правила получения производных более сложных функций от более простых.

Правила для основных функций

Вот правила для производных наиболее распространенных базовых функций, где a - действительное число.

d d x x a = a x a - 1. {\ displaystyle {\ frac {d} {dx}} x ^ {a} = ax ^ {a-1}.}{\ displaystyle {\ frac {d} {dx}} x ^ {a} = ax ^ {a-1}.}
ddxex = напр. {\ displaystyle {\ frac {d} {dx}} e ^ {x} = e ^ {x}.}{\ frac {d} {dx}} e ^ {x} = e ^ {x}.
ddxax = ax ln ⁡ (a), a>0 {\ displaystyle {\ frac {d} {dx}} a ^ {x} = a ^ {x} \ ln (a), \ qquad a>0}{\displaystyle {\frac {d}{dx}}a^{x}=a^{x}\ln(a),\qquad a>0}
ddx ln ⁡ (x) = 1 x, x>0. {\ displaystyle {\ frac { d} {dx}} \ ln (x) = {\ frac {1} {x}}, \ qquad x>0.}{\frac {d}{dx}}\ln(x)={\frac {1}{x}},\qquad x>0.
ddx log a ⁡ (x) Знак равно 1 Икс пер ⁡ (а), Икс, а>0 {\ displaystyle {\ frac {d} {dx}} \ log _ {a} (x) = {\ frac {1} {x \ ln (a) }}, \ qquad x, a>0}{\displaystyle {\frac {d}{dx}}\log _{a}(x)={\frac {1}{x\ln(a)}},\qquad x,a>0}
ddx sin ⁡ (x) = cos ⁡ (x). {\ displaystyle {\ frac {d} {dx}} \ sin (x) = \ соз (х).}{\ frac {d} {dx}} \ sin (x) = \ cos (x).
ddx соз ⁡ (х) = - грех ⁡ (х). {\ displaystyle {\ frac {d} {dx}} \ cos (x) = - \ sin (x). }{\ frac {d} {dx}} \ cos (x) = - \ sin (x).
ddx tan ⁡ (x) = sec 2 ⁡ (x) = 1 cos 2 ⁡ (x) = 1 + tan 2 ⁡ (x). {\ Displaystyle {\ frac {d} {dx}} \ tan (x) = \ sec ^ {2} (x) = {\ frac {1} {\ cos ^ {2} (x)}} = 1+ \ tan ^ {2} (x).}{\ frac {d } {dx}} \ tan (x) = \ sec ^ {2} (x) = {\ frac {1} {\ cos ^ {2} (x)}} = 1+ \ tan ^ {2} (x).
ddx arcsin ⁡ (x) = 1 1 - x 2, - 1 < x < 1. {\displaystyle {\frac {d}{dx}}\arcsin(x)={\frac {1}{\sqrt {1-x^{2}}}},\qquad -1{\ displaystyle {\ frac {d} {dx}} \ arcsin (x) = {\ frac {1} {\ sqrt {1-x ^ {2}}} }, \ qquad -1 <x <1.}
ddx arccos ⁡ (x) = - 1 1 - x 2, - 1 < x < 1. {\displaystyle {\frac {d}{dx}}\arccos(x)=-{\frac {1}{\sqrt {1-x^{2}}}},\qquad -1{\ displaystyle {\ frac {d} {dx}} \ arccos (x) = - {\ frac {1} {\ sqrt {1-x ^ {2}}}}, \ qquad -1 <x <1.}
ddx arctan ⁡ (x) = 1 1 + Икс 2 {\ Displaystyle {\ гидроразрыва {д} {д x}} \ arctan (x) = {\ frac {1} {1 + x ^ {2}}}}{\ гидроразрыв {d} {dx}} \ arctan (x) = {\ frac {1} {1 + x ^ {2}}}

Правила для комбинированных функций

Вот некоторые из самых основных правил для вывода производная составной функции от производных основных функций.

  • Постоянное правило: если f (x) постоянно, то
f ′ (x) = 0. {\ displaystyle f '(x) = 0.}{\displaystyle f'(x)=0.}
(α f + β g) ′ = α f ′ + β g ′ {\ displaystyle (\ alpha f + \ beta g) '= \ alpha f' + \ beta g '}{\displaystyle (\alpha f+\beta g)'=\alpha f'+\beta g'}для всех функций f и g и всех вещественных числа α {\ displaystyle \ alpha}\ alpha и β {\ displaystyle \ beta}\ бета .
(fg) ′ = f ′ g + fg ′ {\ displaystyle (fg) '= f'g + fg'}{\displaystyle (fg)'=f'g+fg'}для всех функций f и g. В качестве особого случая это правило включает в себя факт (α f) ′ = α f ′ {\ displaystyle (\ alpha f) '= \ alpha f'}(\alpha f)'=\alpha f'всякий раз, когда α {\ displaystyle \ alpha}\ alpha является константой, потому что α ′ f = 0 ⋅ f = 0 {\ displaystyle \ alpha 'f = 0 \ cdot f = 0}\alpha 'f=0\cdot f=0по постоянное правило.
(fg) ′ = f ′ g - fg ′ g 2 {\ displaystyle \ left ({\ frac {f} {g}} \ right) '= {\ frac {f 'g-fg'}{g^{2}}}}\left({\frac {f}{g}}\right)'={\frac {f'g-fg'}{g^{2}}}for all functions f and g at all inputs where g ≠ 0.
  • Chain rule for composite functions: If f ( x) = h ( g ( x)) {\displaystyle f(x)=h(g(x))}f (x) = h (g (x)) , then
f ′ ( x) = h ′ ( g ( x)) ⋅ g ′ ( x). {\displaystyle f'(x)=h'(g(x))\cdot g'(x).}{\displaystyle f'(x)=h'(g(x))\cdot g'(x).}

Computation example

The derivative of the function given by

f ( x) = x 4 + sin ⁡ ( x 2) − ln ⁡ ( x) e x + 7 {\displaystyle f(x)=x^{4}+\sin \left(x^{2}\right)-\ln(x)e^{x}+7}{\ displaystyle f (x) = x ^ {4} + \ sin \ left (x ^ {2} \ right) - \ ln (x) e ^ {x} +7}

is

f ′ ( x) = 4 x ( 4 − 1) + d ( x 2) d x cos ⁡ ( x 2) − d ( ln ⁡ x) d x e x − ln ⁡ ( x) d ( e x) d x + 0 = 4 x 3 + 2 x cos ⁡ ( x 2) − 1 x e x − ln ⁡ ( x) e x. {\displaystyle {\begin{aligned}f'(x)=4x^{(4-1)}+{\frac {d\left(x^{2}\right)}{dx}}\cos \left(x^{2}\right)-{\frac {d\left(\ln {x}\right)}{dx}}e^{x}-\ln(x){\frac {d\left(e^{x}\right)}{dx}}+0\\=4x^{3}+2x\cos \left(x^{2}\right)-{\frac {1}{x}}e^{x}-\ln(x)e^{x}.\end{aligned}}}{\displaystyle {\begin{aligned}f'(x)=4x^{(4-1)}+{\frac {d\left(x^{2}\right)}{dx}}\cos \left(x^{2}\right)-{\frac {d\left(\ln {x}\right)}{dx}}e^{x}-\ln(x){\frac {d\left(e^{x}\right)}{dx}}+0\\=4x^{3}+2x\cos \left(x^{2}\right)-{\frac {1}{x}}e^{x}-\ln(x)e^{x}.\end{aligned}}}

Here the second term was computed using the chain rule and third using the product rule. The known derivatives of the elementary functions x, x, sin(x), ln(x) and exp(x) = e, as well as the constant 7, were also used.

In higher dimensions

Vector-valued functions

A vector-valued function yof a real variable sends real numbers to vectors in some vector space R. A vector-valued function can be split up into its coordinate functions y1(t), y2(t),..., yn(t), meaning that y(t) = (y1(t),..., yn(t)). This includes, for example, parametric curves in Ror R. The coordinate functions are real valued functions, so the above definition of derivative applies to them. The derivative of y(t) is defined to be the vector, called the tangent vector, whose coordinates are the derivatives of the coordinate functions. That is,

y ′ ( t) = ( y 1 ′ ( t), …, y n ′ ( t)). {\displaystyle \mathbf {y} '(t)=(y'_{1}(t),\ldots,y'_{n}(t)).}\mathbf {y} '(t)=(y'_{1}(t),\ldots,y'_{n}(t)).

Equivalently,

y ′ ( t) = lim h → 0 y ( t + h) − y ( t) h, {\displaystyle \mathbf {y} '(t)=\lim _{h\to 0}{\frac {\mathbf {y} (t+h)-\mathbf {y} (t)}{h}},}\mathbf {y} '(t)=\lim _{h\to 0}{\frac {\mathbf {y} (t+h)-\mathbf {y} (t)}{h}},

if the limit exists. The subtraction in the numerator is the subtraction of vectors, not scalars. If the derivative of yexists for every value of t, then y′ is another vector-valued function.

If e1,..., enis the standard basis for R, then y(t) can also be written as y1(t)e1+ … + yn(t)en. If we assume that the derivative of a vector-valued function retains the linearity property, then the derivative of y(t) must be

y 1 ′ ( t) e 1 + ⋯ + y n ′ ( t) e n {\displaystyle y'_{1}(t)\mathbf {e} _{1}+\cdots +y'_{n}(t)\mathbf {e} _{n}}y'_{1}(t)\mathbf {e} _{1}+\cdots +y'_{n}(t)\mathbf {e} _{n}

because each of the basis vectors is a constant.

This generalization is useful, for example, if y(t) is the position vector of a particle at time t; then the derivative y′(t) is the velocity vector of the particle at time t.

Partial derivatives

Suppose that f is a function that depends on more than one variable—for instance,

f ( x, y) = x 2 + x y + y 2. {\displaystyle f(x,y)=x^{2}+xy+y^{2}.}{\ displaystyle f (x, y) = x ^ {2} + xy + y ^ {2}.}

f can be reinterpreted as a family of functions of one variable indexed by the other variables:

f ( x, y) = f x ( y) = x 2 + x y + y 2. {\displaystyle f(x,y)=f_{x}(y)=x^{2}+xy+y^{2}.}{\ displaystyle f (x, y) = f_ {x} (y) = x ^ { 2} + xy + y ^ {2}.}

In other words, every value of x chooses a function, denoted fx, which is a function of one real number. That is,

x ↦ f x, {\displaystyle x\mapsto f_{x},}{\ displaystyle x \ mapsto f_ {x},}
f x ( y) = x 2 + x y + y 2. {\displaystyle f_{x}(y)=x^{2}+xy+y^{2}.}{\ displaystyle f_ {x} (y) = x ^ {2} + xy + y ^ {2}.}

Once a value of x is chosen, say a, then f(x, y) determines a function fathat sends y to a + ay + y:

f a ( y) = a 2 + a y + y 2. {\displaystyle f_{a}(y)=a^{2}+ay+y^{2}.}{\ displaystyle f_ {a} (y) = a ^ {2} + ay + y ^ {2}.}

In this expression, a is a constant, not a variable, so fais a function of only one real variable. Consequently, the definition of the derivative for a function of one variable applies:

f a ′ ( y) = a + 2 y. {\displaystyle f_{a}'(y)=a+2y.}{\displaystyle f_{a}'(y)=a+2y.}

The above procedure can be performed for any choice of a. Assembling the derivatives together into функция дает функцию, которая описывает изменение f в направлении y:

∂ f ∂ y (x, y) = x + 2 y. {\ displaystyle {\ frac {\ partial f} {\ partial y}} (x, y) = x + 2y.}{\ displaystyle {\ frac {\ partial f} {\ partial y}} (x, y) = x + 2y.}

Это частная производная от f по y. Здесь - округленная буква d, называемая символом частной производной . Чтобы отличить его от буквы d, ∂ иногда произносится как «der», «del» или «частично» вместо «dee».

В общем, частная производная функции f (x 1,…, x n) в направлении x i в точке (a 1,..., a n) определяется как

∂ f ∂ xi (a 1,…, an) = lim h → 0 f (a 1,…, ai + h,…, an) - f (a 1,…, ai,…, an) h. {\ displaystyle {\ frac {\ partial f} {\ partial x_ {i}}} (a_ {1}, \ ldots, a_ {n}) = \ lim _ {h \ to 0} {\ frac {f ( a_ {1}, \ ldots, a_ {i} + h, \ ldots, a_ {n}) - f (a_ {1}, \ ldots, a_ {i}, \ ldots, a_ {n})} {h }}.}{\ displaystyle {\ frac {\ partial f} {\ partial x_ {i}}} (a_ {1}, \ ldots, a_ {n}) = \ lim _ {h \ to 0} {\ frac {f (a_ {1}, \ ldots, a_ {i} + h, \ ldots, a_ {n}) - f (a_ {1}, \ ldots, a_ {i}, \ ldots, a_ {n})} {h}}.}

В приведенном выше коэффициенте разности все переменные, кроме x i, остаются фиксированными. Этот выбор фиксированных значений определяет функцию одной переменной

fa 1,…, ai - 1, ai + 1,…, an (xi) = f (a 1,…, ai - 1, xi, ai + 1,…, An), {\ displaystyle f_ {a_ {1}, \ ldots, a_ {i-1}, a_ {i + 1}, \ ldots, a_ {n}} (x_ {i}) = f ( a_ {1}, \ ldots, a_ {i-1}, x_ {i}, a_ {i + 1}, \ ldots, a_ {n}),}f_ {a_ { 1}, \ ldots, a_ {i-1}, a_ {i + 1}, \ ldots, a_ {n}} (x_ {i}) = f (a_ {1}, \ ldots, a_ {i-1 }, x_ {i}, a_ {i + 1}, \ ldots, a_ {n}),

и, по определению,

dfa 1,…, Ai - 1, ai + 1,…, и xi (ai) = ∂ f ∂ xi (a 1,…, an). {\ displaystyle {\ frac {df_ {a_ {1}, \ ldots, a_ {i-1}, a_ {i + 1}, \ ldots, a_ {n}}} {dx_ {i}}} (a_ { i}) = {\ frac {\ partial f} {\ partial x_ {i}}} (a_ {1}, \ ldots, a_ {n}).}\ frac {df_ {a_1, \ ldots, a_ {i-1}, a_ {i + 1}, \ ldots, a_n}} {dx_i} (a_i) = \ frac {\ partial f} {\ partial x_i} (a_1, \ ldots, a_n).

Другими словами, различные варианты индекса семейство функций с одной переменной, как в примере выше. Это выражение также показывает, что вычисление частных производных сводится к вычислению производных с одной переменной.

Важным примером функции нескольких переменных является случай скалярной функции f (x 1,..., x n) в домене в евклидовом пространстве R (например, в R или R ). В этом случае f имеет частную производную ∂f / ∂x j по каждой переменной x j. В точке (a 1,..., a n) эти частные производные определяют вектор

∇ f (a 1,…, an) = (∂ f ∂ x 1 (a 1,…, an),…, ∂ f ∂ xn (a 1,…, an)). {\ displaystyle \ nabla f (a_ {1}, \ ldots, a_ {n}) = \ left ({\ frac {\ partial f} {\ partial x_ {1}}} (a_ {1}, \ ldots, a_ {n}), \ ldots, {\ frac {\ partial f} {\ partial x_ {n}}} (a_ {1}, \ ldots, a_ {n}) \ right).}{\ displaystyle \ nabla f (a_ {1}, \ ldots, a_ {n}) = \ left ({\ frac {\ partial f} {\ partial x_ {1}}} (a_ {1}, \ ldots, a_ {n}), \ ldots, {\ frac {\ partial f} {\ part ial x_ {n}}} (a_ {1}, \ ldots, a_ {n}) \ right).}

Этот вектор называется градиентом функции f в точке a. Если f дифференцируема в каждой точке в некоторой области, то градиент - это вектор-функция ∇f, которая переводит точку (a 1,..., a n) в вектор ∇f (a 1,..., a n). Следовательно, градиент определяет векторное поле .

Производные по направлениям

Если f является действительной функцией на R, то частные производные f измеряют его изменение в направление осей координат. Например, если f является функцией x и y, то его частные производные измеряют изменение f в направлении x и направлении y. Однако они не измеряют напрямую изменение f в любом другом направлении, например вдоль диагональной линии y = x. Они измеряются с использованием производных по направлению. Выберите вектор

v = (v 1,…, v n). {\ displaystyle \ mathbf {v} = (v_ {1}, \ ldots, v_ {n}).}\ mathbf { v} = (v_ {1}, \ ldots, v_ {n}).

производная по направлению f в направлении v в точке x - это предел

D vf (x) = lim h → 0 f (x + hv) - f (x) h. {\ displaystyle D _ {\ mathbf {v}} {f} (\ mathbf {x}) = \ lim _ {h \ rightarrow 0} {\ frac {f (\ mathbf {x} + h \ mathbf {v}) -f (\ mathbf {x})} {h}}.}D _ {\ mathbf {v}} {f } (\ mathbf {x}) = \ lim _ {h \ rightarrow 0} {\ frac {f (\ mathbf {x} + h \ mathbf {v}) -f (\ mathbf {x})} {h} }.

В некоторых случаях может быть проще вычислить или оценить производную по направлению после изменения длины вектора. Часто это делается для того, чтобы превратить задачу в вычисление производной по направлению в направлении единичного вектора. Чтобы увидеть, как это работает, предположим, что v = λ u . Подставляем h = k / λ в разностное отношение. Коэффициент разности принимает следующий вид:

f (x + (k / λ) (λ u)) - f (x) k / λ = λ ⋅ f (x + k u) - f (x) k. {\ Displaystyle {\ гидроразрыва {е (\ mathbf {x} + (к / \ lambda) (\ lambda \ mathbf {u})) - f (\ mathbf {x})} {k / \ lambda}} = \ лямбда \ cdot {\ frac {f (\ mathbf {x} + k \ mathbf {u}) -f (\ mathbf {x})} {k}}.}{\ frac {f (\ mathbf {x} + (k / \ lambda) (\ lambda \ mathbf {u})) - f (\ mathbf {x})} {k / \ lambda}} = \ lambda \ cdot {\ frac {f (\ mathbf {x}) + к \ mathbf {u}) -f (\ mathbf {x})} {k}}.

Это λ, умноженное на коэффициент разницы для производная f по направлению от u . Кроме того, принятие предела, когда h стремится к нулю, аналогично принятию предела, когда k стремится к нулю, потому что h и k кратны друг другу. Следовательно, D v(f) = λD u(f). Из-за этого свойства масштабирования производные по направлению часто рассматриваются только для единичных векторов.

Если все частные производные f существуют и непрерывны в x, то они определяют производную f в направлении v по формуле:

D vf (x) = ∑ j = 1 nvj ∂ f ∂ xj. {\ displaystyle D _ {\ mathbf {v}} {f} ({\ boldsymbol {x}}) = \ sum _ {j = 1} ^ {n} v_ {j} {\ frac {\ partial f} {\ частичный x_ {j}}}.}D _ {\ mathbf {v}} {f} ({\ boldsymbol {x}}) = \ sum _ {j = 1} ^ {n} v_ {j} {\ frac {\ partial f} {\ partial x_ { j}}}.

Это следствие определения полной производной. Отсюда следует, что производная по направлению является линейной в v, что означает, что D v+ w(f) = D v(f) + D w(f).

То же определение также работает, когда f - функция со значениями в R . Приведенное выше определение применяется к каждому компоненту векторов. В этом случае производная по направлению является вектором в R.

Полная производная, полный дифференциал и матрица Якоби

Когда f является функцией от открытого подмножества R до R, тогда производная f по направлению в выбранном направлении является наилучшим линейным приближением к f в этой точке и в этом направлении. Но когда n>1, никакая производная по направлению не может дать полную картину поведения f. Полная производная дает полную картину, учитывая сразу все направления. То есть для любого вектора v, начиная с a, выполняется формула линейного приближения:

f (a + v) ≈ f (a) + f ′ (a) v. {\ displaystyle f (\ mathbf {a} + \ mathbf {v}) \ приблизительно f (\ mathbf {a}) + f '(\ mathbf {a}) \ mathbf {v}.}f(\mathbf {a} +\mathbf {v})\approx f(\mathbf {a})+f'(\mathbf {a})\mathbf {v}.

Так же, как производная с одной переменной, f '(a ) выбирается так, чтобы ошибка в этом приближении была как можно меньше.

Если n и m равны единице, то производная f '(a) является числом, а выражение f' (a) v является произведением двух чисел. Но в более высоких измерениях f '(a ) не может быть числом. Если бы это было число, то f '(a)vбыл бы вектором в R, тогда как другие члены были бы векторами в R, и поэтому формула не имела бы смысла. Чтобы формула линейной аппроксимации имела смысл, f '(a ) должна быть функцией, которая отправляет векторы из R в векторы в R, а f' ( a)vдолжен обозначать эту функцию, вычисленную в v.

. Чтобы определить, что это за функция, обратите внимание, что формула линейного приближения может быть переписана как

f (a + v) - f (a) ≈ f ′ (a) v. {\ displaystyle f (\ mathbf {a} + \ mathbf {v}) -f (\ mathbf {a}) \ приблизительно f '(\ mathbf {a}) \ mathbf {v}.}f(\mathbf {a} +\mathbf {v})-f(\mathbf {a})\approx f'(\mathbf {a})\mathbf {v}.

Обратите внимание, что если мы выберем другой вектор w, то это приближенное уравнение определяет другое приближенное уравнение путем замены v на w . Оно определяет третье приближенное уравнение путем подстановки обоих w для v и a+ vдля a . Вычитая эти два новых уравнения, мы получаем

f (a + v + w) - f (а + v) - е ( a + w) + f (a) ≈ f ′ (a + v) w - f ′ (a) w. {\ Displaystyle е (\ mathbf {a} + \ mathbf {v} + \ mathbf {w}) -f (\ mathbf {a} + \ mathbf {v}) -f (\ mathbf {a} + \ mathbf { w}) + f (\ mathbf {a}) \ приблизительно f '(\ mathbf {a} + \ mathbf {v}) \ mathbf {w} -f' (\ mathbf {a}) \ mathbf {w}. }f(\mathbf {a} +\mathbf {v} +\mathbf {w})-f(\mathbf {a} +\mathbf {v})-f(\mathbf {a} +\mathbf {w})+f(\mathbf {a})\approx f'(\mathbf {a} +\mathbf {v})\mathbf {w} -f'(\mathbf {a})\mathbf {w}.

Если мы предположим, что v мало и что производная непрерывно изменяется в a, то f ′ (a+ v) приблизительно равно f ′ (a ), поэтому правая часть приблизительно равна нулю. Левую часть можно переписать другим способом, используя формулу линейной аппроксимации с заменой v+ wна v . Формула линейного приближения подразумевает:

0 ≈ f (a + v + w) - f (a + v) - f (a + w) + f (a) = (f (a + v + w) - f (а)) - (f (a + v) - f (a)) - (f (a + w) - f (a)) ≈ f ′ (a) (v + w) - f ′ (a) v - f ′ (a) w. {\ displaystyle {\ begin {align} 0 \ приблизительно f (\ mathbf {a} + \ mathbf {v} + \ mathbf {w}) -f (\ mathbf {a} + \ mathbf {v}) -f ( \ mathbf {a} + \ mathbf {w}) + f (\ mathbf {a}) \\ = (f (\ mathbf {a} + \ mathbf {v} + \ mathbf {w}) -f (\ mathbf {a})) - (f (\ mathbf {a} + \ mathbf {v}) -f (\ mathbf {a})) - (f (\ mathbf {a} + \ mathbf {w}) -f (\ mathbf {a})) \\ \ приблизительно f '(\ mathbf {a}) (\ mathbf {v} + \ mathbf {w}) -f' (\ mathbf {a}) \ mathbf {v} -f '(\ mathbf {a}) \ mathbf {w}. \ end {align}}}{\begin{aligned}0\approx f(\mathbf {a} +\mathbf {v} +\mathbf {w})-f(\mathbf {a} +\mathbf {v})-f(\mathbf {a} +\mathbf {w})+f(\mathbf {a})\\=(f(\mathbf {a} +\mathbf {v} +\mathbf {w})-f(\mathbf {a}))-(f(\mathbf {a} +\mathbf {v})-f(\mathbf {a}))-(f(\mathbf {a} +\mathbf {w})-f(\mathbf {a}))\\\approx f'(\mathbf {a})(\mathbf {v} +\mathbf {w})-f'(\mathbf {a})\mathbf {v} -f'(\mathbf {a})\mathbf {w}.\end{aligned}}

Это означает, что f' (a ) является линейным преобразованием из векторного пространства R в векторное пространство R . Фактически, это возможно сделать точный вывод, измерив погрешность приближений. Предположим, что ошибка в этой формуле линейного приближения ограничена постоянным временем || v ||, где константа не зависит от v, но непрерывно зависит от a . Затем, после добавления соответствующего члена ошибки, все приведенные выше приблизительные равенства можно перефразировать как неравенства. В частности, f '(a ) является линейным преобразованием с точностью до малой погрешности. В пределе, когда v и w стремятся к нулю, это должно быть линейное преобразование. Поскольку мы определяем полную производную, взяв предел, поскольку v стремится к нулю, f '(a ) должно быть линейным преобразованием.

В одной переменной тот факт, что производная является наилучшим линейным приближением, выражается тем фактом, что это предел разностных коэффициентов. Однако обычный коэффициент разности не имеет смысла в более высоких измерениях, потому что обычно невозможно разделить векторы. В частности, числитель и знаменатель разностного отношения даже не находятся в одном и том же векторном пространстве: числитель находится в кодовой области R, а знаменатель лежит в области R . Кроме того, производная - это линейное преобразование, объект, отличный от числителя и знаменателя. Чтобы уточнить идею о том, что f '(a ) является наилучшим линейным приближением, необходимо адаптировать другую формулу для производной с одной переменной, в которой эти проблемы исчезают. Если f: R→ R, то обычное определение производной может быть изменено, чтобы показать, что производная f в точке a является уникальным числом f '(a), таким что

lim h → 0 f (a + h) - (е (а) + е '(а) час) час = 0. {\ Displaystyle \ lim _ {час \ к 0} {\ гидроразрыва {f (а + час) - (f (а) + f' ( a) h)} {h}} = 0.}{\displaystyle \lim _{h\to 0}{\frac {f(a+h)-(f(a)+f'(a)h)}{h}}=0.}

Это эквивалентно

lim h → 0 | f (a + h) - (f (a) + f ′ (a) h) | | ч | Знак равно 0 {\ displaystyle \ lim _ {h \ to 0} {\ frac {| f (a + h) - (f (a) + f '(a) h) |} {| h |}} = 0}{\displaystyle \lim _{h\to 0}{\frac {|f(a+h)-(f(a)+f'(a)h)|}{|h|}}=0}

, потому что предел функции стремится к нулю тогда и только тогда, когда предел абсолютного значения функции стремится к нулю. Эту последнюю формулу можно адаптировать к ситуации с множеством переменных, заменив абсолютные значения на нормы.

Определение полной производной функции f в a, следовательно, состоит в том, что это единственное линейное преобразование f ′ (a ): R→ Rтакое, что

lim h → 0 ‖ f (a + h) - (f (a) + f ′ (a) час) ‖ ‖ час ‖ знак равно 0. {\ displaystyle \ lim _ {\ mathbf {h} \ to 0} {\ frac {\ lVert f (\ mathbf {a} + \ mathbf {h}) - (f ( \ mathbf {a}) + f '(\ mathbf {a}) \ mathbf {h}) \ rVert} {\ lVert \ mathbf {h} \ rVert}} = 0.}{\displaystyle \lim _{\mathbf {h} \to 0}{\frac {\lVert f(\mathbf {a} +\mathbf {h})-(f(\mathbf {a})+f'(\mathbf {a})\mathbf {h})\rVert }{\lVert \mathbf {h} \rVert }}=0.}

Здесь h - вектор в R, поэтому нормой в знаменателе является стандартная длина на R . Однако f ′ (a)h- вектор в R, а норма в числителе - это стандартная длина на R . Если v - вектор, начинающийся с a, то f ′ (a)vназывается pushforward для v с помощью f и иногда записывается как f ∗v.

Если полная производная существует в a, то все частные производные и производные по направлению от f существуют в a, и для всех v, f '(a)v- производная по направлению от f в направлении v .Если мы запишем f с помощью координатных функций, так что f = (f 1, f 2,..., f m), тогда полная производная может быть выражена с использованием частных производных в виде матрицы . Эта матрица называется матрицей Якоби функции f при a:

f ′ (a) = Jac a Знак равно (∂ fi ∂ xj) ij. {\ Displaystyle f '(\ mathbf {a}) = \ operatorname {Jac} _ {\ mathbf {a}} = \ left ({\ frac {\ partial f_ {i}}) {\ partial x_ {j}}} \ right) _ {ij}.}f'(\mathbf {a})=\operatorname {Jac} _{\mathbf {a} }=\left({\frac {\partial f_{i}}{\partial x_{j}}}\right)_{ij}.

Существование полной производной f ′ (a ) строго строго чем существование всех частных производных, но если частные производные существуют и непрерывны, тогда полная производная существует, задается якобианом и непрерывно зависит от a.

Определение полной производной включает определение производная по одной переменной. То есть, если f является действительной функцией действительной переменной, то полная производная существует тогда и только тогда, когда существует обычная производная. Матрица Якоби сводится к матрице 1 × 1, единственным элементом которой является производная f ′ (x). Эта матрица 1 × 1 удовлетворяет тому свойству, что f (a + h) - (f (a) + f ′ (a) h) приблизительно равно нулю, другими словами, что

f (a + h) ≈ f (a) + f ′ (a) h. {\ displaystyle f (a + h) \ приблизительно f (a) + f '(a) h.}f(a+h)\approx f(a)+f'(a)h.

Вплоть до изменения переменных, это утверждение, что функция x ↦ f (a) + f ′ (A) (x - a) {\ displaystyle x \ mapsto f (a) + f '(a) (xa)}x\mapsto f(a)+f'(a)(x-a)- наилучшее линейное приближение к f в a.

Полная производная функции не дает другую функцию так же, как в случае с одной переменной. Это связано с тем, что полная производная функции многих переменных должна записывать гораздо больше информации, чем производная функции одной переменной. Вместо этого полная производная дает функцию от касательного пучка источника к касательному пучку цели.

Естественный аналог полных производных второго, третьего и более высоких порядков не является линейным преобразованием, не является функцией на касательном расслоении и не строится путем многократного взятия полной производной. Аналог производной более высокого порядка, называемый струей, не может быть линейным преобразованием, потому что производные более высокого порядка отражают тонкую геометрическую информацию, такую ​​как вогнутость, которую нельзя описать в терминах линейных данных, таких как векторы. Это не может быть функцией касательного пучка, потому что в касательном пучке есть место только для базового пространства и производных по направлениям. Поскольку струи захватывают информацию более высокого порядка, они принимают в качестве аргументов дополнительные координаты, представляющие изменения направления более высокого порядка. Пространство, определяемое этими дополнительными координатами, называется струйным пучком. Связь между полной производной и частными производными функции аналогична соотношению между струей k-го порядка функции и ее частными производными порядка, меньшего или равного k.

Повторно взяв полную производную, можно получить более высокие версии производной Фреше, специализированные для R . Полная производная k-го порядка может быть интерпретирована как отображение

D kf: R n → L k (R n × ⋯ × R n, R m) {\ displaystyle D ^ {k} f: \ mathbb {R} ^ {n} \ к L ^ {k} (\ mathbb {R} ^ {n} \ times \ cdots \ times \ mathbb {R} ^ {n}, \ mathbb {R} ^ {m})}D ^ {k} f: \ mathbb {R} ^ {n} \ to L ^ {k} (\ mathbb { R} ^ {n} \ times \ cdots \ times \ mathbb {R} ^ {n}, \ mathbb {R} ^ {m})

который берет точку x в R и присваивает ей элемент пространства k-линейных отображений из R в R - «наилучшее» (в определенном точном смысле) k-линейное приближение к f в этой точке. Предварительно составив его с помощью диагонального отображения Δ, x → (x, x), можно начать обобщенный ряд Тейлора как

f (x) ≈ f (a) + (D f) (x - a) + (D 2 f) (Δ (x - a)) + ⋯ = f (a) + (D f) (x - a) + (D 2 f) (x - a, x - a) + ⋯ = f (a) + ∑ i (D f) i (xi - ai) + ∑ j, k (D 2 f) jk (xj - aj) (xk - ak) + ⋯ {\ displaystyle {\ begin {align} f (\ mathbf {x}) \ приблизительно f (\ mathbf {a}) + (Df) (\ mathbf {xa}) + \ left (D ^ {2} f \ right) (\ Delta (\ mathbf {xa})) + \ cdots \\ = f (\ mathbf {a}) + (Df) (\ mathbf {xa}) + \ left (D ^ {2} f \ right) (\ mathbf {xa}, \ mathbf {xa}) + \ cdots \\ = f (\ mathbf {a}) + \ sum _ {i} (Df) _ {i} (x_ {i} -a_ { i}) + \ sum _ {j, k} \ left (D ^ {2} f \ right) _ {jk} (x_ {j} -a_ {j}) (x_ {k} -a_ {k}) + \ cdots \ end {align}}}{\ displaystyle {\ begin {align} f (\ mathbf {x }) \ приблизительно f (\ mathbf {a}) + (Df) (\ mathbf {xa}) + \ left (D ^ {2} f \ right) (\ Delta (\ mathbf {xa})) + \ cdots \\ = f (\ mathbf {a}) + (Df) (\ mathbf {xa}) + \ left (D ^ {2} f \ right) (\ mathbf {xa}, \ mathbf {xa}) + \ cdots \\ = f (\ mathbf {a}) + \ sum _ {i} (Df) _ {i} (x_ {i} -a_ {i}) + \ sum _ {j, k} \ left (D ^ {2} f \ right) _ {jk} (x_ {j} -a_ {j}) (x_ {k} -a_ {k}) + \ cdots \ end {align}}}

где f (a ) идентифицируется с постоянной функцией, x i - a i - это компоненты вектора x− a, а (Df) i и (Df) jk являются компонентами Df и Df как линейные преобразования.

Обобщения

Концепция производной может быть расширена на многие другие параметры. Обычно производная функции в точке служит линейным приближением функции в этой точке.

История

Исчисление, известное в своей ранней истории как исчисление бесконечно малых, это математическая дисциплина, сфокусированная на пределах, функциях, производных, интегралах и бесконечных рядах. Исаак Ньютон и Готфрид Лейбниц независимо друг от друга открыли исчисление в середине 17 века. Однако каждый изобретатель утверждал, что другой украл его работу, в горьком споре, который длился до конца их жизни.

См. Также

  • значок Портал математики

Примечания

Ссылки

Библиография

Печать

Электронные книги

Внешние ссылки

Последняя правка сделана 2021-05-17 14:27:43
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте