Характеристический многочлен

редактировать

Многочлен, корни которого являются собственными значениями матрицы

В линейной алгебре символ характеристический многочлен квадратной матрицы является полиномом , который инвариантен относительно подобия матрицы и имеет собственные значения как корни. Среди его коэффициентов есть определитель и след матрицы. Характеристический многочлен эндоморфизма векторных пространств конечной размерности является характеристическим многочленом матрицы эндоморфизма над любой базой; это не зависит от выбора основы. характеристическое уравнение, также известное как детерминантное уравнение, представляет собой уравнение, полученное приравниванием к нулю характеристического полинома.

В теории спектральных графов характеристический многочлен графа graph является характеристическим многочленом его матрицы смежности.

Содержание

  • 1 Мотивация
  • 2 Формальное определение
  • 3 Примеры
  • 4 Свойства
  • 5 Характеристический многочлен произведения двух матриц
  • 6 Характеристический многочлен A
  • 7 Светская функция и светское уравнение
    • 7.1 Секулярная функция
    • 7.2 Секулярная функция
  • 8 Для общих ассоциативных алгебр
  • 9 См. Также
  • 10 Ссылки

Мотивация

Учитывая квадратную матрицу A, мы хотим найти многочлен, нули которого являются собственными значениями матрицы A. Для диагональной матрицы A характеристический многочлен легко определить: если диагональные элементы равны a 1, a 2, a 3 и т.д., то характеристический многочлен будет:

(t - a 1) (t - a 2) (t - a 3)). {\ displaystyle (t-a_ {1}) (t-a_ {2}) (t-a_ {3}) \ cdots.}{\ displaystyle (t-a_ {1}) (t-a_ {2}) (t- a_ {3}) \ cdots.}

Это работает, потому что диагональные элементы также являются собственными значениями этой матрицы.

Для общей матрицы A можно действовать следующим образом. Скаляр λ является собственным значением A тогда и только тогда, когда существует ненулевой вектор v, называемый собственным вектором, такой, что

A v = λ v, {\ displaystyle A \ mathbf {v} = \ lambda \ mathbf {v},}{\ displaystyle A \ mathbf {v} = \ lambda \ mathbf {v},}

или, что эквивалентно,

(λ I - A) v = 0 {\ displaystyle (\ lambda IA) \ mathbf {v} = 0}{\ displaystyle (\ lambda IA) \ mathbf {v} = 0}

(где I - единичная матрица ). Поскольку v должен быть ненулевым, это означает, что матрица λI - A имеет ненулевое ядро ​​. Таким образом, эта матрица не является обратимой, и то же самое верно для ее определителя , который, следовательно, должен быть равен нулю. Таким образом, собственные значения матрицы A - это корни функции det (λI - A), которая является полиномом от λ.

Формальное определение

Мы рассматриваем матрицу размера n × n A. Характеристический многочлен матрицы A, обозначенный p A (t), является многочленом, определяемым как

п A (t) = det (t I - A) {\ displaystyle p_ {A} (t) = \ det \ left (tI-A \ right)}p_A (t) = \ det \ left (tI - A \ right)

где I обозначает n × n единичная матрица.

Некоторые авторы определяют характеристический полином как det (A - tI). Этот многочлен отличается от указанного здесь знаком (−1), поэтому он не имеет значения для таких свойств, как наличие в качестве корней собственных значений A; однако приведенное выше определение всегда дает монический многочлен , тогда как альтернативное определение является моническим только тогда, когда n четно.

Примеры

Предположим, мы хотим вычислить характеристический полином матрицы

A = (2 1 - 1 0). {\ displaystyle A = {\ begin {pmatrix} 2 1 \\ - 1 0 \ end {pmatrix}}.}A = \ begin {pmatrix} 2 1 \\ -1 0 \ end {pmatrix}.

Теперь мы вычисляем определитель числа

t I - A = (t - 2-1 1 t - 0) {\ displaystyle tI-A = {\ begin {pmatrix} t-2 -1 \\ 1 t-0 \ end {pmatrix}}}t IA = \ begin {p матрица} t-2 -1 \\ 1 t-0 \ end {pmatrix}

, что равно (t - 2) t - 1 (- 1) знак равно t 2 - 2 t + 1, {\ displaystyle (t-2) t-1 (-1) = t ^ {2} -2t + 1 \, \ !,}(t-2) t - 1 (-1) = t ^ 2-2t + 1 \, \ !, характеристический многочлен A.

В другом примере используются гиперболические функции от гиперболического угла φ. В качестве матрицы возьмем

A = (ch ⁡ (φ) sinh ⁡ (φ) sinh ⁡ (φ) ch (φ)). {\ displaystyle A = {\ begin {pmatrix} \ cosh (\ varphi) \ sinh (\ varphi) \\\ sinh (\ varphi) \ cosh (\ varphi) \ end {pmatrix}}.}{\ displaystyle A = {\ begin {pmatrix} \ cosh (\ varphi) \ sinh (\ varphi) \\\ sinh (\ varphi) \ cosh (\ varphi) \ end {pmatrix}}.}

Его характеристический полином равен

det (t I - A) = (t - ch ⁡ (φ)) 2 - sh 2 ⁡ (φ) = t 2 - 2 t ch ⁡ (φ) + 1 = (t - e φ) (t - e - φ). {\ displaystyle \ det (tI-A) = (t- \ cosh (\ varphi)) ^ {2} - \ sinh ^ {2} (\ varphi) = t ^ {2} -2t \ \ cosh (\ varphi) + 1 = (te ^ {\ varphi}) (te ^ {- \ varphi}).}{\ Displaystyl e \ det (tI-A) = (t- \ ch (\ varphi)) ^ {2} - \ sinh ^ {2} (\ varphi) = t ^ {2} -2t \ \ cosh (\ varphi) + 1 знак равно (те ^ {\ varphi}) (те ^ {- \ varphi}).}

Свойства

Многочлен p A (t) является моническим (его старший коэффициент равен 1) и его степень равна n. Самый важный факт о характеристическом полиноме уже упоминался в мотивационном абзаце: собственные значения A - это в точности корни из p A (t) (это также верно для минимальный многочлен от A, но его степень может быть меньше n). Коэффициенты характеристического полинома - это все выражения полинома в элементах матрицы. В частности, его постоянный коэффициент p A (0) равен det (−A) = (−1) det (A), коэффициент при t равен единице, а коэффициент при t равен tr (−A) = −tr (A), где tr (A) - это след для A. (Знаки, приведенные здесь, соответствуют формальному определению, данному в предыдущем разделе; для альтернативного определения это будет det ( A) и (−1) tr (A) соответственно.)

Для матрицы A 2 × 2 характеристический многочлен, таким образом, определяется как

t 2 - tr ⁡ (A) t + det ( А). {\ displaystyle t ^ {2} - \ operatorname {tr} (A) t + \ det (A).}t ^ {2} - \ operatorname {tr} (A) t + \ det (A).

Используя язык внешней алгебры, можно компактно выразить характеристический многочлен n × n матрица A как

п A (t) = ∑ К знак равно 0 ntn - k (- 1) k tr ⁡ (Λ k A) {\ displaystyle p_ {A} (t) = \ sum _ {k = 0} ^ {n} t ^ {nk} (- 1) ^ {k} \ operatorname {tr} (\ Lambda ^ {k} A)}p_A (t) = \ sum_ {k = 0 } ^ nt ^ {nk} (-1) ^ k \ operatorname {tr} (\ Lambda ^ k A)

где tr (ΛA) - след k внешней мощности элемента A, имеющего размерность (nk) {\ displaystyle {\ tbinom {n} {k}}}{\ tbinom {n} {k }} . Эта трасса может быть вычислена как сумма всех основных миноров A размера k. Рекурсивный алгоритм Фаддеева – Леверье вычисляет эти коэффициенты более эффективно.

Когда характеристика равна 0, она альтернативно может быть вычислена как один определитель, определяющий матрицу k × k,

tr ⁡ (Λ k A) = 1 k! | tr ⁡ A k - 1 0 ⋯ tr ⁡ A 2 tr ⁡ A k - 2 ⋯ ⋮ ⋮ ⋱ ⋮ tr ⁡ A k - 1 tr ⁡ A k - 2 ⋯ 1 tr ⁡ A k tr ⁡ A k - 1 ⋯ tr ⁡ А |. {\ displaystyle \ operatorname {tr} (\ Lambda ^ {k} A) = {\ frac {1} {k!}} {\ begin {vmatrix} \ operatorname {tr} A k-1 0 \ cdots \\\ operatorname {tr} A ^ {2} \ operatorname {tr} A k-2 \ cdots \\\ vdots \ vdots \ ddots \ vdots \\\ operatorname {tr} A ^ {k-1} \ operatorname {tr} A ^ {k-2} \ cdots 1 \\\ operatorname {tr} A ^ {k} \ operatorname {tr} A ^ {k-1} \ cdots \ operatorname {tr} A \ end {vmatrix}} ~.}{\ displaystyle \ operatorname {tr} (\ Lambda ^ {k} A) = {\ frac {1} {k!}} {\ begin {vmatrix} \ operatorname {tr} A k-1 0 \ cdots \\\ operatorname {tr} A ^ {2} \ operatorname {tr} A k-2 \ cdots \\\ vdots \ vdots \ ddots \ vdots \\ \ operatorname {tr} A ^ {k-1} \ operatorname {tr} A ^ {k-2} \ cdots 1 \\\ operatorname {tr} A ^ {k} \ operatorname {tr} A ^ { k-1} \ cdots \ operatorname {tr} A \ end {vmatrix}} ~.}

Теорема Кэли – Гамильтона утверждает, что замена t на A в характеристическом полиноме (интерпретация полученных степеней как степени матрицы, а постоянный член c как c, умноженный на единичная матрица) дает нулевую матрицу. Неформально говоря, каждая матрица удовлетворяет собственному характеристическому уравнению. Это утверждение эквивалентно утверждению, что минимальный многочлен матрицы A делит характеристический многочлен матрицы A.

Две одинаковые матрицы имеют одинаковый характеристический многочлен. Обратное, однако, в общем случае неверно: две матрицы с одинаковым характеристическим полиномом не обязательно должны быть похожими.

Матрица A и ее транспонированная имеют один и тот же характеристический многочлен. A похожа на треугольную матрицу тогда и только тогда, когда ее характеристический многочлен может быть полностью разложен на линейные множители над K (то же самое верно с минимальным многочленом вместо характеристического многочлена). В этом случае A подобна матрице в нормальной форме Жордана.

Характеристический многочлен произведения двух матриц

Если A и B - две квадратные матрицы размера n × n, то характеристические многочлены матрицы AB и BA совпадают:

p AB (t) = p BA (t). {\ displaystyle p_ {AB} (t) = p_ {BA} (t). \,}p_ {AB} (t) = p_ {BA} (t). \,

Когда A неособое число, этот результат следует из того факта, что AB и BA аналогичный :

BA = A - 1 (AB) A. {\ displaystyle BA = A ^ {- 1} (AB) A.}BA = A ^ {{- 1}} (AB) A.

В случае, когда и A, и B являются сингулярными, можно заметить, что желаемое тождество является равенством между многочленами от t и коэффициентами матрицы. Таким образом, чтобы доказать это равенство, достаточно доказать, что оно проверяется на непустом открытом подмножестве (для обычной топологии или, в более общем смысле, для Топология Зарисского ) пространства всех коэффициентов. Поскольку неособые матрицы образуют такое открытое подмножество пространства всех матриц, это доказывает результат.

В более общем смысле, если A - матрица порядка m × n, а B - матрица порядка n × m, то AB - это матрица m × m, а BA - матрица размера n × n, и одна имеет

p BA (t) = tn - mp AB (t). {\ displaystyle p_ {BA} (t) = t ^ {nm} p_ {AB} (t). \,}p_ {BA} (t) = t ^ {нм} p_ {AB} (t). \,

Чтобы доказать это, можно предположить, что n>m, заменив, если необходимо, A и B Тогда, ограничив A снизу n - m строками нулей и B справа, n - m столбцами нулей, мы получим две матрицы A 'и B' размера n × n, такие что B'A ' = BA, а A'B 'равно AB, окаймленному n - m строками и столбцами с нулями. Результат следует из случая квадратных матриц, сравнивая характеристические многочлены A'B 'и AB.

Характеристический многочлен A

Если λ {\ displaystyle \ lambda}\ lambda является собственным значением квадратной матрицы A с собственным вектором v, тогда ясно, что λ k {\ displaystyle \ lambda ^ {k}}\ lambda ^ {k} является собственным значением A

A kv = A k - 1 A v = λ A k - 1 v = ⋯ = λ кв. {\ displaystyle A ^ {k} {\ textbf {v}} = A ^ {k-1} A {\ textbf {v}} = \ lambda A ^ {k-1} {\ textbf {v}} = \ точки = \ lambda ^ {k} {\ textbf {v}}.}{\ displaystyle A ^ {k} {\ textbf {v}} = A ^ {k-1} A {\ textbf {v}} = \ lambda A ^ {k-1} {\ textbf {v }} = \ точки = \ лямбда ^ {k} {\ textbf {v}}.}

Также можно показать, что кратности совпадают, и это обобщается на любой многочлен вместо xk {\ displaystyle x ^ {k }}x ^ {k} :

Теорема. Пусть A - квадратная матрица размера n × n, а f (t) {\ displaystyle f (t)}е (т) - многочлен. Если характеристический многочлен A имеет факторизацию

p A (t) = (t - λ 1) (t - λ 2) ⋯ (t - λ n) {\ displaystyle p_ {A} (t) = (t - \ lambda _ {1}) (t- \ lambda _ {2}) \ cdots (t- \ lambda _ {n})}{\ displaystyle p_ {A} (t) = (t- \ lambda _ {1}) (t- \ lambda _ {2}) \ cdots (t- \ lambda _ {n})}

, то характеристический многочлен матрицы f (A) {\ displaystyle f (A)}f (A) определяется как

pf (A) (t) = (t - f (λ 1)) (t - f (λ 2)) ⋯ (t - f ( λ n)). {\ Displaystyle p_ {е (A)} (t) = (tf (\ lambda _ {1})) (tf (\ lambda _ {2})) \ cdots (tf (\ lambda _ {n})). }{\ displaystyle p_ { f (A)} (t) = (tf (\ lambda _ {1})) (tf (\ lambda _ {2})) \ cdots (tf (\ lambda _ {n})).}

То есть алгебраическая кратность λ {\ displaystyle \ lambda}\ lambda в f (A) {\ displaystyle f (A)}f (A) равна сумма алгебраических кратностей λ ′ {\ displaystyle \ lambda '}\lambda 'в A {\ displaystyle A}A над λ ′ {\ displaystyle \ lambda '}\lambda 'такая, что f (λ ′) = λ {\ displaystyle f (\ lambda') = \ lambda}{\displaystyle f(\lambda ')=\lambda }. В частности, тр ⁡ (е (A)) = ∑ я = 1 nf (λ я) {\ displaystyle \ operatorname {tr} (f (A)) = \ textstyle \ sum _ {i = 1} ^ {n} е (\ лямбда _ {я})}{\ displaystyle \ operatorname {tr} (f (A)) = \ textstyle \ sum _ {i = 1} ^ {n} f (\ lambda _ {i})} и det ⁡ (f (A)) = ∏ я = 1 nf (λ я) {\ displaystyle \ operatorname {det} ( е (A)) = \ textstyle \ prod _ {i = 1} ^ {n} f (\ lambda _ {i})}{\ displaystyle \ operatorname {det} (f (A)) = \ textstyle \ prod _ {i = 1} ^ {n} f (\ lambda _ {i})} . Здесь многочлен f (t) = t 3 + 1 {\ displaystyle f (t) = t ^ {3} +1}{\ displaystyle f (t) = t ^ {3} +1} , например, вычисляется на матрице A просто как f (A) = A 3 + 1 {\ displaystyle f (A) = A ^ {3} +1}{\ displaystyle f (A) = A ^ {3} +1} .

Теорема применима к матрицам и многочленам над любым полем или коммутативным кольцом. Однако предположение, что p A (t) {\ displaystyle p_ {A} (t)}{\ displaystyle p_ {A} (t)} имеет факторизацию в линейные коэффициенты, не всегда верно, если только матрица не превышает алгебраически замкнутое поле, например комплексные числа.

Доказательство

Это доказательство применимо только к матрицам и многочленам над комплексными числами (или к любому алгебраически замкнутому полю). В этом случае характеристический многочлен любой квадратной матрицы всегда можно разложить на множители как

p A (t) = (t - λ 1) (t - λ 2) ⋯ (t - λ n) {\ displaystyle p_ {A } (t) = (t- \ lambda _ {1}) (t- \ lambda _ {2}) \ cdots (t- \ lambda _ {n})}{\ displaystyle p_ {A} (t) = (t- \ lambda _ {1}) (t- \ lambda _ {2}) \ cdots (t- \ lambda _ {n})}

где λ 1, λ 2,…, Λ N {\ displaystyle \ lambda _ {1}, \ lambda _ {2}, \ dots, \ lambda _ {n}}\ lambda _ {1}, \ lambda _ {2}, \ точки, \ lambda _ {n} - собственные значения A {\ displaystyle A }A , возможно, повторяется. Более того, теорема разложения Джордана гарантирует, что любая квадратная матрица A {\ displaystyle A}A может быть разложена как A = S - 1 US {\ displaystyle A = S ^ {- 1} US}{\ displaystyle A = S ^ {- 1} US} , где S {\ displaystyle S}S - это обратимая матрица, а U {\ displaystyle U }U - это верхний треугольник с λ 1,…, λ n {\ displaystyle \ lambda _ {1}, \ dots, \ lambda _ {n}}{\ displaystyle \ lambda _ {1}, \ точки, \ lambda _ {n}} по диагонали (каждое собственное значение повторяется в соответствии с его алгебраической кратностью). (Нормальная форма Жордана имеет более сильные свойства, но их достаточно; в качестве альтернативы можно использовать разложение Шура, которое менее популярно, но несколько легче доказать).

Пусть f (t) = ∑ я α iti {\ displaystyle f (t) = \ textstyle \ sum _ {i} \ alpha _ {i} t ^ {i}}{\ displaystyle f (t) = \ textstyle \ sum _ {i} \ alpha _ {i} t ^ {i}} . Тогда

f (A) = ∑ α i (S - 1 US) i = ∑ α i S - 1 USS - 1 US ⋯ S - 1 US = ∑ α i S - 1 U i S = S - 1 ( ∑ α я U я) S знак равно S - 1 е (U) S {\ Displaystyle F (A) = \ textstyle \ sum \ альфа _ {я} (S ^ {- 1} США) ^ {i} = \ textstyle \ sum \ alpha _ {i} S ^ {- 1} USS ^ {- 1} US \ cdots S ^ {- 1} US = \ textstyle \ sum \ alpha _ {i} S ^ {- 1} U ^ { i} S = S ^ {- 1} (\ textstyle \ sum \ alpha _ {i} U ^ {i}) S = S ^ {- 1} f (U) S}{ \ displaystyle f (A) = \ textstyle \ sum \ alpha _ {i} (S ^ {- 1} US) ^ {i} = \ textstyle \ sum \ alpha _ {i} S ^ {- 1} USS ^ { -1} США \ cdots S ^ {- 1} US = \ textstyle \ sum \ alpha _ {i} S ^ {- 1} U ^ {i} S = S ^ {- 1} (\ textstyle \ sum \ alpha _ {я} U ^ {я}) S = S ^ {- 1} f (U) S} .

Легко проверить верхнетреугольная матрица U {\ displaystyle U}U с диагональю λ 1,…, λ n {\ displaystyle \ lambda _ {1}, \ dots, \ lambda _ {n} }{\ displaystyle \ lambda _ {1}, \ точки, \ lambda _ {n}} , матрица U i {\ displaystyle U ^ {i}}{\ displaystyle U ^ {i}} является верхним треугольником с диагональю λ 1 i,…, λ ni {\ displaystyle \ лямбда _ {1} ^ {я}, \ точки, \ лямбда _ {n} ^ {i}}{\ displaystyle \ lambda _ {1} ^ {i}, \ dots, \ lambda _ {n } ^ {i}} в U я {\ displaystyle U ^ {i}}{\ displaystyle U ^ {i}} , и, следовательно, f (U) {\ displaystyle f (U)}f (U) верхний треугольник с диагональю f (λ 1),…, f (λ n) {\ displaystyle f (\ lambda _ {1}), \ dots, f (\ lambda _ {n})}{\ displaystyle f (\ lambda _ {1}), \ dots, f (\ lambda _ {n})} . Следовательно, собственные значения f (U) {\ displaystyle f (U)}f (U) равны f (λ 1),…, f (λ n) {\ displaystyle f (\ lambda _ {1}), \ точки, f (\ lambda _ {n})}{\ displaystyle f (\ lambda _ {1}), \ dots, f (\ lambda _ {n})} . Поскольку f (A) = S - 1 f (U) S {\ displaystyle f (A) = S ^ {- 1} f (U) S}{\ displaystyle f (A) = S ^ {- 1} f (U) S} равно аналогично до f (U) {\ displaystyle f (U)}f (U) , он имеет те же собственные значения с той же алгебраической кратностью.

Секулярная функция и секулярное уравнение

Секулярная функция

Термин секулярная функция использовался для того, что сейчас называется характеристическим полиномом (в некоторых источниках термин секулярная функция все еще используется). Термин происходит от того факта, что характеристический полином использовался для расчета вековых возмущений (в масштабе века, т. Е. Медленного по сравнению с годовым движением) планетных орбит, согласно Лагранжу Русская теория колебаний.

Светское уравнение

Светское уравнение может иметь несколько значений.

  • В линейной алгебре оно иногда используется вместо характеристического уравнения.
  • В астрономии это алгебраическое или числовое выражение величины неравенств в движение планеты, которое сохраняется после того, как неравенства короткого периода были учтены.
  • В расчетах молекулярных орбиталей, касающихся энергии электрона и его волновой функции, оно также используется вместо характеристического уравнения.

Для общих ассоциативных алгебр

Приведенное выше определение характеристического многочлена матрицы A ∈ M n (F) {\ displaystyle A \ in M_ {n} (F)}{\ displaystyle A \ in M_ {n} (F)} с записями в поле F без каких-либо изменений обобщается на случай, когда F представляет собой просто коммутативное кольцо. Гарибальди (2004) определяет характеристический полином для элементов произвольной конечномерной (ассоциативной, но не обязательно коммутативной) алгебры над полем F и доказывает стандартные свойства характеристического полинома в этой общности.

См. Также

Ссылки

  • TS Блит и Э. Ф. Робертсон (1998) Базовая линейная алгебра, стр. 149, Springer ISBN 3-540-76122-5.
  • Джон Б. Фрали и Раймонд А. Борегар (1990) Линейная алгебра, 2-е издание, стр. 246, Аддисон-Уэсли ISBN 0-201-11949-8.
  • Гарибальди, Скип (2004), «Характеристический многочлен и определитель не являются специальными конструкциями ", American Mathematical Monthly, 111 (9): 761–778, arXiv : math / 0203276, doi : 10.2307 / 4145188, MR 2104048
  • Вернер Гройб (1974), линейная алгебра, 4-е издание, стр. 120–5, Springer, ISBN 0-387-90110 -8.
  • Пол С. Шилдс (1980) Elementary Linear Algebra, 3-е издание, стр. 274, Worth Publishers ISBN 0-87901-121-1.
  • Гилберт Стрэнг (1988) Линейная алгебра и ее приложения, 3-е издание, стр. 246, Brooks/Cole ISBN 0-15-551005-3.
Последняя правка сделана 2021-05-14 06:08:49
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте