В математике, А матрица (множественное число матриц) представляет собой прямоугольный массив или таблица чисел, символов или выражений, расположенный в строках и столбцах, который используется для представления математического объекта или свойства такого объекта. Например,
матрица с двумя строками и тремя столбцами; часто говорят «матрица два на три», «матрица 2 × 3 » или матрица размерности 2 × 3.
Без дополнительных спецификаций матрицы представляют собой линейные карты и позволяют выполнять явные вычисления в линейной алгебре. Таким образом, изучение матриц - это большая часть линейной алгебры, и большинство свойств и операций абстрактной линейной алгебры можно выразить в терминах матриц. Например, умножение матриц представляет собой композицию линейных карт.
Не все матрицы относятся к линейной алгебре. Это, в частности, имеет место в теории графов, из инцидентности матриц и матриц смежности. В этой статье основное внимание уделяется матрицам, относящимся к линейной алгебре, и, если не указано иное, все матрицы представляют собой линейные карты или могут рассматриваться как таковые.
Квадратные матрицы, матрицы с одинаковым количеством строк и столбцов, играют важную роль в теории матриц. Квадратные матрицы заданной размерности образуют некоммутативное кольцо, которое является одним из наиболее распространенных примеров некоммутативного кольца. Определитель квадратной матрицы представляет собой число, связанное с матрицей, которая является фундаментальной для изучения квадратной матрицы; например, квадратная матрица обратима тогда и только тогда, когда она имеет ненулевой определитель, а собственные значения квадратной матрицы являются корнями полиномиального определителя.
В геометрии матрицы широко используются для задания и представления геометрических преобразований (например, поворотов ) и изменений координат. В численном анализе многие вычислительные проблемы решаются путем сведения их к вычислению матриц, что часто требует вычислений с матрицами огромной размерности. Матрицы используются в большинстве областей математики и в большинстве областей науки либо напрямую, либо посредством их использования в геометрии и численном анализе.
Матрица представляет собой прямоугольный массив чисел (или других математических объектов), для которых такие операции, как дополнение и умножения определены. Чаще всего, матрица над полем F представляет собой прямоугольный массив скаляров, каждый из которых является членом F. Вещественная матрица и комплексная матрица матрица, чья записи соответственно действительные числа или комплексные числа. Более общие типы записей обсуждаются ниже. Например, это реальная матрица:
Числа, символы или выражения в матрице называются ее элементами или ее элементами. Горизонтальные и вертикальные строки записей в матрице называются строками и столбцами соответственно.
Размер матрицы определяется количеством содержащихся в ней строк и столбцов. Нет ограничений на количество строк и столбцов, которые матрица (в обычном смысле) может иметь, если они являются положительными целыми числами. Матрица с m строками и n столбцами называется матрицей m × n или матрицей размером m на n, а m и n называются ее размерами. Например, матрица A выше представляет собой матрицу 3 × 2.
Матрицы с одной строкой называются векторами-строками, а матрицы с одним столбцом - векторами-столбцами. Матрица с одинаковым количеством строк и столбцов называется квадратной матрицей. Матрица с бесконечным числом строк или столбцов (или обоих) называется бесконечной матрицей. В некоторых контекстах, например в программах компьютерной алгебры, полезно рассматривать матрицу без строк или столбцов, называемую пустой матрицей.
Имя | Размер | Пример | Описание |
---|---|---|---|
Вектор строки | 1 × п | Матрица с одной строкой, иногда используется для представления вектора | |
Столбец вектор | п × 1 | Матрица с одним столбцом, иногда используется для представления вектора | |
Квадратная матрица | п × п | Матрица с одинаковым количеством строк и столбцов, иногда используемая для представления линейного преобразования из векторного пространства в себя, такого как отражение, поворот или сдвиг. |
Матрицы обычно записываются в квадратных скобках или скобках :
Специфика символьной матричной записи широко варьируется, с некоторыми преобладающими тенденциями. Матрицы, как правило, символом использованием верхнего регистра букв (например, А в приведенных выше примерах), в то время как соответствующие строчные буквы, с двумя индексами индексных (например, 11, или 1,1), представляют собой записи. Помимо использования прописных букв для обозначения матриц, многие авторы используют особый типографский стиль, обычно полужирный вертикальный (не курсив), чтобы еще больше отличать матрицы от других математических объектов. Альтернативное обозначение включает использование двойного подчеркивания с именем переменной, с полужирным шрифтом или без него (как в случае).
Запись в i-й строке и j -м столбце матрицы A иногда называется i, j, ( i, j) или ( i, j) -ой записью матрицы, и чаще всего обозначается как a i, j или a ij. Альтернативные обозначения для этой записи - A [ i, j ] или A i, j. Например, запись (1,3) следующей матрицы A равна 5 (также обозначается как 13, a 1,3, A [ 1,3 ] или A 1,3):
Иногда элементы матрицы могут быть определены такой формулой, как a i, j = f ( i, j). Например, каждый из элементов следующей матрицы A определяется по формуле a ij = i - j.
В этом случае сама матрица иногда определяется этой формулой в квадратных или двойных скобках. Например, приведенная выше матрица определяется как A = [ i - j ] или A = (( i - j)). Если размер матрицы равен m × n, вышеупомянутая формула f ( i, j) действительна для любого i = 1,..., m и любого j = 1,..., n. Это может быть указано отдельно или указано с помощью m × n в качестве нижнего индекса. Например, матрица A выше имеет размер 3 × 4 и может быть определена как A = [ i - j ] ( i = 1, 2, 3; j = 1,..., 4) или A = [ i - j ] 3 × 4.
Некоторые языки программирования используют массивы с двойным индексом (или массивы массивов) для представления матрицы m - × - n. Некоторые языки программирования начинают нумерацию индексов массива с нуля, и в этом случае элементы матрицы размером m на n индексируются как 0 ≤ i ≤ m - 1 и 0 ≤ j ≤ n - 1. Эта статья следует более распространенному в математическом письме соглашению, согласно которому перечисление начинается с 1.
Звездочка иногда используется для обозначения целых строк или столбцов в матрице. Например, я, * относится к я й строке А и *, J относится к J - й столбец А.
Множество всех т матрица с размерностью п вещественными матриц часто обозначает или множество все т матрица с размерностью п матрицы матрицы над другим полем или над кольцом R, аналогичным образом обозначаются или если т = п, то есть, в том случае, из квадратных матриц, одна не повторяет измерение: или Часто используется вместо
Внешнее видео | |
---|---|
Как упорядочивать, складывать и умножать матрицы - Билл Шиллито, TED ED |
Существует ряд основных операций, которые можно применять для изменения матриц, называемых сложением матриц, скалярным умножением, транспонированием, умножением матриц, операциями со строками и подматрицей.
Операция | Определение | Пример |
---|---|---|
Добавление | Сумма + В два т матрица с размерностью п матриц и Б вычисляются entrywise:
| |
Скалярное умножение | Произведение c A числа c (также называемого скаляром на языке абстрактной алгебры ) и матрицы A вычисляется путем умножения каждого элемента A на c:
Эта операция называется скалярным умножением, но ее результат не называется «скалярным произведением», чтобы избежать путаницы, поскольку «скалярное произведение» иногда используется как синоним « внутреннего произведения ». | |
Транспонирование | Транспонирования из двух величин: м матрицы с размерностью п матрицей А представляют собой N матрицу с размерностью м матрица Т (также обозначается тр или т), образованный путем поворота строк в столбцы и наоборот:
|
Знакомые свойства чисел распространяется на эти операции матриц: например, добавление коммутативное, то есть матрица сумма не зависит от порядка слагаемых: A + B = B + A. Транспонированная совместим с сложения и умножения, как выражено ( с) Т = C ( Т) и ( + B) T = Т + B T. И, наконец, ( Т) Т =.
Умножение двух матриц определяется тогда и только тогда, когда количество столбцов левой матрицы совпадает с количеством строк правой матрицы. Если A - матрица размером m на n, а B - матрица размером n на p, то их матричное произведение AB - это матрица размером m на p, элементы которой задаются скалярным произведением соответствующей строки матрицы A и соответствующей столбец B:
где 1 ≤ i ≤ m и 1 ≤ j ≤ p. Например, подчеркнутая запись 2340 в продукте рассчитывается как (2 × 1000) + (3 × 100) + (4 × 10) = 2340:
Умножение матриц удовлетворяет правилам ( AB) C = A ( BC) ( ассоциативность ) и ( A + B) C = AC + BC, а также C ( A + B) = CA + CB (левая и правая дистрибутивность ), когда размер матриц таков, что определяются различные продукты. Продукт АВ может быть определена без БА определяется, а именно, если и В являются т матрицу с размерностью п и п матрицу с размерностью K матриц, соответственно, и т ≠ к. Даже если оба продукта определены, они, как правило, не обязательно должны быть равными, то есть:
Другими словами, матричное умножение не коммутативно, в отличие от (рациональных, действительных или комплексных) чисел, произведение которых не зависит от порядка множителей. Пример двух матриц, не коммутирующих друг с другом:
в то время как
Помимо только что описанного обычного умножения матриц, существуют и другие, менее часто используемые операции с матрицами, которые можно рассматривать как формы умножения, такие как произведение Адамара и произведение Кронекера. Они возникают при решении матричных уравнений, таких как уравнение Сильвестра.
Есть три типа операций со строками:
Эти операции используются несколькими способами, включая решение линейных уравнений и поиск обратных матриц.
Подматрицы из матрицы получают путем удаления любого набора строк и / или столбцов. Например, из следующей матрицы 3 на 4 мы можем построить подматрицу 2 на 3, удалив строку 3 и столбец 2:
В минорах и алгебраические матрицы найдены путем вычисления определителя некоторых подматриц.
Главная подматрица представляет собой квадратную подматрицу, полученную путем удаления некоторых строк и столбцов. Определение варьируется от автора к автору. По мнению некоторых авторов, главная подматрица - это подматрица, в которой набор индексов строк, которые остаются, совпадает с набором индексов столбцов, которые остаются. Другие авторы определяют главную подматрицу как такую, в которой первые k строк и столбцов для некоторого числа k - это те, которые остались; этот тип подматрицы также называют ведущей главной подматрицей.
Матрицы можно использовать для компактного написания и работы с несколькими линейными уравнениями, то есть системами линейных уравнений. Например, если является M матрицы с размерностью п матрица, х обозначает вектор - столбца (то есть п × 1-матрица) из п переменных х 1, х 2,..., х п, а б является м × 1-столбец, то матричное уравнение
эквивалентна системе линейных уравнений
Используя матрицы, это можно решить более компактно, чем это было бы возможно, если бы все уравнения выписывались отдельно. Если n = m и уравнения независимы, то это можно сделать, написав
где -1 является обратной матрицей из A. Если у A нет обратного, решения - если таковые имеются - можно найти, используя его обобщенный обратный.
Матрицы и матричное умножение раскрывают свои основные особенности, когда они связаны с линейными преобразованиями, также известными как линейные карты. Настоящей M матрицы с размерностью п матрица приводит к линейному преобразованию R п → R м отображение каждому вектор х в R п к (матрицы) продукту Ax, который представляет собой вектор в R м. С другой стороны, каждый линейное преобразование F: R п → R м возникает из уникального м матрицы с размерностью п матрицей А: явно, ( я, J) -Посещение из А является я - й координатой F ( е J), где е j = (0,..., 0,1,0,..., 0) - единичный вектор с 1 в j- й позиции и 0 в другом месте. Матрица называется представляют собой линейное отображение п, а называются матрица преобразования из F.
Например, матрица 2 × 2
можно рассматривать как преобразование единичного квадрата в параллелограмм с вершинами в точках (0, 0), ( a, b), ( a + c, b + d) и ( c, d). Параллелограмм, изображенный справа, получается путем умножения A на каждый из векторов-столбцов и по очереди. Эти векторы определяют вершины единичного квадрата.
В следующей таблице показано несколько вещественных матриц 2 × 2 с соответствующими линейными отображениями R 2. Синий оригинал сопоставлен с зеленой сеткой и фигурами. Начало координат (0,0) отмечено черной точкой.
Горизонтальный сдвиг с m = 1,25. | Отражение по вертикальной оси | Отображение сжатия с r = 3/2 | Масштабирование в 3/2 раза | Поворот на π / 6 = 30 ° |
Под перепиской 1-к-1 между матрицами и линейными отображениями, умножение матриц соответствуют к композиции отображений: если K матрицы с размерностью м матрица B представляет собой другой линейное отображение г: R м → R K, то композиция г ∘ F вне в лице BA с
Последнее равенство следует из отмеченной выше ассоциативности умножения матриц.
Ранг матрицы A представляет собой максимальное число линейно независимых векторов - строк матрицы, которая является такой же, как максимальное число линейно независимых векторов - столбцов. Эквивалентно это измерение от изображения линейной карты, представленной A. Теорема о ранге-нуле утверждает, что размерность ядра матрицы плюс ранг равны количеству столбцов матрицы.
Квадратная матрица представляет собой матрицу с тем же количеством строк и столбцов. An N матрицу с размерностью п матрица называется квадратной матрицей порядка п. Любые две квадратные матрицы одного порядка можно складывать и умножать. Элементы a ii образуют главную диагональ квадратной матрицы. Они лежат на воображаемой линии, идущей от верхнего левого угла до нижнего правого угла матрицы.
Имя | Пример с n = 3 |
---|---|
Диагональная матрица | |
Нижняя треугольная матрица | |
Верхняя треугольная матрица |
Если все элементы матрицы A ниже главной диагонали равны нулю, матрица A называется верхней треугольной матрицей. Аналогично, если все элементы матрицы A над главной диагональю равны нулю, матрица A называется нижней треугольной матрицей. Если все элементы за пределами главной диагонали равны нулю, матрица A называется диагональной.
Единичная матрица я п размера п представляет собой н - матрицу с размерностью п матрица, в которой все элементы на главной диагонали равны 1, а все остальные элементы равны 0, например,
Это квадратная матрица порядка n, а также диагональная матрица особого вида. Она называется единичной матрицей, потому что умножение на нее оставляет матрицу неизменной:
Ненулевое скалярное кратное единичной матрицы называется скалярной матрицей. Если элементы матрицы поступают из поля, скалярные матрицы образуют группу при матричном умножении, которая изоморфна мультипликативной группе ненулевых элементов поля.
Квадратная матрица A, равная ее транспонированной, то есть A = A T, является симметричной матрицей. Если вместо этого A равно отрицательному значению своего транспонирования, то есть A = - A T, то A является кососимметричной матрицей. В сложных матриц, симметрия часто заменяется понятием эрмитовых матриц, удовлетворяющих A * = A, где звезда или звездочка обозначает сопряженное транспонирование матрицы, то есть транспонированная комплексно сопряженное с А.
По спектральной теореме вещественные симметричные матрицы и комплексные эрмитовы матрицы имеют собственный базис ; то есть каждый вектор выражается как линейная комбинация собственных векторов. В обоих случаях все собственные значения действительны. Эту теорему можно обобщить на бесконечномерные ситуации, связанные с матрицами с бесконечным числом строк и столбцов, см. Ниже.
Квадратная матрица A называется обратимой или невырожденной, если существует такая матрица B, что
где I n - это единичная матрица размера n × n с единицами на главной диагонали и нулями в других местах. Если B существует, то он является уникальным и называется обратная матрица из А, обозначается А -1.
Положительно определенная матрица | Неопределенная матрица |
---|---|
Q ( х, у) = 1/4 х 2 + у 2 | Q ( х, у) =1/4 х 2 - 1/4 у 2 |
Точки такие, что Q ( x, y) = 1 ( Эллипс ). | Точки такие, что Q ( x, y) = 1 ( Гипербола ). |
Симметричная вещественная матрица A называется положительно определенной, если соответствующая ей квадратичная форма
имеет положительное значение для каждого ненулевого вектора x в R n. Если F ( х) только дает отрицательные значения, то это отрицательно определена ; если е действительно производит положительные и отрицательные значения, то является неопределенным. Если квадратичная форма f дает только неотрицательные значения (положительные или нулевые), симметричная матрица называется положительно-полуопределенной (или, если только неположительные значения, то отрицательно-полуопределенной); следовательно, матрица неопределенна в точности тогда, когда она не является ни положительно-полуопределенной, ни отрицательно-полуопределенной.
Симметричная матрица положительно определена тогда и только тогда, когда все ее собственные значения положительны, то есть матрица положительно полуопределенная и обратимая. В таблице справа показаны две возможности для матриц 2 на 2.
Использование в качестве входных данных двух разных векторов вместо этого дает билинейную форму, связанную с A:
В случае комплексных матриц, то же терминология и результаты применяются с симметричной матрицей, квадратичной формой, билинейной формой, и транспонированными х Т заменено соответственно эрмитовой матрицей, эрмитовой формой, полуторалинейной формой, и сопряженным транспонированием х Н.
Ортогональная матрица представляет собой квадратную матрицу с реальными записями, чьи столбцы и строки являются ортогональные единичные векторы (то есть, ортонормальные векторы). Эквивалентно, матрица A ортогональна, если ее транспонирование равно ее обратной :
что влечет за собой
где I n - единичная матрица размера n.
Ортогональная матрица A обязательно обратима (с обратным A −1 = A T), унитарна ( A −1 = A *) и нормальна ( A * A = AA *). Определитель любой ортогональной матрицы является либо +1 или -1. Специальная ортогональная матрица ортогональная матрица с определителем +1. Как линейное преобразование, каждая ортогональная матрица с определителем +1 является чистым поворотом без отражения, т. Е. Преобразование сохраняет ориентацию преобразованной структуры, в то время как каждая ортогональная матрица с определителем -1 меняет ориентацию, т. Е. Является композицией чистое отражение и (возможно, нулевое) вращение. Идентичные матрицы имеют определитель 1 и представляют собой чистые повороты на нулевой угол.
Комплекс аналог ортогональной матрицы является унитарной матрицей.
След, тр () квадратной матрицы А есть сумма ее диагональных элементов. Хотя умножение матриц не является коммутативным, как упоминалось выше, след произведения двух матриц не зависит от порядка множителей:
Это сразу следует из определения умножения матриц:
Отсюда следует, что след произведения более двух матриц не зависит от циклических перестановок матриц, однако в общем случае это не применимо к произвольным перестановкам (например, tr ( ABC) ≠ tr ( BAC) вообще). Кроме того, след матрицы равен следу ее транспонирования, то есть
Определитель квадратной матрицы А (обозначается Det ( A) или | A |) представляет собой число, кодирующие определенные свойства матрицы. Матрица обратима тогда и только тогда, когда ее определитель отличен от нуля. Его абсолютное значение равно площади (в R 2) или объему (в R 3) изображения единичного квадрата (или куба), а его знак соответствует ориентации соответствующей линейной карты: определитель положителен тогда и только тогда. если ориентация сохраняется.
Определитель матриц 2 на 2 задается формулой
Определитель матриц 3 на 3 включает 6 членов ( правило Сарруса ). Более длинная формула Лейбница обобщает эти две формулы на все измерения.
Определитель произведения квадратных матриц равен произведению их определителей:
Добавление кратного числа любой строки к другой строке или кратного числа любого столбца к другому столбцу не меняет определителя. Перестановка двух строк или двух столбцов влияет на определитель, умножая его на -1. Используя эти операции, любую матрицу можно преобразовать в нижнюю (или верхнюю) треугольную матрицу, и для таких матриц определитель равен произведению элементов на главной диагонали; это дает метод вычисления определителя любой матрицы. Наконец, разложение Лапласа выражает определитель через миноры, то есть определители матриц меньшего размера. Это расширение можно использовать для рекурсивного определения определителей (взяв в качестве начального случая определитель матрицы 1 на 1, которая является ее уникальной записью, или даже определитель матрицы 0 на 0, которая равна 1), что, как можно видеть, эквивалентно формуле Лейбница. Детерминанты могут использоваться для решения линейных систем с использованием правила Крамера, где деление определителей двух связанных квадратных матриц приравнивается к значению каждой из переменных системы.
Число λ и ненулевой вектор v, удовлетворяющий
которые называют собственным значением и собственным вектором из А, соответственно. Число λ является собственным значением из п × п -матрицы А тогда и только тогда, когда -Л I п не является обратимым, что эквивалентно, чтобы
Многочлен р в неопределенном X, заданной оценкой определителя DET ( Х I п -) называется характеристический полином из A. Это унитарный многочлен от степени п. Следовательно, полиномиальное уравнение p A (λ) = 0 имеет не более n различных решений, то есть собственных значений матрицы. Они могут быть сложными, даже если записи A реальны. Согласно теореме Гамильтона-Кэли, р () = 0, то есть, результат подстановки саму матрицу в свои собственные характеристического полинома дает нулевую матрицу.
Матричные вычисления часто можно выполнять с помощью различных методов. Многие проблемы могут быть решены как прямыми алгоритмами, так и итерационными подходами. Например, собственные векторы квадратной матрицы могут быть получены путем нахождения последовательности векторов x n, сходящейся к собственному вектору, когда n стремится к бесконечности.
Чтобы выбрать наиболее подходящий алгоритм для каждой конкретной проблемы, важно определить как эффективность, так и точность всех доступных алгоритмов. Область, изучающая эти вопросы, называется числовой линейной алгеброй. Как и в случае с другими численными ситуациями, двумя основными аспектами являются сложность алгоритмов и их числовая стабильность.
Определение сложности алгоритма означает нахождение верхних границ или оценок того, сколько элементарных операций, таких как сложение и умножение скаляров, необходимо для выполнения некоторого алгоритма, например, умножения матриц. Вычисление матрицы произведения два п матрица с размерностью п матриц с использованием определения, данным выше потребностей п 3 умножений, так как для любого из п 2 записи продукта, п умножений являются необходимой. Алгоритм Strassen превосходит этот «наивный» алгоритм; он нуждается только в п 2,807 умножений. Утонченный подход также включает в себя особенности вычислительных устройств.
Во многих практических ситуациях известна дополнительная информация о задействованных матрицах. Важным случаем являются разреженные матрицы, то есть матрицы, большинство элементов которых равны нулю. Существуют специально адаптированные алгоритмы, скажем, для решения линейных систем Ax = b для разреженных матриц A, такие как метод сопряженных градиентов.
Алгоритм, грубо говоря, численно устойчив, если небольшие отклонения входных значений не приводят к большим отклонениям в результате. Например, вычисление обратной матрицы с помощью расширения Лапласа (ADJ ( А) обозначает союзную матрицу из А)
может привести к значительным ошибкам округления, если определитель матрицы очень мал. Норма матрицы может быть использована для захвата кондиционирования линейных алгебраических задач, таких как вычисление обратного матрица, в.
Большинство языков программирования поддерживают массивы, но не содержат встроенных команд для матриц. Вместо этого доступные внешние библиотеки предоставляют матричные операции с массивами почти на всех используемых в настоящее время языках программирования. Матричные манипуляции были одними из первых числовых приложений компьютеров. Первоначальный Dartmouth BASIC имел встроенные команды для матричной арифметики на массивах из его второй реализации в 1964 году. Еще в 1970-х годах некоторые инженерные настольные компьютеры, такие как HP 9830, имели картриджи ROM для добавления команд BASIC для матриц. Некоторые компьютерные языки, такие как APL, были разработаны для управления матрицами, и для помощи в вычислениях с матрицами можно использовать различные математические программы.
Существует несколько методов преобразования матриц в более доступную форму. Их обычно называют методами матричной декомпозиции или матричной факторизации. Интерес всех этих методов состоит в том, что они сохраняют определенные свойства рассматриваемых матриц, такие как детерминант, ранг или инверсия, так что эти величины могут быть вычислены после применения преобразования, или что определенные матричные операции алгоритмически проще выполнять. для некоторых типов матриц.
В разложении LU факторы матрица как произведение нижнего ( L) и верхняя треугольная матрица ( U). После вычисления этого разложения линейные системы могут быть решены более эффективно с помощью простого метода, называемого прямой и обратной заменой. Точно так же алгоритмически проще вычислить обратные треугольники матриц. Гаусса является Аналогичный алгоритм; он преобразует любую матрицу в форму эшелона строк. Оба метода продолжаются путем умножения матрицы на подходящие элементарные матрицы, которые соответствуют перестановке строк или столбцов и добавлению кратных одной строки к другой строке. Разложение по сингулярным числам выражает любую матрицу A как произведение UDV ∗, где U и V - унитарные матрицы, а D - диагональная матрица.
Пример матрицы в жордановой нормальной форме. Серые блоки называются жордановыми блоками.Собственное разложение или диагонализация выражает A как произведение VDV -1, где D - диагональная матрица, а V - подходящая обратимая матрица. Если A может быть записано в такой форме, оно называется диагонализируемым. В более общем смысле, и применимы ко всем матрицам, трансформанты разложения Жордана матрица в жордановой нормальную форму, то есть матрицы, только ненулевые элементы являются собственным Л 1 к Л п из А, размещенные на главной диагонали, и, возможно, записи, равные один прямо над главной диагональю, как показано справа. Учитывая собственное разложение, n- я степень A (то есть n- кратное итерационное умножение матриц) может быть вычислена с помощью
а степень диагональной матрицы можно вычислить, взяв соответствующие степени диагональных элементов, что намного проще, чем вместо этого выполнять возведение в степень для A. Это может быть использовано для вычисления экспоненты матрицы e A, которая часто возникает при решении линейных дифференциальных уравнений, матричных логарифмов и квадратных корней из матриц. Чтобы избежать численно некорректных ситуаций, можно использовать дополнительные алгоритмы, такие как разложение Шура.
Матрицы можно обобщать по-разному. Абстрактная алгебра использует матрицы с элементами в более общих полях или даже кольцах, в то время как линейная алгебра кодифицирует свойства матриц в понятии линейных отображений. Можно рассматривать матрицы с бесконечным числом столбцов и строк. Другое расширение - это тензоры, которые можно рассматривать как многомерные массивы чисел, в отличие от векторов, которые часто могут быть реализованы как последовательности чисел, в то время как матрицы представляют собой прямоугольные или двумерные массивы чисел. Матрицы, при соблюдении определенных требований, обычно образуют группы, известные как группы матриц. Аналогичным образом при определенных условиях матрицы образуют кольца, известные как кольца матриц. Хотя произведение матриц в общем случае не коммутативно, некоторые матрицы образуют поля, известные как матричные поля.
В этой статье основное внимание уделяется матрицам, значениями которых являются действительные или комплексные числа. Однако можно рассматривать матрицы с гораздо более общими типами записей, чем действительные или комплексные числа. В качестве первого шага обобщения любое поле, то есть набор, в котором определены и хорошо выполняются операции сложения, вычитания, умножения и деления, может использоваться вместо R или C, например, рациональные числа или конечные поля. Например, теория кодирования использует матрицы над конечными полями. Везде, где рассматриваются собственные значения, поскольку они являются корнями многочлена, они могут существовать только в более крупном поле, чем поле элементов матрицы; например, они могут быть сложными в случае матрицы с действительными элементами. Возможность заново интерпретировать элементы матрицы как элементы большего поля (например, рассматривать реальную матрицу как комплексную матрицу, все элементы которой оказываются действительными) затем позволяет рассматривать каждую квадратную матрицу как имеющую полный набор собственных значений. В качестве альтернативы можно с самого начала рассматривать только матрицы с элементами в алгебраически замкнутом поле, таком как C.
В более общем смысле, матрицы с элементами кольца R широко используются в математике. Кольца - это более общее понятие, чем поля, в котором нет необходимости в операции деления. Те же самые операции сложения и умножения матриц распространяются и на этот параметр. Множество М ( п, Р) (также обозначаются М п (R)) все квадратного п матрицы с размерностью п матриц над R представляет собой кольцо называется матричным кольцо, изоморфно кольцо эндоморфизмов левого R - модуль R н. Если кольцо R является коммутативным, то есть, его умножение коммутативно, то М ( п, Р) является унитарным некоммутативным (если п = 1) ассоциативная алгебра над R. Детерминанта квадратных матриц над коммутативным кольцом R по- прежнему может быть определена с помощью формулы Лейбница ; такая матрица обратима тогда и только тогда, когда ее определитель обратим в R, обобщая ситуацию на поле F, где каждый ненулевой элемент обратим. Матрицы над суперкольцами называются суперматрицами.
Матрицы не всегда имеют все свои элементы в одном и том же кольце - или даже в любом кольце вообще. Одним частным, но распространенным случаем являются блочные матрицы, которые можно рассматривать как матрицы, элементы которых сами по себе являются матрицами. Записи не обязательно должны быть квадратными матрицами и, следовательно, не должны быть членами какого-либо кольца ; но их размеры должны соответствовать определенным условиям совместимости.
Линейные отображения R n → R m эквивалентны матрицам размером m на n, как описано выше. В более общем смысле, любое линейное отображение F: V → W между конечи мерными векторными пространствами может быть описано с помощью матрицы А = ( Ij), после выбора основы v 1,..., v п из V, и W 1,..., w m множества W (так что n - размерность V, а m - размерность W), которая такова, что
Другими словами, столбец J из А выражает образ об J в терминах базисных векторов ш I из W ; Таким образом, это отношение однозначно определяет элементы матрицы A. Матрица зависит от выбора баз: разный выбор баз приводит к разным, но эквивалентным матрицам. Многие из вышеупомянутых конкретных понятий могут быть переосмыслены в этом свете, например, матрица транспонирования A T описывает транспонирование линейной карты, заданной A, относительно двойственных оснований.
Эти свойства можно переформулировать более естественно: категория всех матриц с элементами в поле с умножением как композиция эквивалентна категории конечномерных векторных пространств и линейных отображений над этим полем.
В более общем смысле, набор матриц размера m × n может использоваться для представления R- линейных отображений между свободными модулями R m и R n для произвольного кольца R с единицей. При п = т состав этих карт можно, и это приводит к кольцу матриц из п × п матриц, представляющих эндоморфизм кольцо из R н.
Группа представляет собой математическую структуру, состоящую из множества объектов вместе с бинарной операцией, то есть операция объединения любых двух объектов с третьим, при соблюдении определенных требований. Группа, в которой объекты являются матрицами, а групповая операция - умножением матриц, называется группой матриц. Поскольку в группе каждый элемент должен быть обратимым, наиболее общие группы матриц - это группы всех обратимых матриц заданного размера, называемые общими линейными группами.
Любое свойство матриц, которое сохраняется при матричном произведении и обратном, можно использовать для определения дополнительных групп матриц. Например, матрицы с заданным размером и с определителем, равным 1, образуют подгруппу (то есть меньшую группу, содержащуюся в) их общей линейной группы, называемой специальной линейной группой. Ортогональные матрицы, определяемые условием
образуют ортогональную группу. Каждая ортогональная матрица имеет определитель 1 или -1. Ортогональные матрицы с определителем 1 образуют подгруппу, называемую специальной ортогональной группой.
Каждая конечная группа является изоморфна к матричной группе, как можно видеть, рассматривая регулярное представление о симметрической группе. Общие группы можно изучать с помощью сравнительно хорошо изученных матричных групп с помощью теории представлений.
Также возможно рассматривать матрицы с бесконечным количеством строк и / или столбцов, даже если, будучи бесконечными объектами, нельзя явно записать такие матрицы. Все, что имеет значение, - это то, что для каждого элемента в наборах индексируемых строк и для каждого элемента в заданных индексных столбцах существует четко определенная запись (эти индексные наборы даже не обязательно должны быть подмножествами натуральных чисел). Базовые операции сложения, вычитания, скалярного умножения и транспонирования могут быть определены без проблем; однако умножение матриц может включать бесконечное суммирование для определения результирующих элементов, которые в общем случае не определены.
Если R - любое кольцо с единицей, то кольцо эндоморфизмов как правого R- модуля изоморфно кольцу столбцовых конечных матриц, элементы которых индексируются, а каждый столбец содержит только конечное число ненулевых элементов. Эндоморфизмы M, рассматриваемого как левый R- модуль, приводят к аналогичному объекту - строковым конечным матрицам, каждая из строк которых имеет только конечное число ненулевых элементов.
Если для описания линейных отображений используются бесконечные матрицы, то можно использовать только те матрицы, все столбцы которых имеют только конечное число ненулевых элементов по следующей причине. Чтобы матрица A описывала линейное отображение f: V → W, должны быть выбраны базы для обоих пространств; напомним, что по определению это означает, что каждый вектор в пространстве может быть однозначно записывается в виде (конечной) линейной комбинации базисных векторов, так что записывается в виде (столбца) вектора V из коэффициентов, лишь конечное число записей v я не равны нулю. Теперь столбцы A описывают образы посредством f отдельных базисных векторов V в базисе W, что имеет смысл только в том случае, если эти столбцы имеют только конечное число ненулевых элементов. Однако нет ограничений на строки матрицы A: в произведении A v задействовано только конечное число ненулевых коэффициентов при v, поэтому каждая его запись, даже если она задана как бесконечная сумма произведений, включает только конечное число много ненулевых членов и поэтому хорошо определен. Более того, это равносильно формированию линейной комбинации столбцов матрицы A, которая эффективно включает только конечное число из них, поэтому результат имеет только конечное число ненулевых элементов, поскольку каждый из этих столбцов имеет. Произведения двух матриц данного типа хорошо определены (при условии, что наборы индексов столбцов и индексов строки совпадают), относятся к одному типу и соответствуют композиции линейных карт.
Если R - нормированное кольцо, то условие конечности строки или столбца может быть ослаблено. При наличии нормы вместо конечных сумм можно использовать абсолютно сходящиеся ряды. Например, матрицы, суммы столбцов которых являются абсолютно сходящимися последовательностями, образуют кольцо. Аналогично, матрицы, строчные суммы которых являются абсолютно сходящимися рядами, также образуют кольцо.
Бесконечные матрицы также могут использоваться для описания операторов в гильбертовых пространствах, где возникают вопросы сходимости и непрерывности, что опять же приводит к определенным ограничениям, которые необходимо наложить. Однако явная точка зрения на матрицы имеет тенденцию скрывать суть дела, и вместо этого можно использовать абстрактные и более мощные инструменты функционального анализа.
Пустая матрица представляет собой матрицу, в которой число строк или столбцов (или оба) равен нулю. Пустые матрицы помогают работать с картами, включающими нулевое векторное пространство. Например, если A - это матрица 3 на 0, а B - матрица 0 на 3, то AB - это нулевая матрица 3 на 3, соответствующая нулевой карте из 3-мерного пространства V в себя, в то время как BA - это матрица 0 на 0. Для пустых матриц нет общепринятых обозначений, но большинство систем компьютерной алгебры позволяют создавать и вычислять с их помощью. Определитель матрицы 0 на 0 равен 1 относительно пустого произведения, встречающегося в формуле Лейбница для определителя как 1. Это значение также согласуется с тем фактом, что тождественное отображение из любого конечномерного пространства в себя имеет определитель 1, факт, который часто используется как часть характеристики определителей.
Матрицы имеют множество применений как в математике, так и в других науках. Некоторые из них просто используют компактное представление набора чисел в матрице. Например, в теории игр и экономике, то матрица выигрышей кодирует выигрыш для двух игроков, в зависимости от которых из заданного (конечного) множества альтернатив игроки выбирают. Интеллектуальный анализ текста и автоматизированная компиляция тезауруса используют матрицы терминов документа, такие как tf-idf, для отслеживания частотности определенных слов в нескольких документах.
Комплексные числа могут быть представлены конкретными действительными матрицами 2 на 2 с помощью
при котором сложение и умножение комплексных чисел и матриц соответствуют друг другу. Например, матрицы поворота 2 на 2 представляют собой умножение с некоторым комплексным числом с абсолютным значением 1, как указано выше. Подобная интерпретация возможна для кватернионов и алгебр Клиффорда в целом.
Ранние методы шифрования, такие как шифр Хилла, также использовали матрицы. Однако из-за линейного характера матриц эти коды сравнительно легко взломать. В компьютерной графике матрицы используются как для представления объектов, так и для вычисления преобразований объектов с использованием матриц аффинного вращения для выполнения таких задач, как проецирование трехмерного объекта на двумерный экран, что соответствует теоретическому наблюдению камеры. Матрицы над кольцом многочленов важны при изучении теории управления.
В химии матрицы используются по-разному, особенно с момента использования квантовой теории для обсуждения молекулярных связей и спектроскопии. Примерами могут служить матрицей перекрытия, а матрица Фока используется при решении уравнений Рутана для получения молекулярных орбиталей на методе ХФ.
Матрица смежности из конечного графа является основным понятием теории графов. Он записывает, какие вершины графа соединены ребром. Матрицы, содержащие только два разных значения (1 и 0, означающие, например, «да» и «нет», соответственно), называются логическими матрицами. Матрица расстояния (или стоимость) содержит информацию о расстояниях ребер. Эти концепции могут применяться к веб-сайтам, соединенным гиперссылками, или к городам, соединенным дорогами и т. Д., И в этом случае (если сеть соединений не является чрезвычайно плотной) матрицы, как правило, являются разреженными, то есть содержат несколько ненулевых записей. Следовательно, в теории сетей можно использовать специально адаптированные матричные алгоритмы.
Матрица Гесса из дифференцируемой функции ƒ: R п → R состоит из вторых производных от ƒ по отношению к нескольким координатным направлениям, то есть,
Он кодирует информацию о локальном поведении роста функции: дан критическая точка х = ( х 1, ..., х п), то есть точка, в которой первые частные производных от ƒ равна нуль, то функция имеет локальный минимум если матрица Гессе положительно определена. Квадратичное программирование можно использовать для поиска глобальных минимумов или максимумов квадратичных функций, тесно связанных с теми, которые связаны с матрицами (см. Выше).
Другая матрица, часто используемая в геометрических ситуациях, - это матрица Якоби дифференцируемого отображения f: R n → R m. Если f 1,..., f m обозначают компоненты f, то матрица Якоби определяется как
Если n gt; m, и если ранг матрицы Якоби достигает своего максимального значения m, f локально обратима в этой точке по теореме о неявной функции.
Уравнения с частными производными можно классифицировать, рассматривая матрицу коэффициентов дифференциальных операторов высшего порядка уравнения. Для эллиптических уравнений в частных производных эта матрица положительно определена, что оказывает решающее влияние на множество возможных решений рассматриваемого уравнения.
Метод конечных элементов - важный численный метод решения уравнений в частных производных, широко применяемый при моделировании сложных физических систем. Он пытается аппроксимировать решение некоторого уравнения кусочно-линейными функциями, где части выбираются относительно достаточно мелкой сетки, которая, в свою очередь, может быть преобразована в матричное уравнение.
Стохастические матрицы - это квадратные матрицы, строки которых являются векторами вероятностей, то есть элементы которых неотрицательны и в сумме равны единице. Стохастические матрицы используются для определения цепей Маркова с конечным числом состояний. Строка стохастической матрицы дает распределение вероятностей для следующей позиции некоторой частицы, которая в настоящее время находится в состоянии, соответствующем строке. Свойства поглощающих состояний в виде цепочек Маркова, то есть состояний, которые любая частица в конечном итоге достигает, можно определить по собственным векторам матриц перехода.
Статистика также использует матрицы во многих различных формах. Описательная статистика связана с описанием наборов данных, которые часто могут быть представлены в виде матриц данных, которые затем могут быть подвергнуты методам уменьшения размерности. Ковариационная матрица кодирует взаимную дисперсию нескольких случайных величин. Другой метод использования матриц - это линейный метод наименьших квадратов, метод, который аппроксимирует конечный набор пар ( x 1, y 1), ( x 2, y 2),..., ( x N, y N) линейной функцией
которые могут быть сформулированы в терминах матриц, связанных с сингулярным разложением матриц.
Случайные матрицы - это матрицы, элементами которых являются случайные числа, подчиняющиеся подходящим распределениям вероятностей, таким как нормальное распределение матриц. Помимо теории вероятностей, они применяются в самых разных областях, от теории чисел до физики.
Линейные преобразования и связанные с ними симметрии играют ключевую роль в современной физике. Например, элементарные частицы в квантовой теории поля классифицируются как представления группы Лоренца специальной теории относительности и, более конкретно, по их поведению в спиновой группе. Конкретные представления, включающие матрицы Паули и более общие гамма-матрицы, являются неотъемлемой частью физического описания фермионов, которые ведут себя как спиноры. Для трех легчайших кварков существует теоретико-групповое представление, включающее особую унитарную группу SU (3); для своих вычислений физики используют удобное матричное представление, известное как матрицы Гелл-Манна, которые также используются для калибровочной группы SU (3), составляющей основу современного описания сильных ядерных взаимодействий, квантовой хромодинамики. Матрица Кабиббо-Кобаяши-Маскаво, в свою очередь, выражает тот факт, что основные кварковые состояния, которые важны для слабых взаимодействий не являются таким же, как, но линейно связаны с основными кварковыми состояний, которые определяют частицы с конкретным и различными массами.
Первая модель квантовой механики ( Гейзенберг, 1925) представляла операторы теории бесконечномерными матрицами, действующими на квантовые состояния. Это также называется матричной механикой. Одним из конкретных примеров является матрица плотности, которая характеризует «смешанное» состояние квантовой системы как линейную комбинацию элементарных, «чистых» собственных состояний.
Другая матрица служит ключевым инструментом для описания экспериментов по рассеянию, которые составляют краеугольный камень экспериментальной физики элементарных частиц: реакции столкновения, например, происходящие в ускорителях элементарных частиц, где невзаимодействующие частицы направляются друг к другу и сталкиваются в небольшой зоне взаимодействия с новым совокупность невзаимодействующих частиц в результате может быть описана как скалярное произведение исходящих состояний частицы и линейной комбинации состояний входящей частицы. Линейная комбинация задается матрицей, известной как S-матрица, которая кодирует всю информацию о возможных взаимодействиях между частицами.
Общее применение матриц в физике - описание линейно связанных гармонических систем. В уравнении движения таких систем может быть описано в виде матрицы, с помощью масс - матрицы умножения обобщенной скорости, чтобы дать кинетический член, и силу матрицы умножения вектора смещения для характеристики взаимодействия. Лучший способ получить решения - определить собственные векторы системы, ее нормальные режимы, путем диагонализации матричного уравнения. Подобные методы имеют решающее значение, когда речь идет о внутренней динамике молекул : внутренних колебаниях систем, состоящих из взаимно связанных составляющих атомов. Они также нужны для описания механических колебаний и колебаний в электрических цепях.
Геометрическая оптика обеспечивает дополнительные матричные приложения. В этой приближенной теории не учитывается волновая природа света. В результате получилась модель, в которой лучи света действительно являются геометрическими лучами. Если отклонение световых лучей оптическими элементами невелико, действие линзы или отражающего элемента на данный световой луч можно выразить как умножение двухкомпонентного вектора на матрицу два на два, называемую анализом матрицы передачи луча : компоненты вектора - это наклон светового луча и его расстояние от оптической оси, а матрица кодирует свойства оптического элемента. На самом деле существует два вида матриц, а именно. рефракции матрица, описывающая преломление на поверхности линзы, а матричный перевод, описывающий перевод плоскости отсчета к следующей преломляющей поверхности, где применяется другая матрица рефракции. Оптическая система, состоящая из комбинации линз и / или отражающих элементов, просто описывается матрицей, полученной из произведения матриц компонентов.
Традиционный анализ сетки и узловой анализ в электронике приводят к системе линейных уравнений, которые можно описать с помощью матрицы.
Поведение многих электронных компонентов можно описать с помощью матриц. Пусть A будет двумерным вектором с входным напряжением v 1 компонента и входным током i 1 в качестве его элементов, и пусть B будет двумерным вектором с выходным напряжением v 2 компонента и выходным током i 2 в качестве его элементов. Тогда поведение электронного компонента можно описать как B = H A, где H - матрица 2 x 2, содержащая один элемент полного сопротивления ( h 12), один элемент полной проводимости ( h 21) и два безразмерных элемента ( h 11 и h 22). Расчет схемы теперь сводится к умножению матриц.
Матрицы имеют долгую историю применения при решении линейных уравнений, но они были известны как массивы до 1800-х годов. В китайском тексте Математика в девяти книгах написано в 10-втором веке до нашей эры является первым примером использования методов массива для решения системы уравнений, в том числе концепции детерминант. В 1545 году итальянский математик Джероламо Кардано представил этот метод Европе, когда опубликовал Ars Magna. Японский математик Секи использовали те же методы массивов для решения системы уравнений в 1683 году голландский математик Ян де Витт представлены преобразования с использованием массивов в его книге 1659 Элементы кривых (1659). Между 1700 и 1710 годами Готфрид Вильгельм Лейбниц опубликовал использование массивов для записи информации или решений и экспериментировал с более чем 50 различными системами массивов. Крамер представил свое правило в 1750 году.
Термин «матрица» (латинское «матка», производное от mater - мать) был придуман Джеймсом Джозефом Сильвестром в 1850 году, который понимал матрицу как объект, порождающий несколько детерминант, которые сегодня называются минорами, то есть детерминантами матрицы меньшего размера, которые получаются из исходной путем удаления столбцов и строк. В статье 1851 года Сильвестр объясняет:
Артур Кэли опубликовал трактат о геометрических преобразованиях с использованием матриц, которые не были повернутыми версиями исследуемых коэффициентов, как это делалось ранее. Вместо этого он определил такие операции, как сложение, вычитание, умножение и деление, как преобразования этих матриц и показал, что ассоциативные и распределительные свойства сохраняются. Кэли исследовал и продемонстрировал некоммутативное свойство матричного умножения, а также коммутативное свойство матричного сложения. Ранняя матричная теория ограничивала использование массивов почти исключительно определителями, и абстрактные матричные операции Артура Кэли были революционными. Он сыграл важную роль в предложении матричной концепции, независимой от систем уравнений. В 1858 году Кэли опубликовал свои воспоминания по теории матриц, в которых он предложил и продемонстрировал теорему Кэли – Гамильтона.
Английский математик Катберт Эдмунд Куллис был первым, кто использовал современное обозначение скобок для матриц в 1913 году, и он одновременно продемонстрировал первое существенное использование обозначения A = [ a i, j ] для представления матрицы, где a i, j относится к i. -я строка и j- й столбец.
Современное исследование детерминант возникло из нескольких источников. Теоретико-числовые проблемы привели Гаусса к тому, чтобы связать коэффициенты квадратичных форм, то есть такие выражения, как x 2 + xy - 2 y 2, и линейные карты в трех измерениях с матрицами. Эйзенштейн дальнейшее развития этих понятий, в том числе замечания, что в современном языке, матричные продукты являются некоммутативными. Коши был первым, кто доказал общие утверждения о детерминантах, используя в качестве определения определителя матрицы A = [ a i, j ] следующее: заменить степени a j k на a jk в полиноме
где Π обозначает произведение указанных слагаемых. В 1829 году он также показал, что собственные значения симметричных матриц действительны. Якоби изучал «функциональные детерминанты» - позже названные Сильвестром детерминантами Якоби - которые можно использовать для описания геометрических преобразований на локальном (или бесконечно малом ) уровне, см. Выше ; В трудах Кронекера « Vorlesungen über die Theorie der Determinanten» и Вейерштрасса « Zur Determinantentheorie», опубликованных в 1903 году, детерминанты рассматривались сначала аксиоматически, в отличие от предыдущих более конкретных подходов, таких как упомянутая формула Коши. В этот момент были твердо установлены детерминанты.
Многие теоремы были впервые установлены только для малых матриц, например, теорема Кэли – Гамильтона для матриц 2 × 2 была доказана Кэли в вышеупомянутом мемуаре и Гамильтоном для матриц 4 × 4. Фробениус, работая над билинейными формами, обобщил теорему на все измерения (1898 г.). Также в конце 19 века метод исключения Гаусса – Жордана (обобщающий частный случай, ныне известный как исключение Гаусса ) был установлен Джорданом. В начале 20 века матрицы стали играть центральную роль в линейной алгебре, частично из-за их использования в классификации гиперкомплексных систем счисления прошлого века.
Зарождение матричной механики по Гейзенберга, Борна и Иордана привело к изучению матриц с бесконечным числом строк и столбцов. Позже фон Нейман выполнил математическую формулировку квантовой механики, развивая функционально-аналитические понятия, такие как линейные операторы в гильбертовых пространствах, которые, очень грубо говоря, соответствуют евклидову пространству, но с бесконечным количеством независимых направлений.
Это слово необычным образом использовалось по крайней мере двумя авторами, имеющими историческое значение.
Бертран Рассел и Альфред Норт Уайтхед в своих « Принципах математики» (1910–1913) используют слово «матрица» в контексте своей аксиомы сводимости. Они предложили эту аксиому как средство для последовательного уменьшения любой функции до одной более низкого типа, так что «внизу» (0-й порядок) функция идентична своему расширению :
Например, функция Φ ( x, y) двух переменных x и y может быть сведена к набору функций одной переменной, например y, «рассматривая» функцию для всех возможных значений «индивидов» a я подставил вместо переменной x. И затем результирующий набор функций единственной переменной y, то есть ∀a i: Φ ( a i, y), можно свести к «матрице» значений, «рассматривая» функцию для всех возможных значений » лиц " b i подставили вместо переменной y:
Альфред Тарский в своем « Введении в логику» 1946 года использовал слово «матрица» как синоним понятия таблицы истинности, используемого в математической логике.