Многочленные матрицы

Содержание
Введение
Глава I. Многочленные матрицы.
§1. Элементарные преобразования многочленной матрицы
§2. Канонический вид λ-матрицы
§3. Наибольшие общие делители миноров
§4. Условия эквивалентности λ-матриц
§5. Элементарные делители многочленной матрицы
Глава II. Матричные многочлены.
§1. Деление матричных многочленов. Обобщенная теорема Безу
§2. Скалярная эквивалентность
§3. Характеристический многочлен матрицы
§4. Минимальный многочлен матрицы
§5. Критерий подобия матриц
§6. Нормальная форма Жордана
Глава III. Функции от матриц.
§1. Многочлен от жордановой матрицы
§2. Скалярные функции
§3. Представление значений функций многочленами
§4. Элементарные делители функций
§5. Степенные ряды
Литература
Введение
Дипломная работа состоит из трех глав.
Первые два параграфа I главы посвящены изучению свойств многочленных матриц. В §3, этой же главы, вводятся понятия наибольших общих делителей миноров и инвариантных множителей многочленной матрицы. На основе этого в последующих двух параграфах рассматриваются условия эквивалентности λ-матриц и строится аналитическая теория элементарных делителей.
С каждой квадратной матрицей связаны два многочлена: характеристический и минимальный. Эти многочлены играют большую роль в различных вопросах теории матриц. Во II главе рассматриваются свойства характеристического и минимального многочлена. Этому исследованию предпосылаются основные сведения о многочленах с матричными коэффициентами и о действиях над ними. Последний параграф II главы посвящен нормальной форме Жордана.
В главе III, посвященной функциям от матрицы, рассмотрены вопросы матричного исчисления, для решения которых используется возможность приведения матриц к нормальной жордановой форме. В §5, этой же главы, рассмотрен вопрос о сходимости степенного ряда от матрицы А.
Приведенный материал иллюстрируется в решениях различных примеров.
Глава I. Многочленные матрицы.
§1. Элементарные преобразования многочленной матрицы.
Многочленной матрицей или λ-матрицей называется прямоугольная (в частности, квадратная) матрица А (λ) = ║аі ј (λ) ║, где i=1, 2, …, m; j=1, 2, …, n; элементы которой являются многочленами от одного переменного λ с числовыми коэффициентами из основного поля К.
Элементарными преобразованиями λ-матрицы А(λ) называются преобразования следующих типов:
I. Перестановка двух строк.
II. Умножение строки на число с Є К, с ≠ 0.
III. Прибавление к одной строке другой строки, умноженной на любой многочлен f (λ), и аналогичные преобразования столбцов.
Элементарные преобразования I, II, III равносильны умножению многочленной матрицы А(λ) слева соответственно на следующие квадратные матрицы порядка m:
(i) (j) (i) (j)
1 0 1 0 1 0
S’ = с , S” = 1… b(λ) ….(i), S”‘ = 0 1 ,
0 1 0 1 1 0
0 1
т.е. в результате применения преобразований I, II, III матрица А(λ) преобразуется соответственно в матрицы S’· А(λ), S”· А(λ), S”‘· А(λ). Поэтому преобразования типа I, II, III называются левыми элементарными операциями.
Совершенно аналогично определяются правые элементарные операции над многочленной матрицей (эти операции производятся не над строками, а над столбцами) и соответствующие им матрицы порядка n:

1 0 1 0 1 0
Т’ = с (i), Т” = 1………….(i), Т”‘ = 0…1……….(i) b(λ)……….(j) 1…0……….(j) .
0 1 0 1 0 1
В результате применения правой элементарной операции матрица А(λ) умножается справа на соответствующую матрицу Т.
Заметим, что матрица Т’ совпадает с матрицей S’, а матрицы Т”, Т”‘ совпадают с матрицами S”, S”‘, если в последних поменять местами индексы i и j. Матрицы типа S’, S”, S”‘ (или, что то же, типа Т’, Т”, Т”‘) называются элементарными.
Две λ-матрицы А(λ) и B(λ) одинаковых размеров m x n называются эквивалентными, А(λ) ~ B(λ), если от матрицы А(λ) к B(λ) можно перейти при помощи цепочки из конечного числа элементарных преобразований. Отношение эквивалентности обладает тремя основными свойствами:
1) рефлексивность: каждая матрица эквивалентна сама себе А(λ) ~ B(λ);
2) симметрия: если А(λ) ~ B(λ), то B(λ) ~ А(λ);
3) транзитивность: если А(λ) ~ B(λ), и B(λ) ~ С(λ), то А(λ) ~ С(λ).
§2. Канонический вид λ-матрицы
Выше было показано, что отношение эквивалентности транзитивно, симметрично и рефлексивно. Отсюда следует, что совокупность всех λ-матриц данных размеров m x n разбивается на непересекающиеся классы эквивалентных матриц, т.е. на такие классы, что любые две матрицы из одного класса эквивалентны, а из разных классов – не эквивалентны между собой. Возникает вопрос о канонической форме λ-матрицы, характеризующей данный класс эквивалентных λ-матриц.
Канонической диагональной λ-матрицей размеров m x n называется λ-матрица, у которой на главной диагонали стоят многочлены Е1(λ), Е2(λ), …, Ер(λ), где р – меньшее из чисел m и n, причем не равные нулю среди этих многочленов имеют старшие коэффициенты, равные единице, и каждый следующий многочлен делится на предыдущий, все же элементы вне главной диагонали равны нулю.
Т е о р е м а 1. Всякая λ-матрица конечным числом элементарных преобразований может быть приведена к канонической диагональной форме.
Доказательство. Пусть А(λ) – прямоугольная многочленная матрица. Применяя к А(λ) как левые, так и правые элементарные операции приведем к канонической диагональной форме.
Среди всех не равных нулю элементов аіј(λ) матрицы А(λ) возьмем тот элемент, который имеет наименьшую степень относительно λ, и путем соответствующей перестановки строк и столбцов сделаем его элементом а11(λ). После этого найдем частные и остатки от деления многочленов аі1(λ) и а1ј(λ) на а11(λ):
аі1(λ) = а11(λ) qі1(λ) + rі1 (λ), а1ј(λ) = а11(λ) q1ј(λ) + r1ј(λ)
(i = 2, 3, …, m; j = 2, 3, …, n).
Если хотя бы один из остатков rі1(λ), r1ј(λ) (i = 2, …, m; j = 2, …, n), например r1ј (λ), не равен тождественно нулю, то, вычитая из j-го столбца первый столбец, предварительно помноженный на q1ј(λ), мы заменим элемент а1ј(λ) остатком r1ј(λ), который имеет меньшую степень, нежели а11(λ). Тогда мы имеем возможность снова уменьшить степень элемента, стоящего в левом верхнем углу матрицы, поместив на это место элемент с наименьшей степенью относительно λ.
Если же все остатки r21(λ), … rm1(λ); r12(λ), …, r1n(λ) равны тождественно нулю, то, вычитая из i-ой строки первую, помноженную предварительно на qі1(λ) (i = 2, …, m), а из j-го столбца – первый, предварительно помноженный на q1ј(λ) (j = 2, …, n), мы приведем нашу матрицу к виду
а11(λ) 0 … 0
0 а22(λ) … а2n(λ)
….…………………… .
0 аm2(λ) … аmn(λ)
Если при этом хотя бы один из элементов аіј(λ) (i = 2, …, m; j = 2, …, n) не делится без остатка на а11(λ), то, прибавляя к первому столбцу тот столбец, который содержит этот элемент, мы придем к предыдущему случаю и, следовательно, снова сможем заменить элемент а11(λ) многочленом меньшей степени.
Поскольку первоначальный элемент а11(λ) имел определенную степень и процесс уменьшения этой степени не может неограниченно продолжаться, то после конечного числа элементарных операций мы должны получить матрицу вида
а1(λ) 0 … 0
(*) 0 b22(λ) … b 2n(λ)
….…………………… ,
0 bm2 (λ) …bmn (λ)
в которой все элементы bіј(λ) делятся без остатка на а1(λ). Если среди этих элементов bіј(λ) имеются не равные тождественно нулю, то продолжая тот же процесс приведения для строк с номерами 2, …, m и столбцов с номерами 2, …, n, мы матрицу (*) приведем к виду
а1 (λ) 0 0 … 0
0 а2(λ) 0 … 0
0 0 с33(λ) … с3n(λ) ,
…………………………
0 0 сm3(λ) … сmn(λ)
где а2(λ) делится без остатка на а1(λ), а все многочлены сіј(λ) делятся без остатка на а2(λ). Продолжая этот процесс далее, мы в конце концов придем к матрице вида
а1(λ) 0 … 0 0 … 0
0 а2(λ)… 0 0 … 0
… …………………
0 0 …аs(λ) 0 … 0 ,
0 0 … 0 0 … 0
………………………
0 0 … 0 0 … 0
где многочлены а1(λ), а2(λ), …, аs(λ) (s ≤ m, n) не равны тождественно нулю и каждый из них делится на предыдущий без остатка.
Помножая первые s строк на соответствующие отличные от нуля числовые множители, мы сможем добиться того, чтобы старшие коэффициенты многочленов а1(λ), а2(λ), …, аs(λ) были равны единице.
Таким образом мы доказали, что произвольная прямоугольная многочленная матрица А(λ) эквивалентна некоторой канонической диагональной.
Данная теорема утверждает, что каждый класс эквивалентных матриц содержит, по меньшей мере, одну матрицу, имеющую каноническую диагональную форму.
Пример
Найти каноническую форму и инвариантные множители l-матрицы
l l-1 l-1 l-2
l l3+l l-1 l3+l-1
А(l) = l+1 l3+l+2 l+1 l3+2l+3
l-1 l-3 l-3 -6
Третий столбец вычитаем из остальных:

1 0 l-1 -1
1 l3+1 l-1 l3
А(l) ~ 0 l3+1 l+1 l3+l+2 ~
2 0 l-3 -l-3
(из второй и четвертой строк вычитаем первую, умноженную соответственно на 1 и 2)

1 0 l-1 -1
~ 0 l3+1 0 l3+1 ~
0 l3+1 l+1 l3+l+2
0 0 -l-1 -l-1
(из III и IV столбцов вычитаем I, умноженный соответственно на l-1 и -1)

1 0 0 0
0 l3+1 0 l3+1
~ 0 l3+1 l+1 l3+l+2 ~
0 0 -l-1 -l-1
(II и III столбцы вычитаем из IV)
1 0 0 0
0 l3+1 0 0
~ 0 l3+1 l+1 0 ~
0 0 -l-1 0
(из III строки вычитаем II и полученную строку прибавляем к IV)
1 0 0 0
0 l3+1 0 0
~ 0 0 l+1 0 ~
0 0 0 0
(переставляем II и III строки, а также второй и третий столбцы)
1 0 0 0
0 l+1 0 0
~ 0 0 l3+1 0 .
0 0 0 0
Это каноническая матрица; значит матрица А(l) имеет инвариантные множители: Е1(l)=1, Е2(l)=l+1, Е3(l)=l3+1, Е4(l)=0.
§3. Наибольшие общие делители миноров
Пусть F – какая-нибудь λ-матрица порядка n. Составим ее всевозможные миноры порядка к (к = 1, 2, …, n). Эти миноры являются многочленами от λ. Обозначим их наибольший общий делитель через Dк(λ) (наибольшим общим делителем мы условимся называть общий делитель наивысшей степени со старшим коэффициентом 1. Поэтому все не равные нулю многочлены Dк(λ) имеют старший коэффициент 1). Если окажется, что все миноры к-го порядка равны нулю, то по определению будем считать Dк(λ)=0. В частности, D1(λ) есть наибольший общий делитель элементов матрицы F, а Dn(λ) равен определителю F, деленному на свой старший коэффициент.
Т е о р е м а 2. Эквивалентные λ-матрицы имеют один и тот же наибольший общий делитель миноров к-го порядка (к = 1, 2, …, n).
Доказательство. Пусть F1, F2 – две эквивалентные λ-матрицы. Обозначим наибольшие общие делители их миноров к-го порядка соответственно через Dк1(λ) и Dк2(λ). Требуется показать, что Dк1(λ) = Dк2(λ). Нам известно, что F2 можно получить из F1 цепочкой элементарных преобразований. Предположим сначала, что эта цепочка состоит только из одного элементарного преобразования. Пусть, например, F2 получается из F1 умножением всех элементов i-й строки матрицы F1 на число α≠0. Соответственные миноры F1 и F2 тогда либо совсем не отличаются друг от друга, либо отличаются лишь постоянным множителем α. Однако постоянный множитель не влияет на вычисление наибольшего общего делителя многочленов, поэтому Dк1 = Dк2. То же самое будет и в случае, когда F2 получается из F1 умножением на α элементов какого-либо столбца матрицы F1. Пусть теперь F2 получается из F1 одним из элементарных преобразований; например, пусть F2 возникает в результате прибавления к i-й строке матрицы F1 элементов j-й строки, умноженных на f(λ). Покажем, что Dк2 делится на Dк1.
В самом деле, миноры к-го порядка матриц F1, F2 можно разбить на три класса. К первому мы отнесем те из них, которые не содержат элементов i-й строки. Соответственные миноры матриц F1, F2 в этом случае, очевидно, равны друг другу. Ко второму классу отнесем те миноры, которые содержат элементы и i-й и j-й строк. Эти миноры у матриц F1, F2 будут снова равными, так как величина определителя не меняется, если к элементам одной из его строк прибавляются величины пропорциональные элементам какой-либо другой строки. Наконец, к третьему классу мы отнесем миноры, содержащие элементы i-й строки и не содержащие элементов j-й строки. Соответственные миноры этого класса имеют вид:
…………. …………………………………
м1 = f iυ1 … f iυk , м2 = f iυ1 + f jυ1 ∙ f(λ) . f iυk + f jυk ∙ f(λ) ,
…………. …………………………………
где невыписанные строки у обоих миноров одинаковы. На основании теоремы сложения определителей
…………… ………………
м2 = f iυ1 … f iυk + f(λ) f jυ1 ……… f jυk = м1 ± f(λ)N1 ,
…………… ……………….
где N1 – некоторый минор матрицы F1. Все миноры к-го порядка матрицы F1 делятся и на Dк1. Из наших рассуждений видно, что на Dк1 делятся и все миноры к-го порядка матрицы F2, так как они либо совпадают с соответственными минорами матрицы F1, либо выражаются через них линейно. Но в таком случае Dк1 войдет множителем в наибольший общий делитель миноров к-го порядка матрицы F2, т.е. войдет множителем в Dк2. Итак, если F2 получается из F1 одним элементарным преобразованием, то Dк2 делится на Dк1. Совершая над F2 обратное элементарное преобразование, мы получим F1. Поэтому, Dк1 также должен делиться на Dк2. Но если старшие коэффициенты двух многочленов равны и эти многочлены делятся без остатка друг на друга, то они совпадают. Таким образом, Dк1 = Dк2. Пока доказано равенство наибольших общих делителей в предположении, что F2 получается из F1 одним элементарным преобразованием. Однако если Dк(λ) не меняется при каждом отдельном элементарном преобразовании, то, очевидно, Dк(λ) не изменится и при нескольких последовательных преобразованиях. Потому теорема доказана в общем виде.
Вычислим многочлены D1(λ), …, Dn(λ) для матрицы, имеющей канонический диагональный вид .
d1(λ)
d2(λ)
.
D = . .
.
dn(λ)
Чтобы получить какой-нибудь минор к-го порядка, мы должны из D вычеркнуть n-k строк и n-k столбцов. Если из D вычеркнуть i-ю строку, то в i-м столбце останутся только нули. Поэтому, чтобы получить минор, отличный от нуля, мы должны вычеркнуть все столбцы матрицы D, номера которых равны номерам вычеркнутых строк. Таким образом, отличные от нуля миноры к-й степени должны иметь вид
dυ1(λ)
dυ2 (λ)
. = dυ1 (λ) dυ2 (λ) … dυk(λ). (1)
.
.
dυk(λ)
Наибольшим общим делителем этих миноров будет Dк(λ). Из неравенств 1 ≤ υ1 ≤ υ2 ≤ … ≤ υk ≤ n следует, что 1 ≤ υ1, 2 ≤ υ2, … , k ≤ υk. Поэтому dυi(λ) делится на di(λ), а значит, dυ1(λ) … dυk(λ) делится на d1(λ) … dk(λ). Мы видим, следовательно, что все миноры к-го порядка матрицы D делятся на минор
d1(λ)
.
. = d1(λ) … d k(λ) (2)
.
dk(λ)
Если этот минор равен нулю, то и все миноры к-го порядка матрицы D также равны нулю. Согласно определению в этом случае Dк(λ)=0. Если минор (2) отличен от нуля, то многочлены d1(λ), …, d k(λ) отличны от нуля и имеют старший коэффициент 1. Но тогда и минор (2) имеет старший коэффициент 1. Поскольку все миноры (1) делятся на (2), то Dк(λ) совпадает с (2). Следовательно, в обоих случаях имеем
Dк(λ) = d1(λ)d2(λ)… d k(λ) (к = 1, 2, …, n) (3)
Таковы многочлены Dк(λ) канонической диагональной матрицы с диагональными элементами d1(λ), … , d n(λ).
Рассмотрим теперь произвольную λ-матрицу F. Обозначим через Dк(λ) наибольший общий делитель миноров степени к этой матрицы. Согласно теореме 1. матрицу F элементарными преобразованиями можно привести к канонической диагональной форме
d1(λ)
.
D = . .
.
dn(λ)
Согласно теореме 1. многочлены Dк(λ), вычисленные для матрицы D, совпадают с соответственными многочленами Dк(λ), вычисленными для F. Таким образом, многочлены Dк(λ) матрицы F и диагональные элементы канонической диагональной матрицы D, к которой можно привести F связаны соотношениями (3).
Пусть D1(λ), … , Dr(λ) отличны от нуля, а остальные многочлены Dr+1(λ), … , Dn(λ), если они есть, равны нулю. Тогда из (3) имеем
D1(λ) = d1(λ), d1(λ) = D1(λ),
D2(λ) = d1(λ)d2(λ), d2(λ) = D2(λ) : D1(λ),
…………………. …………………….
Dr(λ) = d1(λ)d2(λ) … dr(λ), dr(λ) = Dr(λ) : Dr-1(λ),
Dr+1(λ) = d1(λ)d2(λ) … dr(λ)dr+1(λ), dr+1(λ) = Dr+1(λ) : Dr(λ).
Поскольку dr+1(λ)=0, то dr+2(λ), … , dn(λ) также должны быть равны нулю, и мы имеем окончательно
d1(λ) = D1(λ), d2(λ) = D2(λ) : D1(λ), … , dr(λ) = Dr(λ) : Dr-1(λ),
dr+1(λ) = … = dn(λ) = 0 (4)
Тем самым мы получили следующую теорему:
Т е о р е м а 3. Если наибольшие общие делители Dк(λ) миноров порядка к λ-матрицы F при к=1, 2, … r отличны от нуля, а Dr+1(λ)=0, то диагональные элементы dк(λ) канонической диагональной матрицы, к которой F приводится элементарными преобразованиями, выражаются через Dк(λ) по формулам (4) и определяются, таким образом, матрицей F однозначно.
Многочлены d1(λ), … , dn(λ) называются инвариантными множителями матрицы F. Число r, в равенствах (4) это – ранг матрицы F. Действительно, ранг матрицы F есть порядок наивысшего минора F,отличного от нуля. Если этот порядок равен r, то, следовательно, Dr(λ)≠0, а Dr+1(λ)=0. Обратно, условия Dr(λ)≠0, Dr+1(λ)=0 означают, что некоторый минор порядка r отличен от нуля, а все миноры порядка r+1 равны нулю. Следовательно, ранг F равен r.
§4. Условия эквивалентности λ-матриц.
Первое условие эквивалентности. Для того чтобы многочленные матрицы порядка n были эквивалентны , необходимо и достаточно, чтобы наибольшие общие делители их миноров к-го порядка совпадали при к=1, 2, … , n.
Поскольку совпадение наибольших общих делителей миноров равносильно совпадению соответствующих инвариантных множителей, то первое условие эквивалентности можно сформулировать и в следующем виде: для эквивалентности λ-матриц необходимо и достаточно, чтобы их соответствующие инвариантные множители были равны.
Доказательство очевидно. В самом деле, если две λ-матрицы F, G эквивалентны, то их наибольшие общие делители Dк(λ) одинаковы (теорема 2). Обратно, если многочлены Dк(λ) у F и G равны, то F и G элементарными преобразованиями приводятся к одной и той же канонической диагональной матрице (теорема 3). Но две матрицы, эквивалентные третьей эквивалентны между собой; следовательно, F эквивалентна G, что и требовалось.
Второе условие эквивалентности. Для того чтобы многочленные матрицы F и G порядка n были эквивалентны, необходимо и достаточно, чтобы они удовлетворяли соотношению
G = PFQ,
где P, Q – некоторые многочленные матрицы с постоянными отличными от нуля определителями.
Прежде чем перейти к доказательству этого утверждения, сделаем несколько замечаний. Пусть
1
.
.
.
1
А = α i-я строка,
1
.
.
.
1
где α- некоторое число, отличное от нуля. Умножая произвольную матрицу F на A слева, мы увидим, что все элементы матрицы F останутся без изменения, кроме элементов i-й строки которые умножаются на α. Таким образом, каждое элементарное преобразование типа II, совершаемое над матрицей F, равносильно умножению F на подходящую матрицу А слева. Аналогично, если умножить матрицу F слева на матрицу
1… 0 … 0 … 0

0 …1… f(λ)…0 i-я строка
В =
0… 0 … 1 … 0 j-я строка,

0 … 0 … 0 … 1
где все диагональные элементы равны единице, элемент, стоящий в i-й строке и j-м столбце, равен f(λ), а остальные элементы равны нулю, то в результате к элементам i-й строки F прибавятся элементы ее j-й строки, умноженные на f(λ). Следовательно, каждое элементарное преобразование типа III равносильно умножению F слева на соответственную матрицу В.
Наконец, тем же способом легко убедиться, что элементарные преобразования матрицы F типа II, III столбцов равносильны умножению F на соответственные матрицы А, В справа.
Перейдем теперь к доказательству второго условия эквивалентности.
Необходимость. Пусть матрица G эквивалентна матрице F. Это означает, что G может быть получена из F цепочкой последовательных элементарных преобразований. Каждое элементарное преобразование мы можем заменить умножением на матрицу вида А или В соответственно слева или справа. В результате получим равенство
G = P1P2 … Pp FQ1Q2 … Qq, (5)
где каждая из матриц Pi , Qj имеет вид А или В (i, j = 1, 2, …).
Положим Р = P1P2 … Pp , Q = Q1Q2 … Qq.
Поскольку определители матриц В равны единице, а определители матриц А являются постоянными, отличными от нуля числами то определители матриц P и Q будут также постоянными, отличными от нуля числами. Соотношение (5) дает
G = PFQ,
и необходимость доказана.
Достаточность. Допустим обратно, что
G = PFQ, (6)
где P и Q – многочленные матрицы с постоянными, отличными от нуля определителями. Наибольший общий делитель Dn(λ) всех миноров порядка n матрицы Р равен определителю Р, деленному на его старший коэффициент. Так как этот определитель есть постоянное число, то Dn(λ)=1. Из соотношения (3) параграфа 3 при к=n получаем
Dn(λ) = d1(λ)d2(λ) … dn(λ) = 1,
откуда d1(λ) = d2(λ) = … = dn(λ) = 1,
где d1(λ), … dn(λ) – инвариантные множители матрицы Р. Но инвариантные множители единичной матрицы E также все равны единице, ибо Е имеет канонический диагональный вид. Согласно первому признаку эквивалентности отсюда следует, что матрица Р эквивалентна Е и, значит, может быть получена из Е цепочкой элементарных преобразований. Каждое элементарное преобразование можно заменить умножением на матрицу типа А или В. В результате Р будет представлена следующим образом:
Р = P1 … Pк Е Q1 … Qℓ = P1 … Pк Q1 … Qℓ
где Pi, Qj – матрицы типов А, В.
Применяя те же самые рассуждения к матрице Q, получим аналогичное разложение
Q = M1 … MsN1 …Nt.
Подставляя эти разложения в (6) придем к равенству
G = P1 … Pк Q1 … QℓFM1 … MsN1 …Nt, (7)
Из которого видно, что G получается последовательным умножением матрицы F на матрицы Pi, Qi , Mi, Ni типа А или В. Но каждое такое умножение равносильно некоторому элементарному преобразованию. Следовательно, G эквивалентна F, и доказательство закончено.
§5. Элементарные делители многочленной матрицы.
Рассмотрим произвольную λ-матрицу F, элементами которой являются многочлены от λ с коэффициентами из основного поля К. Обозначим через d1(λ), d2(λ), … , dn(λ) инвариантные множители матрицы F. Часть этих множителей может равняться нулю, поэтому предположим для определенности, что d1(λ), …, dr(λ) нулю не равны, а dr+1(λ)= …=dn(λ)= 0. Число r, есть ранг матрицы F. Разложим каждый из многочленов d1(λ), …, dr(λ) на множители, неприводимые в поле К. Пусть, например, di(λ) = [ε1(λ)]ⁿ№ [ε2(λ)]ⁿ² … [εk(λ)]ⁿk , где ε1(λ), …, εk(λ) -различные неприводимые многочлены со старшим коэффициентом 1. Выражения [ε1(λ)]ⁿ№, …, [εk(λ)]ⁿk ,называются элементарными делителями инвариантного множителя di(λ). Элементарные делители всех непостоянных инвариантных множителей матрицы F называются ее элементарными делителями. Например, если инвариантные множители матрицы F равны соответственно 1, λ, λ²(λ+1), λ²(λ+1)², то элементарные делители будут λ, λ², λ², λ+1, (λ+1)². Элементарный делитель вида [ε(λ)]k, где ε(λ) неприводимый многочлен, называют принадлежащим многочлену ε(λ). В рассмотренном примере элементарные делители λ, λ², λ²принадлежат λ, а λ+1 и (λ+1)І принадлежат λ+1.
Т е о р е м а 4. Порядок, ранг и система элементарных делителей λ-матрицы F вполне определяют ее инвариантные множители и, следовательно, определяют F с точностью до эквивалентности.
Доказательство легко уясняется из следующего примера. Пусть порядок F равен 6, ранг 4, элементарные делители λ, λ², λ², λ+1, (λ+1)³, λ-1, λ-1. Поскольку порядок F есть 6, то F имеет шесть инвариантных множителей d1(λ), …, d6(λ). Из них d5(λ) = d6(λ) = 0, так как ранг F должен быть 4. Если разложить d1(λ), …, d4(λ) на множители, то должны получиться указанные семь элементарных делителей. Поскольку, однако, d4(λ) делится на d3(λ), d2(λ) и d1(λ), то в d4(λ) входят элементарные делители, принадлежащие ко всем неприводимым многочленам, и притом в высших степенях. Поэтому d4(λ) = λ²(λ+1)³(λ-1). Среди оставшихся элементарных делителей λ, λ², λ+1, λ-1 высшие должны войти в d3(λ); следовательно, d3(λ) = λ²(λ+1)(λ-1). В свою очередь высшие из оставшихся должны составить d2(λ), т.е. d2(λ)=λ. Поскольку все элементарные делители уже распределены, то d1(λ)=1. Ясно, что этот способ применим в любом случае, что и доказывает теорему.
Элементарные делители зависят от основного поля К. Например, пусть инвариантные множители некоторой λ-матрицы F равны λ²+1, (λ²+1)². Если основное поле есть поле вещественных чисел, то многочлен λІ+1 неприводим и элементарными делителями матрицы F являются λІ+1 и (λІ+1)І. Однако, если основное поле – поле всех комплексных чисел, то λ²+1= (λ – i)(λ + i) и элементарными делителями F будут λ+i, (λ+i)І, λ-i, (λ-i)І.
Чтобы получить элементарные делители λ-матрицы, имеющей каноническую диагональную форму, достаточно взять, согласно определению, все элементарные делители ее диагональных элементов. Это же правило имеет место и для произвольной диагональной λ-матрицы.
Лемма. Система элементарных делителей произвольной диагональной λ-матрицы F есть объединение элементарных делителей ее диагональных элементов.
Примеры:
1) Найдем элементарные делители l-матрицы
1 0 0 0
0 l2+2 0 0
А(l) = 0 0 (l4-4)2 0
0 0 0 0
над полями рациональных, действительных и комплексных чисел. Матрица А(l) имеет каноническую форму. Поэтому на ее главной диагонали стоят инвариантные множители Е1(l)=1, Е2(l)=l2+2, Е3(l)=(l4-4)2, Е4(l)=0.
Разлагая Е2(l) и Е3(l) на неприводимые множители над каждым из указанных полей, получим системы элементарных делителей:
1. над полем рациональных чисел:
е1(l)=l2+2, е2(l)=(l2+2)2, е3(l)=(l2-2)2 ;
2. над полем действительных чисел:
е1(l)=l2+2, е2(l)=(l2+2)2, е3(l)=(l+Ö2)2, е4(l)=(l-Ö2)2 ;
3. над полем комплексных чисел
е1(l)=l+2i, е2(l)=l-2i, е3(l)=(l+2i)2, е4(l)=(l-2i)2,
е5(l)=(l+Ö2)2, е6(l)=(l-Ö2)2 .
2) Найти инвариантные множители l-матрицы А(l) размеров 6х8 и ранга 5, если даны ее элементарные делители l+1, l+1, (l+1)3, (l-1)2, (l-1)2.
Так как число всех инвариантных множителей равно меньшему из размеров матрицы, т.е. 6, а число инвариантных множителей, отличных от нуля, равно рангу, т.е. 5, то Е6(l)=0. Далее Е5(l)= (l+1)3(l-1)2, Е4(l)=(l+1)(l-1)2, Е3 (l)=l+1.
Так как мы уже использовали все элементарные делители, то других инвариантных множителей положительной степени не может быть. Поэтому Е2(l)= Е1(l)=1.
3) Найти каноническую форму диагональной l-матрицы А(l)=íl2, 0, l2+l, l2-1, l4-l2ý. Здесь порядок матрицы равен 5, а ранг равен 4. Поэтому Е5(l) =0. Элементарные делители диагональных элементов:
l2, l, l+1, l+1, l-1, l2, l+1, l-1.
Значит,
Е4(l)= l2(l+1)( l-1)= l4-l2, Е3(l)= l2(l+1)( l-1)= l4-l2,
Е2(l)= l(l+1)= l2+l, Е1(l)=1.
Каноническая форма имеет вид í1, l2+l, l4-l2, l4-l2, 0ý.
Глава II. Матричные многочлены.
§1. Деление матричных многочленов. Обобщенная теорема Безу.
Матричным многочленом от переменной l называется выражение вида
F(λ) = Ао λm + А1 λm-1 + А2 λm-2 + … + Аm , (1)
где Ао, …, Аm – квадратные матрицы одного и того же порядка с элементами из основного поля К. Число m называется степенью многочлена, если Ао≠0. Два многочлена называются равными, если равны матрицы, стоящие в этих многочленах при одинаковых степенях переменной λ. Складываются и перемножаются матричные λ-многочлены по обычным правилам. Ясно, что каждый λ-многочлен можно записать в виде одной матрицы, элементами которой являются обыкновенные многочлены от λ, и обратно. Например,
1 2 + 5 6 λ + 1 0 λ² = λ² +5λ + 1 6l+ 2
0 3 7 -2 0 1 7λ λ²-2λ + 3 .
Поэтому матричные λ-многочлены являются лишь особым видом записи λ-матриц .
Многочлен F(λ) называется регулярным, если матрица Ао обратима.
Сумма (разность) двух матричных многочленов одного и того же порядка может быть представлена в виде многочлена, степень которого не превосходит наибольшей из степеней данных многочленов.
Произведение двух матричных многочленов равно многочлену, степень которого меньше или равна сумме степеней сомножителей. Если хотя бы один их двух сомножителей регулярный многочлен, то в этом случае степень произведения всегда равна сумме степеней сомножителей.
Пусть даны два матричных многочлена А(λ) и В(λ) одного и того же порядка n, причем В(λ) – регулярный многочлен:
А(λ) = Аоλm + А1λm-1 + … + Аm (Ао≠0),
В(λ) = Воλр + В1λр-1 + … + Вр (|Во|≠0).
Будем говорить, что матричные многочлены Q(λ) и R(λ) являются соответственно правым частным и правым остатком при делении А(λ) на В(λ), если
А(λ) = Q(λ)В(λ) + R(λ) (2)
и степень R(λ) меньше степени В(λ).
Совершенно аналогично будем называть многочлены ^Q(λ) и ^R(λ) соответственно левым частным и левым остатком при делении А(λ) на В(λ), если
А(λ) = В(λ) ^Q(λ) + ^R(λ) (3)
и степень ^R(λ) меньше степени В(λ).
В общем случае многочлены Q(λ) и R(λ) не совпадают с ^Q(λ) и ^R(λ).
Покажем, что как правое, так и левое деление матричных многочленов одного и того же порядка всегда выполнимо и однозначно, если делитель – регулярный многочлен.
Рассмотрим правое деление А(λ) на В(λ). Если mА(λ)= АоВо -1λm-pВ(λ) + А(1)(λ). (4)
Степень m(1) многочлена А(1)(λ) меньше m:
А(1)(λ) = Ао(1) λm(1) + … (Ао(1)≠0, m(1) Если m(1)≥p, то повторя этот процесс, получаем:
А(1)(λ) = Ао(1)Во -1 λm(1)-р В(λ) + А(2)(λ), (6)
А(2)(λ) = А(2)λm(2) + … (m(2)и т.д.
Так как степени многочленов А(λ), А(1)(λ), А(2)(λ), … убывают, то на некотором этапе мы придем к остатку R(λ), степень которого меньше р. Тогда из (4), (6) будет следовать:
А(λ) = Q(λ) В(λ) + R(λ),
где Q(λ) = АоВо-1 λm-р + Ао(1)Во-1 λm(1)-р + … (7)
Докажем теперь однозначность правого деления. Пусть одновременно
А(λ) = Q(λ) В(λ) + R(λ) (8)
и
А(λ) = Q*(λ) В(λ) + R*(λ), (9)
где степени многочленов R(λ) и R*(λ) меньше степени В(λ), т.е. меньше р. Вычитая почленно (8) из (9) получим:
[Q(λ) – Q*(λ)] В(λ) = R*(λ) – R(λ). (10)
Если бы Q(λ) – Q*(λ) ≡ 0, то поскольку |Во|≠0, степень левой части равенства (10) равнялось бы сумме степеней В(λ) и Q(λ) – Q*(λ) и потому была бы ≥р. Это невозможно, так как степень многочлена, стоящего в правой части равенства (10), меньше р. Таким образом, Q(λ) – Q*(λ)≡0, а тогда из (10) R*(λ) – R(λ)≡0, т.е.
Q(λ) = Q*(λ), R(λ) = R*(λ).
Совершенно аналогично устанавливаются существование и единственность левого частного и левого остатка.
Т е о р е м а 1. (Обобщенная теорема Безу). При правом (левом) делении матричного многочлена F(λ) на бином λЕ-А остаток от деления равен F(А)(соответственно ^F(A)).
Доказательство. Рассмотрим произвольный матричный многочлен n-го порядка
F(λ) = Fо λm + F1 λm-1 + … + Fm (Fо ≠0) (11)
Этот многочлен может быть записан и так:
F(λ) = λm Fо + λm-1 F1 + … + Fm (12)
Обе записи при скалярном λ дают один и тот же результат. Однако если вместо скалярного аргумента λ подставить квадратную матрицу n-го порядка А, то результаты подстановки в (11) и (12) будут различны, так как степени матрицы А могут не быть перестановочными с матричными коэффициентами Fо, F1, …, Fm.
Положим
F(А) = Fо Аm+ F1 Am-1 + … + Fm (13)
и
^F(А) = Аm Fо + Am-1 F1 + … + Fm (14)
и будем называть F(А) правым, а ^F(А) – левым значением многочлена F(λ) при подстановке вместо λ матрицы А.
Разделим многочлен F(λ) на бином λЕ-А. В данном случае правый остаток R и левый остаток ^R не будут зависеть от λ. Для определения правого остатка рассмотрим обычную схему деления:
F(λ) = Fо λm + F1 λm-1 + … + Fm = Fо λm-1(λЕ-А) + (Fо А + F1) λm-1 + F2 λm-2 + …=
= [Fо λm-1 + (Fо А + F1) λm-2] (λЕ-А) + (Fо А2 + F1А1+ F2) λm-2 + F3 λm-3 + … = …
… = [Fо λm-1 + (Fо А + F1) λm-2 + … + (Fо Аm-1 + F1Аm-2 + … + Fm-1)] (λЕ-А) +
+ Fо Аm + F1Аm-1 + … + Fm
Мы нашли, что
R = Fо Аm+ F1Аm-1 + … + Fm = F(А). (15)
Совершенно аналогично
^R =^F(А). (16)
Из доказанной теоремы следует, что многочлен F(λ) делится без остатка справа (слева) на бином λЕ-А тогда и только тогда, когда F(А)=0 (соответственно ^F(А)=0).
Пример
Проверить, что А(l)=Q(l)В(l) + R(l).
l3+l 2l3+l2
А(l)= -l3-2l2+1 3l3+l =

= 1 2 l3+ 0 1 l2+ 1 0 l+ 0 0
-1 3 -2 0 0 1 1 0 .
2l2+3 -l2+1 2 -1 l2+ 3 1
В(l)= -l2-1 l2+2 = -1 1 -1 2 ,

1 1 3 5 l2+4 2l2+13
|Bo| = 1, Bo-1 = 1 2 , А0B0-1 = 2 5 , А0B0-1В(l) = -l2+1 3l2+12 ,
l3+l 2l3+l2 l3+4l 2l3+13l -3l l2-13l
А(1)(l)= -l3-2l2+1 3l3+l – -l3+l 3l3+12l = -2l2-l+1 -11l ,
0 1 l2+ -3 -13 l+ 0 0
А(1)(l)= -2 0 -1 -11 1 0 ,
0 1 × 1 1 1 2
А0(1)В0-1(l)= -2 0 1 2 = -2 -2 ,
1 2 × 2l2+3 -l2+1 = 1 l2+5
А0(1)В0-1В(l)= -2 -2 -l2-1 l2+1 -2l2-4 -6 ,
R(l)= А(1)(l) – А0(1)В0-1В(l)=
-3l l2-13l – 1 l2+5 = -3l-1 -13l -5
= -2l2-l+1 -11l -2l4-4 -6 -l+5 -11l+6 ,

3 5 l+ 1 2 3l+1 5l+2
Q(l) = А0В0-1l + А0(1)В0-1 = 2 5 -2 -2 = 2l-2 5l-2 .
§2. Скалярная эквивалентность.
Как уже отмечалось две λ-матрицы А(λ), В(λ) эквивалентны тогда и только тогда, если существуют λ-матрицы U(λ), V(λ) с не зависящими от λ ненулевыми определителями, удовлетворяющие соотношению
А(λ) = U(λ) В(λ)V(λ). (17)
Условимся говорить, что матрица А(λ) скалярно эквивалентна матрице В(λ), если существуют неособенные матрицы U,V с независящими от λ элементами, удовлетворяющие соотношению (17). Матрицы с независящими от λ элементами будем называть скалярными.
Т е о р е м а 2. Если λ-многочлены первой степени Аλ+В, Сλ+D регулярны и эквивалентны , то они и скалярно эквивалентны.
По условию
Аλ+В = U(λ) (Сλ+D) V(λ), (18)
где U(λ), V(λ) – матрицы с отличными от нуля постоянными определителями. Обозначим через P, S левые частное и остаток от деления U(λ) на Аλ+В, а через Q, R – правые частное и остаток от деления V(λ) на Аλ+В. Следовательно,
U = (Аλ+В) P + S, V = Q(Аλ+В) + R. (19)
Матрицы S и R скалярны, так как их степень меньше единицы. Покажем, что
Аλ+В = S(Сλ+D) R. (20)
Действительно, умножая обе стороны равенства (18) на U-1 и подставляя вместо V его выражение из (19), получим, перенеся члены
[U-1 – (Сλ+D)Q] (Аλ+В) = (Сλ+D)R.
Сравнивая степени левой и правой частей, видим, что выражение внутри квадратных скобок должно равняться некоторой скалярной матрице Т, и мы имеем
Т = U-1- (Сλ + D)Q, Т(Аλ+В) = (Сλ+D)R. (21)
Отсюда
Е = U(Сλ + D)Q + UТ = (Аλ+В)V-1Q + UТ = (Аλ+В)V-1Q + [(Аλ+В)Р + S]Т,
т.е.
Е = (Аλ+В)[V-1Q + РТ] + SТ.
Но правая часть может иметь нулевую степень только в случае обращения в нуль квадратной скобки, откуда
Е = SТ, Т = S-1.
Сравнивая с (21), получаем (20), где S, а значит и R – обратимые скалярные матрицы.
§3. Характеристический многочлен матрицы
Рассмотрим квадратную матрицу А = ||аik||1n. Характеристической матрицей для матрицы А называется матрица λЕ-А.
λ – а11 -а12 … -а1n
λЕ-А = -а21 λ – а22 … -а2n
….…………………… .
-аn1 -аn2 … λ – аnn
Определитель характеристической матрицы
∆(λ) = |λЕ-А| = |λ δik – аik|1n
представляет собой скалярный многочлен относительно λ и называется характеристичным многочленом матрицы А.
Матрицу В(λ) = ||bik (λ)||1n , где bik (λ) – алгебраическое дополнение элемента λδik – аik в определителе ∆(λ), мы будем называть присоединенной матрицей для матрицы А.
Чтобы найти старшие члены характеристического многочлена, воспользуемся тем, что величина определителя равна сумме произведений его элементов, взятых по одному из каждой строки и каждого столбца и снабженных надлежащими знаками. Поэтому, чтобы получить член, имеющий относительно λ наивысшую степень, необходимо взять произведения элементов наивысшей степени. В нашем случае таким произведением будет только одно- произведение диагональных элементов (λ – а11) (λ – а22) …(λ – аnn). Все остальные входящие в состав определителя произведения имеют степень не выше n-2, так как если один из множителей такого произведения будет – аik (i ≠ k), то это произведение не будет содержать множителями λ-аii, λ-акк и будет, следовательно, степени не более n-2. Таким образом, ∆(λ) = (λ – а11) … (λ – аm) + члены степени не выше n-2, или
∆(λ) = λn – (а11 + … + аnn) λn-1 + … (22)
Сумма диагональных элементов матрицы называется ее следом. Формула (22) показывает, что степень характеристического многочлена матрицы равна порядку этой матрицы, старший коэффициент характеристического многочлена равен 1, а коэффициент при λn-1 равен следу матрицы, взятому с обратным знаком.
Т е о р е м а 3. Характеристические многочлены подобных матриц равны друг другу.
Из этой теоремы вытекает, в частности, что подобные матрицы имеют одинаковые следы и определители, так как след и определитель матрицы, взятые с надлежащими знаками, являются коэффициентами ее характеристического многочлена.
Корни характеристического многочлена матрицы называются ее характеристическими числами или собственными значениями. Кратные корни характеристического многочлена называются кратными собственными значениями матрицы. Известно, что сумма всех вещественных и комплексных корней многочлена степени n, имеющего старший коэффициент 1, равна взятому с обратным знаком коэффициенту при (n-1)-й степени переменной. Формула (22) показывает поэтому, что в поле комплексных чисел сумма всех собственных значений матрицы равна ее следу.
Т е о р е м а Г а м и л ь т о н а – К э л и. Каждая матрица является корнем своего характеристического многочлена, т.е. ∆(А)= 0.
Пример.
А = 2 1
-1 3 ,
∆(λ) = λ – 2 -1 = λ² – 5λ + 7,
1 λ – 3
∆(А) = АІ – 5А + 7Е = 3 5 -5 2 1 +7 1 0 = 0 0 = 0.
-5 8 -1 3 0 1 0 0
§4. Минимальный многочлен матрицы
Определение. Скалярный многочлен F(λ) называется аннулирующим многочленом квадратной матрицы А, если
F(А) = 0.
Аннулирующий многочлен ψ(λ) наименьшей степени со старшим коэффициентом, равным единице, называется минимальным многочленом матрицы А.
Согласно теореме Гамильтона- Кэли характеристический многочлен
∆(λ) матрицы А является аннулирующим для этой матрицы. Однако, в общем случае он не является минимальным.
Разделим произвольный аннулирующий многочлен f(λ) на минимальный:
f(λ) = ψ(λ)q(λ) + r(λ),
степень r(λ) меньше степени ψ(λ). Отсюда имеем:
f(А) = ψ(А)q(А) + r(А).
Поскольку f(А) = 0 и ψ(А) = 0, то, значит, и r(А) = 0. Но степень r(λ) меньше степени минимального многочлена ψ(λ). Поэтому r(λ)≡0. Таким образом, произвольный аннулирующий многочлен матрицы всегда делится без остатка на ее минимальный многочлен.
Пусть два многочлена ψ(λ) и ψ'(λ) являются минимальными для одной и той же матрицы. Тогда каждый из них делится на другой многочлен без остатка, т.е. эти многочлены отличаются постоянными множителями. Этот постоянный множитель равен единице, поскольку равны единице старшие коэффициенты в ψ(λ) и ψ'(λ). Мы доказали единственность минимального многочлена для данной матрицы А.
Если Dn-1(λ) – наибольший общий делитель миноров (n-1)-го порядка характеристической матрицы λЕ-А, а Dn(λ)=| λЕ-А |, то минимальный многочлен ψ(λ) матрицы А можно найти по формуле
ψ(λ) = Dn(λ) : Dn-1(λ) = Еn(λ),
где Еn – последний инвариантный множитель матрицы λЕ-А.
Отсюда ясно, что минимальный многочлен тогда и только тогда совпадает с характеристическим многочленом, когда Dn-1(λ)=1, т.е. когда матрица λЕ-А имеет лишь один инвариантный множитель, отличный от единицы, именно Еn(λ).
Минимальный многочлен клеточно-диагональной матрицы
А = {А1, А2, …, Аs}
равен наименьшему общему кратному минимальных многочленов диагональных клеток Аi.
Примеры:
1) Минимальный многочлен нулевой матрицы равен l, а единичной матрицы Е равен l-1.
2) Найти минимальный многочлен инволютивной матрицы А, т.е. матрицы, для которой А2=Е.
В данном случае А2 – Е = 0. Поэтому аннулирующим многочленом будет f(l)=l2-1. Так как минимальный многочлен делит любой аннулирующий, то возможны случаи:
y(l)=l-1, y(l)=l+1, y(l)=l2+1.
В первом случае А – Е = 0, А = Е. Во втором А + Е = 0, А = -Е. В третьем А ¹ ± Е . Итак, если А ¹ ± Е и А2=Е, то y(l)=l2-1.
§5. Критерий подобия матриц
Пусть дана матрица А=||аik||1n с числовыми элементами из поля К. Ее характеристическая матрица λЕ-А является λ-матрицей ранга n и потому имеет n инвариантных многочленов
i1(λ), i2(λ), …, in(λ).
Следующая теорема показывает, что эти инвариантные многочлены определяют исходную матрицу А с точностью до преобразования подобия.
Т е о р е м а 4. Для того чтобы две матрицы А=||аik||1n и В=||вik||1n были подобны (В=Т-1АТ), необходимо и достаточно, чтобы они имели одни и те же инвариантные многочлены, или, что то же, одни и те же элементарные делители в поле К.
Доказательство. Условие необходимо. Действительно , если матрицы А и В подобны, то существует такая неособенная матрица Т, что
В=Т-1АТ.
Отсюда
λЕ-В = Т-1 (λЕ-А)Т.
Это равенство показывает, что характеристические матрицы λЕ-А и λЕ-В эквивалентны и потому имеют одни и те же инвариантные многочлены.
Условие достаточно. Пусть характеристические матрицы λЕ-А и λЕ-В имеют одни и те же инвариантные многочлены. Тогда эти λ-матрицы эквивалентны, и, следовательно, существуют две многочленные матрицы Р(λ) и Q(λ) такие, что
λЕ-В = Р(λ)(λЕ-А) Q(λ). (23)
Применяя к матричным двучленам λЕ-А и λЕ-В второе условие эквивалентности, мы можем в тождестве (23) заменить λ-матрицы Р(λ) и Q(λ) постоянными матрицами Р и Q:
λЕ-В = Р(λЕ-А)Q, (24)
причем в качестве Р и Q можно взять соответственно левый и правый остатки от деления Р(λ) и Q(λ) на λЕ-В, т.е. на основании обобщенной теоремы Безу можно положить:
Р = ˆР(В), Q = Q(В). (25)
Приравнивая в обеих частях равенства (24) коэффициенты при нулевой и при первой степенях λ, получим:
В = РАQ, Е = РQ,
т.е.
В=Т-1АТ,
где
Т = Q = Р-1.
Теорема доказана.
Из теоремы можно извлечь следующий алгоритм для распознования подобия матриц А, В: составляем характеристические матрицы λЕ-А, λЕ-В и приводим их элементарными преобразованиями к канонической диагональной форме. Если эти формы совпадают, то матрицы А, В подобны; если различны, то А и В не подобны.
Добавление к теореме 4. Если А=||аik||1n и В=||вik||1n – две подобные матрицы
В=Т-1АТ, (26)
то в качестве преобразующей матрицы Т можно взять матрицу
Т = Q(В) = [^Р(В)]-1, (27)
где Р(λ) и Q(λ) – многочленные матрицы в тождестве
λЕ-В = Р(λ)(λЕ-А)Q(λ),
связывающем эквивалентные характеристические матрицы λЕ-А и λЕ-В; в формуле (27) Q(В) обозначает правое значение матричного многочлена Q(λ), а ^Р(В) – левое значение матричного многочлена Р(λ) при замене аргумента λ матрицей В.
Пример.
Доказать, что матрицы

1 -3 4 -3
А = 1 2 и В = 3 -1
подобны, и найти преобразующую матрицу Т, для которой В=Т-1АТ.
Инвариантные множители характеристических матриц lЕ-А и lЕ-В одинаковы:
Е1(l) = 1 , Е2(l) = l2- 3l + 5.
Поэтому матрицы А и В подобны. Полагая
х у
Т = z t
и приравнивая элементы матриц в равенстве АТ=ТВ, получим
х – 3z = 4х + 3у
х + 2z = 4z + 3t ,
y – 3t = -3x – y
y + 2t = -3z – t .
Решая методом исключения, найдем два линейно независимых уравнения:
x + y + z = 0 ,
y + 3z + 3t = 0 .
Общее решение: х = 2z + 3t, y = -3z – 3t. Подставляя эти значения х и у в определитель, найдем
2z+3t -3z-3t = 3z2 + 5zt + 3t2
|T| = z t
Беря например, z=-1, t=1, получим |T| =1, х=1, у=0, откуда
1 0
Т = -1 0 .
§6. Нормальная форма Жордана
Т е о р е м а 5. Каждая квадратная матрица над полем комплексных чисел, а также и над любым другим алгебраически замкнутым полем подобна матрице, имеющей жорданову форму. Две матрицы Жордана подобны тогда и только тогда, когда они составлены из одних и тех же жордановых клеток и отличаются друг от друга, самое большее лишь расположением клеток на главной диагонали.
Доказательству теоремы предпошлем две леммы, имеющие и самостоятельный интерес:
Лемма 1. Характеристическая матрица клетки Жордана имеет только один элементарный делитель (λ – ρ)n, где n – порядок клетки, а ρ – ее собственное значение.
Характеристическая матрица заданной клетки Жордана имеет вид
λ – ρ -1 0 … 0 0
λ – ρ -1 … 0 0
λЕ-А = ……………. .
λ – ρ -1
λ – ρ
Вычислим наибольший общий делитель Dk(λ) миноров порядка k матрицы λЕ-А. Прежде всего, имеем
Dn(λ) = | λЕ-А | = (λ – ρ)n.
Далее, Dn-1(λ) есть наибольший общий делитель всех миноров степени n-1. Но среди последних находится минор
-1 0 … 0 0
λ – ρ -1 … 0 0
λ – ρ … 0 0 = (-1)n-1,
………
λ – ρ -1
получаемый вычеркиванием первого столбца и последней строки матрицы λЕ-А. Поскольку этот минор равен ±1, то Dn-1(λ)=1. Обозначим через d1(λ), …, dn(λ) инвариантные множители матрицы λЕ-А. Из соотношений
Dn-1(λ) = d1(λ) … dn-1(λ) = 1,
Dn (λ) = d1(λ) … dn-1(λ)dn(λ) = (λ – ρ)n
вытекает, что d1(λ) =… = dn-1(λ) =1, dn(λ)=(λ – ρ)n . Следовательно, λЕ-А имеет только один элементарный делитель и этот делитель равен (λ – ρ)n.
Лемма 2. Система элементарных делителей характеристической матрицы жордановой матрицы состоит из элементарных делителей ее клеток Жордана и определяет вид жордановой матрицы однозначно с точностью до порядка следования клеток по главной диагонали.
По определению жордановой матрицей называется клеточно-диагональная матрица с клетками Жордана по главной диагонали. Поэтому характеристическая матрица для матрицы Жордана распадается на характеристические матрицы для отдельных клеток Жордана. Отсюда следует, что система элементарных делителей характеристической матрицы для матрицы Жордана состоит из элементарных делителей характеристических матриц отдельных клеток Жордана, по одному для каждой клетки. Тем самым система элементарных делителей характеристической матрицы для матрицы Жордана определяет вид этой матрицы однозначно с точностью до порядка расположения клеток по главной диагонали.
Характеристические матрицы подобных матриц эквивалентны и потому имеют одинаковые системы элементарных делителей. Отсюда следует, что подобные матрицы Жордана должны состоять из одинаковых клеток Жордана, и для завершения доказательства теоремы остается только для каждой заданной матрицы А уметь построить подобную ей матрицу Жордана. Пусть (λ – ρ1)n1, …, (λ – ρs)ns – полный набор элементарных делителей характеристической матрицы λЕ-А. Обозначим через В клеточно-диагональную матрицу, диагональными клетками которой являются клетки Жордана с указанными элементарными делителями. Следовательно, матрица λЕ-В имеет те же элементарные делители, что и λЕ-А. Но тогда матрицы λЕ-А и λЕ-В эквивалентны, а отсюда вытекает, что А подобна жордановой матрице В. Теорема доказана.
Изложенные рассуждения дают ответ и на вопрос о том, как по заданной матрице А найти подобную ей матрицу Жордана. Для этого достаточно составить характеристическую матрицу λЕ-А, привести ее элементарными преобразованиями к канонической диагональной форме, разложить диагональные многочлены на множители, найти элементарные делители и по ним составить матрицу Жордана. Пусть, например,
3 1 -3
А = -7 -2 9 .
-2 -1 4
Составляем характеристическую матрицу
λ-3 -1 3
λЕ-А = 7 λ+2 -9
2 1 λ-4
и ищем ее инвариантные множители. Эти множители, как легко видеть, будут 1, 1, (λ-1)(λ-2)². Следовательно, элементарные делители равны λ-1, (λ-2)² и жорданова матрица имеет вид
1 0 0
В = 0 2 1 .
0 0 2
В заключении сделаем еще одно замечание. Если элементарные делители матрицы λЕ-А окажутся первой степени, то первого порядка будут и клетки Жордана в соответствующей жордановой матрице В, т.е. матрица В будет диагональной. Обратно, если соответствующая жорданова матрица диагональна, то элементарные делители будут первой степени. Таким образом, для того чтобы заданная матрица была подобна диагональной необходимо и достаточно, чтобы все элементарные делители ее характеристической матрицы были первой степени.
Глава III. Функции от матриц.
§1. Многочлен от жордановой матрицы.
В качестве основного поля берется поле всех комплексных чисел.
Простейшими функциями от матриц являются многочлены. В дальнейшем будет дано общее определение функций от матриц, а сейчас укажем явное выражение для многочлена от матрицы, имеющей нормальную форму Жордана. Рассмотрим сначала отдельную клетку Жордана порядка n.
ρ 1 0 … 0 0
ρ 1 … 0 0 (1)
А = ……… .
ρ 1
ρ
Покажем, что для всех натуральных m имеет место формула
ρm (m) ρm-1 … (n-1) ρm-n+1
Аm = ρm … (n-2) ρm-n+2 (2)
………. ,
ρm
где положено
m m(m-1) … (m-k+1)
k 1· 2 … k .
Доказательство проще всего провести индукцией по m. Для m=1 формула (2) совпадает с (1) и поэтому верна. С другой стороны, если равенство (2) верно для какого-нибудь m, то умножая его на А, мы непосредственными вычислениями получим, что для Аm+1 формула (2) также верна.
Пусть теперь f(λ) – некоторый многочлен от λ:
f(λ) = α0 + α1λ + α 2λ² + … + αkλk.
Согласно определению
f(А) = α 0Е + α1А + α2А² + … + αkАk.
Подставляем сюда вместо матриц Аm их значения из (2), мы увидим, что в i-й строке и (i+s)-м столбце матрицы f(А) стоит выражение
k
∑ αm m(m-1) … (m-s) ρm-s 1 fs (ρ) .
m=0 1 ∙ 2 … s 1 ∙ 2 … s
Следовательно окончательно имеем
f(ρ) f΄(ρ) f”(ρ) … f(n-1)(ρ)
f(ρ) f΄(ρ) … f(n-2)(ρ) (3)
f(А) = ………………… .
f(ρ)
Мы вычислили пока значение многочлена от клетки Жордана. Однако общая жорданова матрица А есть прямая сумма отдельных клеток Жордана:
А = А1 + А2 + … + Аs,
и отсюда имеем
f(А) = f(А1) + f(А2) + … + f(Аs). (4)
Здесь f(А1), …, f(Аs) – многочлены от отдельных клеток Жордана, выражения которых даны формулой (3). Этот результат можно применить и к вычислению многочленов от матриц А, не имеющих формы Жордана. В самом деле, сначала ищем такое Т, чтобы матрица Т-1АТ = В имела нормальную форму Жордана; затем вычисляем f(В) согласно формулам (3) и (4) и, наконец, в силу отношения
f(А) = f(ТВТ-1) = Тf(В) Т-1
получаем значение f(А).
§2. Скалярные функции
Общее понятие матричных функций определяется совершенно аналогично понятию обыкновенных числовых функций. Именно рассмотрим некоторое множество матриц m. Если каждой матрице А из m поставлена в соответствие некоторая матрица В, то говорят, что В есть функция от А, определенная на m. Мы хотим теперь каждой обыкновенной числовой функции ρ= f(λ) , заданной на некотором множестве комплексных чисел и удовлетворяющей сформулированным ниже требованиям, поставить в соответствие определенную матричную функцию f(А). Соответствие это строится следующим образом. Пусть даны некоторая числовая функция ρ= f(λ) и произвольная матрица А. Обозначим через ρ1, ρ2, …, ρs различные собственные значения матрицы А. Приведем А к нормальной форме Жордана:
Т-1АТ = В =В1 + В2 + … + Вt ,
где В1, …, Вt – клетки Жордана, и рассмотрим какую-нибудь из них, например
ρi 1 0 …. 0
Вi = ρi 1 …. 0 (5)
…… ,
ρi
отвечающую элементарному делителю (λ-ρi)ni. Если функция f(λ) определна в окрестности точки ρi и имеет конечные производные f´(ρ), …, f(ni-1) (ρi), то мы полагаем по определению,
f(ρi) fґ(ρi) … f(ni-1)(ρi)
f (Вi) = f(ρi) … f(ni-2)(ρi)
…………………… . (6)
f(ρi)
Далее, если f(λ) определена в окрестности каждой точки ρ1, …, ρs и имеет в них конечные производные надлежащих порядков, то мы полагаем также
f(В) = f(В1) + f(В2) + … + f(Вt), (7)
f(А) = Тf(В)Т-1 = Т(f(В1) + … + f(Вt)) Т-1. (8)
Матрица f(А) называется значением функции f(λ) при λ=А. Ниже будет показано, что f(А) не зависит от способа приведения матрицы А к нормальной форме и, таким образом, является некоторой матричной функцией от А. Эта функция называется соответствующей числовой функции f(λ). Ясно, что далеко не все матричные функции имеют соответствующие числовые. Те из них, для которых соответствующие числовые функции существуют, называются скалярными функциями.
Отметим несколько простейших свойств скалярных функций:
1°. Если f(λ) есть многочлен от λ, то значение скалярной функции f(А) совпадает со значением многочлена f(λ) при λ=А.
Действительно, само определение скалярных функций выбрано таким образом, чтобы для многочленов оно совпадало со старым.
2°. Пусть А-матрица и f1(λ), f2(λ) – числовые функции, для которых выражения f1(A) и f2(А) имеют смысл. Если f(λ)= f1(λ) + f2(λ), то f(А) также имеет смысл и f(А)= f1(А) + f2(А).
3°. Если А-матрица, f1(λ) и f2(λ) – числовые функции для которых f1(А) и f2(А) имеют смысл, и f(λ)= f1(λ)f2(λ), то f(А) имеет смысл и f(А)= f1(А)f2(А).
Доказательства свойств 2° и 3° аналогичны, поэтому мы ограничимся рассмотрением свойства 3°. Чтобы вычислить f1(А), f2(А), f(А), мы согласно определению, должны привести А к нормальной форме Жордана В и воспользоваться формулами (7) и (8). Если удастся показать, что f(В)= f1(В)f2(В), то из (8) непосредственно получится f(А)= f1(А) f2(А). С другой стороны,
f(В)= f(В1) + f(В2) + … + f(Вt),
f1(В)f2(В) = f1(В1) f2(В2) + … + f1(Вt) f2(Вt) ,
поэтому все дело сводится к доказательству равенств
f(Вi) = f1(Вi) f2(Вi) (i=1, 2, …, t),
где Вi – клетки Жордана. Беря значения f1(Вi), f2(Вi) из формулы (6) и перемножая, мы обнаружим, что в к-й строке и (k+j)-м столбце матрицы f1(Вi) f2(Вi) будет стоять элемент, равный
f1(ρ) · f2(j)(ρ) + fґ1(ρ) · f2(j-1)(ρ) + … + f1(j)(ρ) · f2(ρ).
Это выражение можно переписать в виде
[f1(ρ) f2 (j)(ρ) + fґ1(ρ) f2 (i-1)(ρ) + … + f1(j)(ρ) · f2(ρ)],
что согласно правилу дифференцирования произведения функций совпадает с f (j)(ρ). Таким образом,
f1(Вi) f2(Вi) = f(Вi),
и утверждение 3° доказано.
Аналогичным образом, используя правило дифференцирования функции от функции, можно было бы показать, что если числовые функции φ(λ) и f(φ(λ)) удовлетворяют требованиям, при которых выражение f(φ(λ)) определено, и если ψ(λ)= f(φ(λ)), то ψ(А)= f(φ(А)).
4˚. Пусть А-матрица, имеющая собственные значения ρ1, ρ2, …, ρn, причем каждое собственное значение выписано здесь столько раз, какова его кратность. Если f(λ) – числовая функция и f(А) имеет смысл, то собственные значения матрицы f(А) равны f(ρ1), f(ρ2), …, f(ρn).
В самом деле, собственные значения матриц f(А) и Т-1f(А)Т=f(Т-1АТ) соответственно равны, поэтому мы можем предполагать, что А имеет нормальную форму Жордана. Формулы (5) и (6) показывают, что в этом случае f(А) имеет треугольную форму, причем по главной диагонали f(А) стоят числа f(ρ1), f(ρ2), …, f(ρn). Поскольку диагональные элементы треугольной матрицы являются ее собственными значениями, то утверждение 4˚ доказано.
Рассмотрим два примера. 1) Пусть f(λ)= λ-1. Эта функция определена всюду, кроме λ=0, и при всех значениях λ, отличных от нуля, имеет производные любых порядков. Следовательно, если матрица А не имеет нулевых собственных значений, т.е. если А неособенная, то f(А) имеет смысл. Но λ · f(λ)=1, поэтому А · f(А)=Е, откуда f(А)= А-1. Таким образом, функции λ-1 отвечает обратная матрица.
2) Пусть f(λ)=√λ. Эта функция при λ≠0 имеет конечные производные любых порядков. Таким образом, выражения √А имеет смысл для всех неособенных матриц А. Полагая в соотношении
f(λ)f(λ) =λ
λ=А, мы получим
f(А)f(А) =А.
Мы доказали, следовательно, что из всякой неособенной матрицы можно извлечь квадратный корень.
Пример.
Найти Аn, если

1 4 2
А = 0 -3 -2
0 4 3 .
Найдем А2
1 4 2 × 1 4 2 = 1 0 0 = Е
А2 = А × А = 0 -3 -2 0 -3 -2 0 1 0
0 4 3 0 4 3 0 0 1
Итак, Аn = Е, если n=2к и Аn = А, если n=2к+1.
§3. Представление значений функций многочленами
Во всех курсах высшей алгебры рассматривается задача, как по заданной системе различных чисел ρ1, ρ2, …, ρs и произвольной системе чисел a1, a2, …, as построить многочлен f(λ), который в точках ρ1, ρ2, …, ρs принимает соответственные значения α1, α2,…,αs . Решение дается в виде известного интерполяционного многочлена Лагранжа.
Для дальнейшего важно уметь строить многочлены, которые не только сами, но и их производные до некоторого порядка принимают заданные значения в точках ρ1, ρ2, …, ρs. Эта задача является, таким образом, непосредственным обобщением предшествующей. Утверждение о ее разрешимости сформулируем в виде отдельной леммы.
Лемма. Пусть заданы различные числа ρ1, ρ2, …, ρs и таблица из (к+1) s произвольных чисел αij. Найдется многочлен р(λ), который в каждой точке ρi имеет значение αi0, а его j-я производная – значение αij (=1, , …, s; j= 1, …, к).
Сначала удобнее построить вспомогательный многочлен рi(λ) такой, что он и его производные до к-го порядка имеют требуемые значения лишь в точке ρi, а в остальных заданных точках обращаются в нуль. Положим
φi(λ)= βi0 + βi1 (λ – ρi) + …+ βik(λ – ρi)k,
Φi(λ) = (λ – ρ1)k+1… (λ – ρi-1)k+1(λ – ρi+1)k+1… (λ – ρs)k+1 ,
рi(λ) = φi(λ) Φi(λ),
где βi0, βi1, … , βik – некоторые пока не определенные числа.
Очевидно, при любых βi0 , …, βik имеем
рi(ρj) = рi(ρj) = … = рi (k)(ρj) = 0 (j≠i).
Согласно правилу дифференцирования произведения
рi(j) = φi(j)(ρi) Фi(ρi) + jφ i(j-1)(ρi) Фi (ρi) + … + φi(ρi)Фi (j)(ρi)
или
aij = j ! βij Фi(ρi) + j ! βij-1Фi(ρi) + … + βi 0Фi(j)(ρi). (9)
Так как Фi(ρi)≠0, то из соотношений (9) при j=0, 1, …, k можно последовательно определить числа βi0, βi1, … , βiк и тем самым найти рi(λ). Многочлен
р(λ) = р1(λ) + р2(λ) + … + рs(λ)
будет, очевидно, удовелтворять всем требованиям леммы.
Рассмотрим некоторую числовую функцию f(λ) и матрицу А, для которой значение f(А) определено. Покажем, что тогда найдется многочлен р(λ), для которого р(А), будет равно f(А). Обозначим через ρ1, ρ2, …, ρs различные собственные значения матрицы А. Пусть ее порядок есть n. Согласно только что доказанной лемме мы можем построить многочлен р(λ), удовлетворяющий требованиям
р(ρi) = f(ρi), р΄(ρi) = f΄(ρi), …, р (n-1)(ρi) = f(n-1)(ρi) (10)
(i= 1, …, s).
Для определения смысла выражения f(А) нам нужны были только значения функции f(λ) и ее производных самое большее до (n-1)-й в точках ρ1, ρ2, …, ρs . Поскольку эти значения у f(λ) и р(λ) совпадают, то f(А)=р(А). Итак:
Т е о р е м а 1. Значения всех cкалярных функций от матрицы А можно представить многочленами от А.
В частности, рассматривая функцию f(λ)=√λ, мы видим, что для каждой неособенной матрицы А существует такой многочлен р(λ), для которого
р(А)р(А) = А.
С помощью теоремы 1 легко решается вопрос об однозначиности определения значения f(А). В самом деле, зная функцию f(λ) и ее производные в точках ρ1, …, ρs, мы можем построить многочлен р(λ), значение которого р(А) не зависит от приведения матрицы А к нормальной форме Жордана и в то же время совпадает с f(А). Следовательно, значение f(А), определенное с помощью приведения матрицы А к нормальной форме, от способа этого приведения не зависит.
Сделаем еще одно замечание. Пусть f(λ) – некоторая числовая функция, А – матрица, для которой f(А) имеет смысл. Согласно теореме 1 мы можем найти многочлен р(λ), для которого р(А)=f(А). При заданной функции f(λ) многочлен р(λ) зависит лишь от элементарных делителей матрицы А. Но элементарные делители матрицы А и транспонированной матрицы А΄ совпадают, поэтому р(А΄)=f(А΄). Легко усмотреть, что р(А΄)=р(А)΄. Таким образом, для всех скалярных функций f(А) имеем f(А)=f(А)΄.
§4. Элементарные делители функций
Рассмотрим вопрос, как по элементарным делителям матрицы А найти элементарные делители какой-нибудь ее скалярной функции f(А). Приведем А к нормальной форме
Т-1АТ = В = В1 + В2 + … Вt, (11)
где В1, … ,Вt, – клетки Жордана. Согласно определению
f(А) = Т f(В) Т-1,
и, следовательно, элементарные делители матриц f(А) и f(В) совпадают. Из (11) вытекает, что
f(В) = f(В1) + f(В2) + … + f(Вt);
поэтому система элементарных делителей матрицы f(В) есть объединение систем элементарных делителей клеток f(В1), …, f(Вt). Таким образом, наш первоначальный вопрос сводится к следующему: дана клетка Жордана Вi с элементарным делителем (λ-ρi)ni требуется найти элементарные делители для f(Вi).
На основании формул (5), (6) имеем
λ – f(ρi) – f΄(ρi) … – f(ni-1) (ρi)
λЕi-f(Bi) = λ-f(ρi) … – f(ni-2) (ρi)
………………………… . (12)
λ – f(ρi)
Ищем наибольшие общие делители D1(l), D2(l), ., Dni(l) миноров 1-го, 2-го, ., ni-го порядков этой матрицы. Старший из них Dni(l) равен определителю матрицы, следовательно,
Dni(l) = (l-f(ri))ni .
Все остальные являются делителями Dni(l) и поэтому имеют вид (l-f(ri))α. Рассмотрим Dni-1(l). Этот многочлен должен быть делителем всех миноров порядка ni-1 матрицы (12), в том числе и минора D(l), получающегося вычеркиванием первого столбца и последней строки. Однако если в этот минор подставить вместо l число f(ri), то получится матрица треугольной формы с элементами – f¢(rj) на главной диагонали и, значит,
D(ri) = (-f¢(ri))ni-1 . (13)
Мы предположим теперь, что f¢(ri)¹0. Равенство (13) показывает тогда, что D(l) не делится на l- f(ri). Но многочлен Dni-1(l) должен быть общим делителем многочленов D(l) и Dni(l), следовательно, Dni-1(l)=1. Остальные многочлены Dni-2(l), ., D2(l),D1(l) являются делителями Dni-1(l) и поэтому также равны единице. Составляя отношения Dк+1 : Dк, мы видим, что инвариантными множителями матрицы (12) будут 1, . , 1, (l-f(ri))ni , вследствие чего матрица (12) будет иметь только один элементарный делитель (l-f(ri))ni. Отсюда следует
Т е о р е м а 2. Пусть матрица А имеет собственные значения r1, ., rs и f(l) – функция, для которой f¢(ri)¹0 (i=1, ., s). Тогда, если матрица f(А) существует, то ее элементарные делители можно получить заменой каждого элементарного делителя (l-ri)ni матрицы А выражением (l-f(ri))ni .
Например, если А – неособенная матрица, f(l)=l-1 , то f(А)= А-1 и f¢(ri)=-ri-2¹0. Поэтому, если каждый элементарный делитель (l-ri)ni матрицы А заменить выражением (l-ri-1)ni, то получится система элементарных делителей обратной матрицы.
§5. Степенные ряды
Последовательность квадратных матриц
А1, А2, ., Аm, Аm+1, . . (14)
одного и того же порядка называется сходящейся к матрице А, если элементы матриц (14), стоящие на пересечении заданного столбца и заданной строки, стремятся к соответствующему элементу матрицы А. Из этого определения непосредственно ясно, что если матрицы Аm и Bm при возрастании m стремятся соответственно к А и В, то Аm+Bm и АmBm стремятся к А+В и АВ. В частности, если Т – постоянная матрица, а матрица Аm стремится к А, то Т-1АmТ будет иметь своим пределом Т-1АТ. Далее, если
Аm = Аm(1) + Аm(2) + . + Аm(s) (m=1, 2, .),
где порядки клеток от m не зависят, то Аm при возрастании m стремится к некоторому пределу тогда и только тогда, если к пределу стремится каждая клетка Аm(i) отдельно.
Последнее замечание позволяет весьма просто решить вопрос о сходимости так называемых степенных рядов от матрицы. Пусть
α0 + α1l + α2l2 + . + αmlm + . (15)
– формальный степенной ряд относительно переменной l. Выражение
α0Е +α1А + α2А2 + . + αmАm + . (16)
называется соответствующим степенным рядом от матрицы А, а многочлен
fn(А) = α0Е + α1А + . + αnАn
– n-й начальной суммой этого ряда. Ряд (16) называется сходящимся, если последовательность начальных сумм f1(А), , fm(А), . имеет предел; в случае существования этот предел называется суммой ряда (16).
Приведем матрицу А к нормальной форме
Т-1АТ = В = В1 + В2 + . + Вt ,
где В1, …, Вt – клетки Жордана. Сходимость последовательности fm(А) равносильна сходимости последовательности Т-1fm(А)Т (m=1, 2, …). Но
Т-1fm(А)Т = fm (Т-1АТ) = fm(В) = fm(В1) + . + fm(Вt),
поэтому вопрос о сходимости ряда (16) равносилен следующему; при каких условиях этот ряд сходится для клеток Жордана В1, ., Вt? Рассмотрим одну из этих клеток, например Вi. Пусть ей отвечает элементарный делитель (l-ri)ni . Согласно формуле (3)
fm(ri) f¢m(ri) . fm(ni-1)(ri)
fm(ri) . fm(ni-2)(ri) ,
fm(Вi) =
fm(ri)
cледовательно, fm(Вi) при возрастании m тогда и только тогда стремится к некоторому пределу, когда к пределу стремится fm(ri), f¢m(ri), ., fm(ni-1)(ri), т.е. когда в точке ri сходится ряд (15), а также ряды получаемые из него почленным дифференцированием до (ni-1)-го раза включительно. Из теории аналитических функций известно, что все эти ряды заведомо сходятся, если либо ri лежит внутри круга сходимости ряда (15), либо ri лежит на окружности круга сходимости и (ni-1)-я производная от ряда (15) в точке ri сходится. Следовательно, доказана
Т е о р е м а 3. Для того чтобы степенной ряд от матрицы А сходился, необходимо и достаточно, чтобы каждое собственное значение ri матрицы А либо находилось внутри круга сходимости соответствующего степенного ряда f(l), либо лежало на круге сходимости с тем, чтобы одновременно ряд, полученный (ni-1) – кратным дифференцированием ряда f(l), сходился в точке ri, где ni – степень наивысшего элементарного делителя, принадлежащего ri .

Литература
1. Гантмахер Ф.Р., Теория матриц, Гостехиздат, М., 1954.
2. Куликов Л.Я., Алгебра и теория чисел, М., Высшая школа, 1989.
3. Курош А.Г., Курс высшей алгебры, Издание 6.
4. Мальцев А.И., Основы линейной алгебры, Гостехиздат, 1975.
5. Мишина А.П., Проскуряков И.В., Высшая алгебра, Издательство физико-математической литературы, М., 1962.