Матричный анализ

Курс лекций по дисциплине
«Матричный анализ»
для студентов II курса
математического факультета специальности
«Экономическая кибернетика»
(лектор Дмитрук Мария Александровна)
Глава 3. Функции от матриц.
1. Определение функции.
Df. Пусть [pic]– функция скалярного аргумента. Требуется определить, что понимать под f(A), т.е. нужно распространить функцию f(x) на матричное значение аргумента.
Решение этой задачи известно, когда f(x) – многочлен: [pic], тогда [pic].
Определение f(A) в общем случае.
Пусть m(x) – минимальный многочлен А и он имеет такое каноническое
разложение [pic], [pic], [pic]– собственные значения А. Пусть многочлены
g(x) и h(x) принимают одинаковые значения.
Пусть g(A)=h(A) (1), тогда многочлен d(x)=g(x)-h(x) – аннулирующий
многочлен для А, так как d(A)=0, следовательно, d(x) делится на линейный
многочлен, т.е. d(x)=m(x)*q(x) (2).
Тогда [pic], т.е. [pic](3), [pic], [pic], [pic].
Условимся m чисел для f(x) таких [pic] называть значениями функции f(x) на
спектре матрицы А, а множество этих значений будем обозначать [pic].
Если множество f(Sp A) определено для f(x), то функция определена на
спектре матрицы А.
Из (3) следует, что многочлены h(x) и g(x) имеют одинаковые значения на
спектре матрицы А.
Наши рассуждения обратимы, т.е. из (3) ( (3) ( (1). Таким образом, если
задана матрица А, то значение многочлена f(x) вполне определяется
значениями этого многочлена на спектре матрицы А, т.е. все многочлены
gi(x), принимающие одинаковые значения на спектре матрицы имеют одинаковые
матричные значения gi(A). Потребуем, чтобы определение значения f(A) в
общем случае подчинялось такому же принципу.
Значения функции f(x) на спектре матрицы А должны полносильно определить
f(A), т.е. функции, имеющие одни и те же значения на спектре должны иметь
одно и то же матричное значение f(A). Очевидно, что для определения f(A) в
общем случае, достаточно найти многочлен g(x), который бы принимал те же
значения на спектре А, что и функция f(A)=g(A).
Df. Если f(x) определена на спектре матрицы А, то f(A)=g(A), где g(A) – многочлен, принимающий на спектре те же значения, что и f(A), [pic]
Df. Значением функции от матрицы А назовем значение многочлена от этой матрицы при [pic].
Среди многочленов из С[x], принимающих одинаковые значения на спектре
матрицы А, что и f(x), степени не выше (m-1), принимающий одинаковые
значения на спектре А, что и f(x) – это остаток от деления любого
многочлена g(x), имеющего те же значения на спектре матрицы А, что и f(x),
на минимальный многочлен m(x)=g(x)=m(x)*g(x)+r(x).
Этот многочлен r(x) называют интерполяционным многочленом Лагранжа-
Сильвестра для функции f(x) на спектре матрицы А.
Замечание. Если минимальный многочлен m(x) матрицы А не имеет кратных
корней, т.е. [pic], то значение функции на спектре [pic].
Пример:
Найти r(x) для произвольной f(x), если матрица
[pic]. Построим f(H1). Найдем минимальный многочлен H1 – последний
инвариантный множитель [xE-H1]:
[pic], dn-1=x2; dn-1=1;
mx=fn(x)=dn(x)/dn-1(x)=xn( 0 – n –кратный корень m(x), т.е. n-кратные
собственные значения H1.
[pic], r(0)=f(0), r’(0)=f’(0),…,r(n-1)(0)=f(n-1)(0) ( [pic].
2. Свойства функций от матриц.
Свойство № 1. Если матрица [pic]имеет собственные значения [pic] (среди них могут быть и кратные), а [pic], то собственными значениями матрицы f(A) являются собственные значения многочлена f(x):
[pic].
Доказательство:
Пусть характеристический многочлен матрицы А имеет вид:
[pic], [pic], [pic]. Посчитаем [pic]. Перейдем от равенства к
определителям: [pic][pic]
Сделаем замену в равенстве:
[pic] (*)
Равенство (*) справедливо для любого множества f(x), поэтому заменим
многочлен f(x) на [pic], получим:
[pic].
Слева мы получили характеристический многочлен для матрицы f(A),
разложенный справа на линейные множители, откуда следует, что [pic] –
собственные значения матрицы f(A).
ЧТД.
Свойство № 2. Пусть матрица [pic]и [pic] – собственные значения матрицы А, f(x) – произвольная функция, определенная на спектре матрицы
А, тогда собственные значения матрицы f(A) равны [pic].
Доказательство:
Т.к. функция f(x) определена на спектре матрицы А, то существует
интерполяционный многочлен матрицы r(x) такой, что [pic], а тогда
f(A)=r(A), а у матрицы r(A) собственными значениями по свойству № 1 будут
[pic] которым соответственно равны [pic].
ЧТД.
Свойство № 3. Если А и В подобные матрицы, [pic], т.е. [pic], и f(x) – произвольная функция, определенная на спектре матрицы А, тогда [pic]
Доказательство:
Т.к. А и В подобны, то их характеристические многочлены одинаковы (
одинаковы и их собственные значения, поэтому значение f(x) на спектре
матрицы А совпадает со значение функции f(x) на спектре матрицы В, при чем
существует интерполяционный многочлен r(x) такой, что f(A)=r(A), [pic],
[pic] ( [pic].
ЧТД.
Свойство № 4. Если А – блочно-диагональная матрица [pic], то [pic]
Следствие: Если [pic], то [pic], где f(x) – функция, определенная на
спектре матрицы А.
4. Интерполяционный многочлен Лагранжа-Сильвестра.
Случай № 1.
Пусть дана [pic]. Рассмотрим первый случай: характеристический многочлен
[pic] имеет ровно n корней, среди которых нет кратных, т.е. все собственные
значения матрицы А различны, т.е. [pic], Sp A – простой. В этом случае
построим базисные многочлены lk(x):
[pic].
Пусть f(x) – функция, определенная на спектре матрицы А и значениями этой
функции на спектре будут [pic]. Надо построить [pic].
Построим:
[pic].
Обратим внимание, что [pic].
[pic][pic]
Пример: Построить интерполяционный многочлен Лагранжа-Сильвестра для
матрицы [pic].
[pic]Построим базисные многочлены:
[pic]
[pic]
[pic]
Тогда для функции f(x), определенной на спектре матрицы А, мы получим:
[pic].
Возьмем [pic], тогда интерполяционный многочлен
[pic].
Случай № 2.
Характеристический многочлен матрицы А имеет кратные корни, но минимальный
многочлен этой матрицы является делителем характеристического многочлена и
имеет только простые корни, т.е. [pic]. В этом случае интерполяционный
многочлен строится так же как и в предыдущем случае.
Случай № 3.
Рассмотрим общий случай. Пусть минимальный многочлен имеет вид:
[pic],
где m1+m2+…+ms=m, deg r(x)B, если [pic].
Вспомним матрицу перестановки [pic], т.е. матрицы перестановки обязательно
ортогональны. Произведение [pic] приводит к перестановке столбцов матрицы
А.
DF. При [pic] матрица [pic] называется приводимой матрицей, если существует
такая матрица перестановки Р, что [pic] совподает с матрицей [pic], где
А11, А12, А22 – квадратные матрицы меньшего чем n порядка. Если матрица Р
не существует, то матрица А называется неприводимой.
Понятие приводимости имеет значение при решении матричных уравнений [pic] ,
ибо если Ф – приводима, то осуществив замену переменных, которую
подсказывают равенства [pic], получаем
[pic], где [pic], [pic].
[pic] и решаем матричное уравнение с матрицей более низкого порядка. Затем,
[pic] и решаем матричное уравнение. Таким образом, если А – приводима, то
решение уравнения высокого порядка сводится к решению уравнений более
низкого порядка, при чем собственные значения матриц А11 и А22 в своей
совокупности составляет множество значений матрицы А.
Интересно, что явление приводимости не связано с величиной матрицы, а
зависит лишь от расположения нулевых элементов в матрице.
В связи с этим, используют идею направленного графа матрицы, которую можно
взять в качестве характеризации неприводимости матрицы. Наметим первые шаги
тоерии и получим вторую характеризацию неприводимости матриц.
DF. Пусть р1, р2, …, рn – n различных точек комплексной плоскости и [pic].
Для каждого нулевого элемента матрицы А [pic] составим направленную линию
от рi к рj [pic]. Получающаяся в результате фигура на комплексной
плоскости называется направленным графом матрицы.
Например:
[pic]

DF. Говорят, что любой направленный граф связен, если для каждой пары точек
[pic] существует направленный путь [pic].
Легко доказать, что квадратная матрица неприводима тогда и только тогда,
когда ее граф является связным.
8.Теорема Фробениуса-Перона.
Очевидно, что если [pic], то для [pic] [pic]. Более того, мы покажем, что
для достаточно больших p [pic].
Лемма № 1. Если матрица [pic] неотрицательна и неприводима, то [pic].
Доказательство:
Если взять произвольный вектор [pic] и [pic], то [pic]. И пусть вектор
[pic] имеет место, очевидно, что Z имеет по крайней мере столько же нулевых
положительных элементов, что и y. В самом деле, если предположить, что Z
имеет меньше нулевых компонент, то обозначим [pic], тогда [pic] и разбив
матрицу А на блоки следующим образом
[pic] мы будем иметь [pic].
Учитывая, что [pic], то [pic], тогда получаем, что [pic], что противоречит
неприводимости матрицы.
Для следующего вектора повторим рассуждения и т.д. В итоге получим, что для
некоторого ненулевого вектора y [pic].
ЧТД.
Для ненулевой неприводимой матрицы А рассмотрим действительную функцию
r(x), определенную для ненулевых векторов [pic] следующим образом: [pic],
(Ax)i – i-я координата вектора Ах.
[pic]. Из определения следует, что [pic] и кроме того, r(x) –такое
наименьшее значение [pic], что [pic].
Очевидно, что r(x) инвариантна относительна замены x на [pic], поэтому в
дальнейшем можно рассматривать замкнутое множество [pic], такое [pic].
Однако, r(x) может иметь разрывы в точках, где координата x обращается в 0,
поэтому рассмотрим множество векторов [pic] и обозначим [pic]. По лемме № 1
каждый вектор из N будет положительным, а поэтому [pic]т.е. [pic]для [pic].
Обозначим через [pic] наибольшее число, для которого [pic], [pic]. [pic] –
спектральный радиус матрицы А. Если [pic] Можно показать, что существует
вектор y, что [pic].
Замечание. Могут существовать и другие векторы в L для которых r(x)
принимает значение r, поэтому любой такой вектор называется экстремальным
для матрицы А (Az=rz).
Интерес к числу r объясняется следующим результатом.
Лемма № 2. Если матрица [pic] неотрицательна и неприводима, то число
[pic][pic] является собственным значением матрицы А, кроме того каждый
экстремальный вектор для А положителен и является правым собственным
вектором для А, отвечающим собственному значению r.
Основным результатом является теорема Фробениуса-Перона для непрерывных
матриц.
Теорема Фробениуса-Перона. Если матрица [pic] неотрицательна и неприводима,
то:
1. А имеет положительное собственное значение, равное спектральному радиусу матрицы А;
2. существует положительный правый собственный вектор, соответствующий собственному значению r.
3. собственное значение имеет алгебраическую кратность равную 1.
Эта теорема была опубликована в 1912 году Фробениусом и явилась обобщением
теоремы Перона, которая является следствием.
Теорме Перона (следствие). Положительная квадратная матрица А имеет
положительное и действительное собственное значение r, имеющее
алгебраическую кратность 1 и превосходит модули всех других собственных
значений матрицы А. Этому r соответствует положительный собственный вектор.
Используя теорему Фробениуса-Перона, можно найти максимальное
действительное значение матрицы, не используя характеристического
многочлена матрицы.
———————–
р1
р3
р2
[pic]