Предполагается знакомство с разделом ((:mapping:operator:jordan ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА)). ==Функция от матрицы== ~~TOC~~ В настоящем разделе матрица $ A_{} $ считается квадратной порядка $ n_{} $. ===Полином от матрицы == Сначала оптимизируем вычисление степени матрицы. !!П!! **Пример 1.** Вычислить $$ A^{100} \quad npu \quad A=\left( \begin{array}{rrrr} 1 &2 &1 &0 \\ 1 & 1 & 0 &-1 \\ -2& 0 & 1 & 2 \\ 0 & 2 & 1 & 1 \end{array} \right) \ . $$ **Решение.** Можно организовать вычисление $ A^{100} $ по алгоритму квадрирования-умножения, заимствованному из раздела ((:modular#вычисление_остатков_степенных_выражений "MОДУЛЯРНАЯ АРИФМЕТИКА")): $$ A^{100}=\left( \left( \left( \left( \left( \left( A \right)^2 A \right)^2 \right)^2 \right)^2 A\right)^2 \right)^2 \ . $$ Имеем: $ \underline{100}_{_{10}}=\underline{1100100}_{_2} $ $$ \begin{array}{|c|c|c|c|c|} \hline j & 1 & 2 & 3 & 4 \\ \hline {\mathfrak b}_j & 1 & 1 & 0 & 0 \\ \hline & A & A^2 A & \left(A^3 \right)^2 & \left(A^6 \right)^2 \\ & \left( \begin{array}{rrrr} 1 &2 &1 &0 \\ 1 & 1 & 0 &-1 \\ -2& 0 & 1 & 2 \\ 0 & 2 & 1 & 1 \end{array} \right) & \left( \begin{array}{rrrr} 1 &6 & 3 &0 \\ 3& 1 & 0 &-3 \\ -6& 0 & 1 & 6 \\ 0 & 6 & 3 & 1 \end{array} \right) & \left( \begin{array}{rrrr} 1 & 12 & 6 &0 \\ 6 & 1 & 0 &-6 \\ -12& 0 & 1 & 12 \\ 0 & 12 & 6 & 1 \end{array} \right) & \left( \begin{array}{rrrr} 1 & 24 & 12 &0 \\ 12 & 1 & 0 &-12 \\ -24& 0 & 1 & 24 \\ 0 & 24 & 12 & 1 \end{array} \right) \\ \hline \end{array} $$ $$ \begin{array}{|c|c|c|} \hline 5 &6 &7 \\ \hline 1 &0 & 0 \\ \hline \left(A^{12} \right)^2 A & \left(A^{25} \right)^2& \left(A^{50} \right)^2 \\ \left( \begin{array}{rrrr} 1 & 50 & 25 &0 \\ 25 & 1 & 0 &-25 \\ -50& 0 & 1 & 50 \\ 0 & 50 & 25 & 1 \end{array} \right) & \left( \begin{array}{rrrr} 1 & 100 & 50 &0 \\ 50 & 1 & 0 &-50 \\ -100& 0 & 1 & 100 \\ 0 & 100 & 50 & 1 \end{array} \right) & \left( \begin{array}{rrrr} 1 & 200 & 100 &0 \\ 100 & 1 & 0 &-100 \\ -200& 0 & 1 & 200 \\ 0 & 200 & 100 & 1 \end{array} \right) \\ \hline \end{array} $$ ♦ Рассмотрим далее произвольный полином $ g(x)=b_0x^m+b_1x^{m-1}+\dots+b_m \in \mathbb C[x] $. Вычисление его значения от матрицы $ A_{} $, т.е. $$ g(A)=b_0A^m +b_1A^{m-1}+\dots+b_m E \ , $$ где $ E_{} $ --- единичная матрица того же порядка, что и $ A_{} $, может быть произведено с помощью ((:polynomial#схема_хорнера схемы Хорнера)) --- чтобы сэкономить на операции умножения матриц. !!П!! **Пример 2.** Вычислить $ g(A)_{} $ для $$ g(x)= 3\,x^4-x^3+2\,x^2-4\,x-1 \quad u \quad A=\left( \begin{array}{rrr} 1 & -3 & 4 \\ 3& 1 &8 \\ -4 & -8 & 1 \end{array} \right) \ . $$ **Решение.** Схему Хорнера организуем по тому же принципу, что и для вычисления значения полинома в точке: $$ g(A)=(((3\,A-E)A+2\,E)A-4\,E)A-E \ . $$ $$ B_1 = 3A-E = \left( \begin{array}{rrr} 2 & -9 & 12 \\ 9& 2 & 24 \\ -12 & -24 & 2 \end{array} \right) ; \ $$ $$ B_2=B_1A+2E= \left( \begin{array}{rrr} -71 & -111 & -52 \\ -81& -215 & 76 \\ -92 & -4 & -236 \end{array} \right) ; \ $$ $$ B_3=B_2A-4E= \left( \begin{array}{rrr} -200 & 518 & -1224 \\ -1030& -584 & -1968 \\ 840 & 2160 & -640 \end{array} \right) ; \ $$ $$ g(A)=B_4=B_3A-E= \left( \begin{array}{rrr} 6249 & 10910 & 2120 \\ 5090& 18249 & -10760 \\ 9880 & 4760 & 19999 \end{array} \right) $$ ♦ ===Применение теоремы Гамильтона-Кэли== Дальнейшие упрощения возможны в случае, когда $ \deg g \ge n $, т.е. когда степень полинома становится больше или равной порядка матрицы. Предположим, что мы в состоянии вычислить ((:algebra2:charpoly характеристический полином)) матрицы $ A_{} $: $$ f(x)=\det (A-x E) \, . $$ !!Т!! **Теорема 1.**// Обозначим// $ g_1(x) $ //остаток от деления// $ g_{}(x) $ //на характеристический полином// $ f(x)=\det (A - x E) $. //Тогда// $$ g(A)= g_1(A) \ .$$ **Доказательство.** Действительно, указанное равенство последует из ((:algebra2:charpoly#теорема_гамильтона-кэли теоремы Гамильтона-Кэли)) при подстановке матрицы $ A_{} $ в формулу $$ g(x)\equiv f(x)q(x)+g_1(x) ,\ \deg g_1 < n $$ здесь $ q_{}(x) $ означает частное от деления $ g(x_{}) $ на $ f(x_{}) $. ♦ Эта теорема позволяет свести вычисление $ g({\mathbf A}) $ к случаю полинома степени меньшей порядка матрицы. Это соображение существенно упрощает поставленную задачу, но при этом возникает другая: как вычислить остаток от деления если делимое существенно превосходит делитель по степени? Посмотрим, как этот подход будет выглядеть для примера 1. !!П!! **Пример 3.** Вычислить $$ A^{100} \quad npu \quad A=\left( \begin{array}{rrrr} 1 &2 &1 &0 \\ 1 & 1 & 0 &-1 \\ -2& 0 & 1 & 2 \\ 0 & 2 & 1 & 1 \end{array} \right) \ . $$ **Решение.** Здесь $$\det (A- x E) = x^4-4\,x^3+6\, x^2 - 4\, x +1 \ . $$ Деление полинома $ g(x)\equiv x^{100} $ на характеристический полином, организованное традиционным способом (т.е. ((:polynomial#делимость_полиномов "в столбик")) ) дает в остатке полином $$ g_1(x)=161700\,x^3-480150\,x^2+475300\,x-156849 \ ; $$ при этом частное $ q_{}(x) $ является полиномом $ 96 $-й степени. Для вычислений обоих полиномов приходится использовать специализированный пакет компьютерной алгебры. Вычисление $ g_1(A) $ уже может быть произведено "вручную", например, с использованием схемы Хорнера. ♦ Заметим, что собственно частное от деления полинома $ g_{}(x) $ на характеристический полином не участвует в последующих вычислениях полинома от матрицы --- для этого нужны только коэффициенты остатка. Можно ли изобрести обходной способ вычисления остатка, который не требует промежуточного вычисления частного? --- Оказывается, можно. Предположим, что мы в состоянии найти корни характеристического полинома $ f(x)=\det (A-x E) $, т.е. собственные числа матрицы $ A_{} $. Предположим сначала, что все эти корни $ \lambda_1,\dots,\lambda_n $ различны. Подставим их в тождество для определения частного и остатка: $$ g(x)\equiv f(x)q(x)+g_1(x) \, . $$ Поскольку $ f(\lambda_j)=0 $ при $ j\in \{1,\dots,n\} $, получаем равенства $$ \{g(\lambda_j) = g_1(\lambda_j)\}_{j=1}^n \, . $$ Полином $ g_1(x) $ имеет степень меньшую $ n_{} $, а его значения совпадают со значениями полинома $ g(x) $ в $ n_{} $ точках. Такой полином определяется однозначно --- как ((:interpolation интерполяционный полином)), построенный по таблице значений $$ \begin{array}{c|ccccc} x & \lambda_1 & \lambda_2 & \dots & \lambda_n \\ \hline y & g(\lambda_1) & g(\lambda_2) &\dots & g(\lambda_n) \end{array} $$ Для его вычислений можно использовать любой из методов, изложенных в разделе ((:interpolation "ИНТЕРПОЛЯЦИЯ")). Предпочтение отдается ((:interpolation#интерполяционый_полином_в_форме_лагранжа методу Лагранжа)): $$ g_1(x) \equiv \sum_{k=1}^n \frac{g(\lambda_k)}{f_k(\lambda_k)}f_k(x) = \sum_{k=1}^n \frac{g(\lambda_k)}{f'(\lambda_k)}f_k(x) $$ где $ f_{k}(x) $ означает частное от деления характеристического полинома на его линейный множитель: $$ f_k(x)\equiv \frac{f(x)}{x-\lambda_k} \equiv (x-\lambda_1)\times \dots \times (x-\lambda_{k-1}) (x-\lambda_{k+1})\times \dots \times (x-\lambda_{n}) \, . $$ !!Т!! **Теорема 2.** //Если все собственные числа// $ \lambda_{1},\dots,\lambda_n $ //матрицы// $ A_{} $ //различны, то// $$ g(A)= \sum_{k=1}^n \frac{g(\lambda_k)}{f_k(\lambda_k)}f_k(A) = \sum_{k=1}^n \frac{g(\lambda_k)}{f'(\lambda_k)}f_k(A) $$ //где// $ f_k(x) $ //означает частное от деления// $ f_{}(x) $ //на// $ x- \lambda_k $. Каждое из суммируемых выражений в формуле можно представить в виде двух сомножителей: один из них зависит от полинома $ g_{}(x) $, а второй --- не зависит. Таким образом, при изменении полинома происходит лишь пересчет значений $ g(\lambda_1),\dots, g(\lambda_n) $, а их матричные сомножители не меняются. Структура этих последних уже была нами установлена в пункте ☞ ((:algebra2:charpoly#собственный_вектор СОБСТВЕННЫЙ ВЕКТОР)): каждая матрица $ f_k(A) $ --- ранга $ 1 $, т.е. имеет свои столбцы пропорциональными (и равными собственным векторам, принадлежащим $ \lambda_{k} $). !!П!! **Пример 4.** Выписать формулу $ g(A)_{} $ для произвольного $ g(x)\in \mathbb C[x] $ и $$ A=\left( \begin{array}{rrr} 9 & 22 & -6 \\ -1 &-4 & 1 \\ 8 & 16 & -5 \end{array} \right) \ . $$ **Решение.** $ \det (A-x E)=-(x-3) (x+2)(x+1) $. Пренебрегая знаком -- , имеем: $$ \begin{matrix} f_1(x)=x^2+3x+2 & u & f_1(A)= \left( \begin{array}{rrr} 40 & 80 & -20 \\ 0 &0 & 0 \\ 40 & 80 & -20 \end{array} \right) \ , f_1(3)=20 ; \\ f_2(x)=x^2-2x-3 & u & f_2(A)= \left( \begin{array}{rrr} -10 & -30 & 10 \\ 5 &15 & -5 \\ 0 & 0 & 0 \end{array} \right) \ , f_2(-2)=5 ; \\ f_3(x)=x^2-x-6 & u & f_3(A)= \left( \begin{array}{rrr} -4 & -8 & 4 \\ 4 & 8 & -4 \\ 8 & 16 & -8 \end{array} \right), f_3(-1)=-4 \ . \end{matrix} $$ $$ g(A)=g(3) \left( \begin{array}{rrr} 2 & 4 & -1 \\ 0 &0 & 0 \\ 2 & 4 & -1 \end{array} \right) + g(-2) \left( \begin{array}{rrr} -2 & -6 & 2 \\ 1 &3 & -1 \\ 0 & 0 & 0 \end{array} \right) + g(-1) \left( \begin{array}{rrr} 1 & 2 & -1 \\ -1 & -2 & 1 \\ -2 & -4 & 2 \end{array} \right) \ . $$ ♦ В случае, когда характеристический полином матрицы $ A_{} $ имеет кратные корни, для вычисления полинома $ g_1(x) $ из теоремы $ 1 $ приходится привлекать обобщение понятия классического интерполяционного полинома в виде ((:interpolation#интерполяционный_полином_эрмита интерполяционного полинома Эрмита)). Действительно, полином $ g_1(x) $ определялся в теореме $ 1 $ как остаток от деления $ g_{}(x) $ на характеристический полином $ f(x)=\det (A- xE) $: $$ g(x)\equiv f(x)q(x)+g_1(x) ; $$ При этом $ \deg g_1 < n $, и, следовательно, полином $ g_1(x) $ вполне определялся произвольным набором $ n_{} $ своих значений --- мы брали их равными $ g(\lambda_1),\dots,g(\lambda_n) $ в случае, когда все корни $ f_{}(x) $ были различными (простыми). Если же теперь среди корней имеются кратные и разложение характеристического полинома на линейные множители имеет вид $$ f(x)\equiv (-1)^n(x - \lambda_1)^{{\mathfrak m}_1} \times \dots \times (x - \lambda_{{\mathfrak r}})^{ {\mathfrak m}_{{\mathfrak r}}} \quad ; \quad {\mathfrak m}_1+\dots+{\mathfrak m}_{{\mathfrak r}}=n, \ \lambda_k \ne \lambda_{\ell} \ npu \ k \ne \ell, \exists {\mathfrak m}_j > 1, $$ то для нахождения полинома $ g_1(x) $ не хватает значений $ g(\lambda_1),\dots, g(\lambda_{{\mathfrak r}}) $. Для получения дополнительных условий, можно продифференцировать тождество $ g(x)\equiv f(x)q(x)+g_1(x) $ по $ x_{} $ и подставить в получившееся значения всех кратных корней полинома $ f_{}(x) $: $$ g^{\prime}(\lambda_j) = f^{\prime}(\lambda_j) q(\lambda_j)+f(\lambda_j) q^{\prime}(\lambda_j)+g_1(\lambda_j) \ . $$ Поскольку для любого кратного корня $ \lambda_{j} $ будет выполнено условие (см. ☞ ((:polynomial#производные_от_полинома ЗДЕСЬ)) ): $ f^{\prime}(\lambda_j)=0 $, то результатом подстановки будет равенство $ g^{\prime}(\lambda_j)=g_1^{\prime}(\lambda_j) $. Получаем дополнительные условия для определения полинома $ g_{1}(x) $. Итак, для нахождения полинома $ g_1(x) $ нам следует дополнительно к значениям $ g_{}(x) $ на всех корнях характеристического полинома (т.е. на собственных числах) матрицы $ A_{} $ вычислить еще и значения производной этой функции на всех кратных корнях. Может, однако, так случиться, что и этих дополнительных условий будет недостаточно для нахождения полинома $ g_1(x) $. Тогда следует продолжить процесс вычисления производных --- для тех значений $ \lambda_{j} $, кратность которых $ {\mathfrak m}_j $ больше $ 2_{} $. Окончательно, для определения полинома $ g_1(x) $ мы имеем значения полинома $ g(x) $ и его производных $$ \begin{matrix} g(\lambda_1),\dots, g^{({\mathfrak m}_{_1}-1)}(\lambda_1), \\ g(\lambda_2),\dots, g^{({\mathfrak m}_{_2}-1)}(\lambda_1), \\ \dots, \\ g(\lambda_{\mathfrak r}),\dots, g^{({\mathfrak m}_{_{\mathfrak r}}-1)}(\lambda_{\mathfrak r})\ ; \end{matrix} $$ при этом количество значений в каждой строке равно (алгебраической) кратности соответствующего собственного числа. По этим значениям полином степени меньшей $ n_{} $ восстанавливается однозначно. Заметим, что данный метод нечувствителен к геометрической кратности каждого из собственных чисел (т.е. к структуре жордановой нормальной формы матрицы $ A_{} $ вне ее главной диагонали); для его работы достаточно информации об алгебраической кратности. !!П!! **Пример 5**. Вычислить $ A^{100} $ для $$ A= \left( \begin{array}{rrrr} 1 &2 &1 &0 \\ 1 & 1 & 0 &-1 \\ -2& 0 & 1 & 2 \\ 0 & 2 & 1 & 1 \end{array} \right) \ ; \ A= \left( \begin{array}{rrrr} 1 &0 &0 &0 \\ 1 & 2 & 0 &1 \\ 2& 3 & 1 & 2 \\ -1 & -1 & 0 & 0 \end{array} \right) \ ; A= \left( \begin{array}{rrrr} 1 &1 & 2 &-1 \\ 1 & -1 & -4 &2 \\ 0& 1 & 3 & -1 \\ 0 & 0 & 1 & 1 \end{array} \right) \ . $$ **Решение.** У всех трех матриц одинаковый характеристический полином: $ \det (A- x E) = (x-1)^4 $. Остаток от деления $ x^{100} $ на $ (x-1)^4 $ совпадает с отрезком ряда Тейлора функции $ x^{100} $ при разложении ее по степеням $ x-1 $, т.е. с $$ \begin{matrix} g_1(x)&=&1+100\,(x-1)+\frac{100\cdot99}{2}(x-1)^2+\frac{100\cdot 99 \cdot 98}{6}(x-1)^3= \\ &= & -156849+475300\,x-480150\,x^2+161700\,x^3 \ . \end{matrix} $$ Для всех трех матриц формула вычисления $ A^{100} $ одна и та же: $$ A^{100} = -156849\, E+475300\,A-480150\,A^2+161700\,A^3 \ . $$ Несмотря на то обстоятельство, что жордановы нормальные формы у этих матриц различны. ♦ В приведенном способе нахождения остатка от деления полинома $ g(x) $ на характеристический полином матрицы $ A_{} $ имеется один нюанс, требующий пояснений. Предположим, что элементы матрицы $ A_{} $ целочислены: $ \{a_{jk} \in \mathbb Z\}_{j,k=1}^n $. Тогда и характеристический полином $ f(x)=\det (A-x E) $ является полиномом с целочисленными коэффициентами $ f(x) \in \mathbb Z[x] $. Поскольку старший коэффициент $ f_{}(x) $ равен $ 1_{} $ по абсолютной величине, то и остаток от деления $ g_{} (x) $ на $ f_{}(x) $ будет иметь только целые коэффициенты (см. ☞ ((:polynomial:remquo ЗДЕСЬ)) ): $ g_1(x) \in \mathbb Z[x] $. Между тем, вычисление этого полинома через посредство корней характеристического полинома, в общем случае, приводит к иррациональным выражениям: корни полинома, как правило, ((:polynomial:radical#разрешимость_в_радикалах не выражаются в радикалах)) через его коэффициенты. !!П!! **Пример 6.** Вычислить $ g(A) $ для $$ g(x)= x^{10}-6\,x^8+11\,x^7-x^3+4\,x^2- 1 $$ и $$ A= \left( \begin{array}{rrrrr} 6 &1 &5 &2 & -1 \\ -5 & -1 & -4 & -2 & 1 \\ -5 & -1 & -5 & -1 & 1 \\ -5 & -1 & -5 & -2 & 2 \\ -5 & 0 & -7 & -2 & 2 \end{array} \right) \, . $$ **Решение.** Характеристический полином $ f(x)= \det (A-x E)=-(x^5-4\,x-2) $ имеет корни, ((:polynomial:radical#разрешимость_в_радикалах не выражающиеся в радикалах)). Попробуем применить теорему 2 для приближенных значений корней: $$ \lambda_1 \approx -1.243596,\ \lambda_2 \approx -0.508499,\ \lambda_3 \approx 1.518512,\ \lambda_{4,5} \approx 0.116792 \pm {\mathbf i}\, 1.438448,\, . $$ Для нахождения частных от деления $ f_{}(x) $ на линейные множители $ (x-\lambda_j) $ воспользуемся следующим приемом. Частное от деления произвольного полинома $$ f(x)=a_0x^5+a_1x^4+a_2x^3+a_3x^2+a_4x+a_5 $$ на линейный полином $ x - \lambda $ находится по формуле $$ q(x,\lambda)=a_0x^4+(a_0\lambda + a_1)x^3+(a_0\lambda^2+a_1\lambda+a_2)x^2+(a_0\lambda^3+a_1\lambda^2+a_2\lambda+a_3)x+ $$ $$ +(a_0\lambda^4+a_1\lambda^3+a_2\lambda^2+a_3 \lambda+a_4) \, , $$ которая является развернутым вариантом ((:polynomial#схема_хорнера схемы Хорнера)). Подставляя сюда значения коэффициентов характеристического полинома $ f_{}(x) $ и приближенные значения его корней, получаем приближения полиномов $ f_j(x) $: $$ \begin{array}{ccl} f_1(x) &\approx & -x^4+1.243596\,x^3-1.546532\,x^2+1.923266\,x+1.608239 \, , \\ f_2(x) & \approx &-x^4+0.508499\,x^3-0.258572\,x^2+0.131483\,x+3.933141\, , \\ f_3(x) & \approx & \dots \\ f_{4,5}(x) & \approx & -x^4+(-0.116792\mp 1.438448\, \mathbf i)\,x^3+(2.055491\mp 0.335998\, \mathbf i)\,x^2+ \dots \end{array} $$ Вычисляем значения этих полиномов на матрице $ A_{} $: $$ f_1(A) \approx \left( \begin{array}{rrrrr} 1.844873 & 0.503518 & 3.247794 & -1.280266 & 0.201656 \\ 0.383692& 0.104720 & 0.675468 & -0.266266 & 0.041940 \\ -4.616308& -1.259922 & -8.126748 & 3.203527 &-0.504592 \\ 1.601674 & 0.437142 & 2.819656 &-1.111496 & 0.175073 \\ -6.130986 & -1.673321 & -10.793252 & 4.254651 & -0.670156 \end{array} \right) $$ $$ f_2(A) \approx \left( \begin{array}{rrrrr} -6.028030 & -5.334374 & -3.876435 & 0.470253 & 0.893870 \\ 9.342582 & 8.267515 & 6.007919& -0.728825 & -1.385371\\ 4.342582 & 3.842873 & 2.792577 & -0.338769 & -0.643943\\ 6.885079 & 6.092801 & 4.427577 & -0.537112 & -1.020959\\ 5.592221 & 4.948714 & 3.596180 &-0.436255 & -0.829246 \end{array} \right) $$ $$ f_3(A) \approx \dots $$ $$ f_{4,5}(A) \approx \left( \begin{array}{rrr} -4.833170\pm 17.111687 \, \mathbf i & -10.621186 \pm 0.712576 \, \mathbf i & \dots \\ 6.383099 \mp 14.587375 \, \mathbf i & 9.509036 \pm 0.668706 \, \mathbf i & \dots \\ 1.383099 \mp 14.587376 \, \mathbf i & 8.504395\mp 2.151023 \, \mathbf i & \dots \\ 0.799140 \mp 21.779614 \, \mathbf i & 12.443094\mp 3.925469 \, \mathbf i & \dots \\ 11.076597 \mp 23.459604 \, \mathbf i & 15.455549\pm 1.532904 \, \mathbf i & \dots \end{array} \right) \, . $$ Несмотря на кажущуюся хаотичность формирования элементов этих матриц, столбцы каждой из них пропорциональны (впрочем, равно как и строки). Составляем матрицу из теоремы $ 2 $: $$ \sum_{k=1}^5 \frac{g(\lambda_k)}{f_k(\lambda_k)}f_k(A) = \sum_{k=1}^5 \frac{g(\lambda_k)}{f_k(\lambda_k)} q(A,\lambda_k) \approx $$ $$ \approx \left( \begin{array}{rrrrr} -94.999999 & -173.999999 & -237.999999 & 143.999999 & 198.999999 \\ 159.999999 & 149.999999& 301.999999&-101.999999&-191.999999\\ 39.999999&156.999999&79.999999&-127.999999&-125.999999\\ 194.999999 &277.999999&229.999999&-239.999999&-140.999999\\ 404.999999&273.999999&435.999999&-67.999999&-278.999999 \end{array} \right) $$ (при уменьшении точности вычислений возможно появление ненулевых мнимых частей). Полученный ответ можно интерпретировать как приближение истинного, а именно, целочисленного: $$ \left( \begin{array}{rrrrr} -95&-174&-238&144&199\\ 160&150&302&-102&-192\\ 40&157&80&-128&-126\\ 195&278&230&-240&-141\\ 405&274&436&-68&-279 \end{array} \right) \, . $$ Возникает вопрос: можно ли было получить этот ответ, не прибегая к численным методам (и использованию мнимых чисел)? Где именно "заложена" принципиальная целочисленность ответа? Для ответа посмотрим на выражение $$ \sum_{k=1}^5 \frac{g(\lambda_k)}{f_k(\lambda_k)}f_k(A) = \sum_{k=1}^5 \frac{g(\lambda_k)}{f_k(\lambda_k)}f_k(A) = $$ $$ \sum_{k=1}^5 \frac{g(\lambda_k)}{f_k(\lambda_k)} \left(a_0A^4+(a_0\lambda_k + a_1)A^3 + (a_0\lambda_k^2+a_1\lambda_k+a_2)A^2 \dots \right)= $$ $$ = \left(a_0\sum_{k=1}^5 \frac{g(\lambda_k)}{f_k(\lambda_k)} \right)A^4 + \left( a_0 \sum_{k=1}^5 \frac{g(\lambda_k)\lambda_k}{f_k(\lambda_k)}+a_1 \sum_{k=1}^5 \frac{g(\lambda_k)}{f_k(\lambda_k)} \right) A^3+ \dots \, , $$ здесь $ a_0=(-1)^n,a_1, a_2,\dots $ обозначают коэффициенты полинома $ f_{}(x) $. Выражения в круглых скобках представляют собой симметрические рациональные функции от корней этого полинома. Согласно ((:polynomial#симметрические_функции_корней теореме Гаусса)), эти функции допускают представление в виде рациональных функций от коэффициентов $ a_0,a_1, a_2,\dots $ (а, на самом деле, ((:algebra2:vander#обобщенная_матрица_вандермонда полиномов)) от этих коэффициентов). Так что ответ в задаче действительно должен быть целочисленным. Другое дело, что для его практического поиска мы привлекли численные методы поскольку явное представление симметрических рациональных функций через коэффициенты полинома --- задача весьма сложная. ♦ ===Анализ с помощью жордановой нормальной формы== Все применения **ЖНФ** основаны на формулах ((:mapping:operator#матрица_оператора подобия)) матрицы и ее **ЖНФ**: $$C^{-1}{\mathbf A}C ={\mathbf A}_{_{\mathfrak J}} \quad \iff \quad {\mathbf A}= C{\mathbf A}_{_{\mathfrak J}}C^{-1} \ . $$ Оказывается, что любая мыслимая операция над матрицей $ {\mathbf A} $ может быть сведена к этой же операции над формой Жордана: $$g({\mathbf A})= Cg({\mathbf A}_{_{\mathfrak J}})C^{-1} \ .$$ В самом деле, имеем, например: $$ {\mathbf A}^2 =(C{\mathbf A}_{_{\mathfrak J}}C^{-1})^2=C{\mathbf A}_{_{\mathfrak J}}C^{-1}C{\mathbf A}_{_{\mathfrak J}}C^{-1}=C{\mathbf A}_{_{\mathfrak J}}^2C^{-1} \ . $$ По индукции можно показать справедливость равенства $$ {\mathbf A}^N=C{\mathbf A}_{_{\mathfrak J}}^NC^{-1} \quad npu \quad \forall N \in \mathbb N \ . $$ Далее, справедливость равенства $ {\mathbf A}^0=E=C{\mathbf A}_{_{\mathfrak J}}^0C^{-1} $ очевидна. Но тогда можно доказать и справедливость равенства $$ g({\mathbf A}) = Cg({\mathbf A}_{_{\mathfrak J}})C^{-1} $$ для любого ((:polynomial полинома)) $ g(x)=b_0x^m+\dots+b_m \in \mathbb C[x] $. Отсюда --- прямая дорога к аналитическим функциям от матрицы... Этот переход обсудим ((#аналитическая_функция_от_матрицы НИЖЕ)), а пока остановимся и проведем анализ структуры полинома от **ЖНФ**. Мы будем рассматривать матрицы и их **ЖНФ** над полем $ \mathbb C_{} $. Пусть характеристический полином матрицы $ \mathbf A_{} $ имеет следующее разложение на линейные множители над полем $ \mathbb C_{} $: $$ f(\lambda)= \det (\mathbf A - \lambda E) \equiv (-1)^n(\lambda - \lambda_1)^{{\mathfrak m}_1} \times \dots \times (\lambda - \lambda_{{\mathfrak r}})^{ {\mathfrak m}_{{\mathfrak r}}} \quad ; \quad {\mathfrak m}_1+\dots+{\mathfrak m}_{{\mathfrak r}}=n, \ \lambda_k \ne \lambda_{\ell} \ npu \ k \ne \ell. $$ **ЖНФ** матрицы $ \mathbf A_{} $ имеет вид блочно-диагональной матрицы $$ {\mathbf A}_{_{\mathfrak J}}=\left( \begin{array}{cccc} \mathbf A_1 & \mathbb O & \dots & \mathbb O \\ \mathbb O & \mathbf A_2 & \dots & \mathbb O \\ \vdots & & \ddots & \vdots\\ \mathbb O & \mathbb O & \dots & \mathbf A_{{\mathfrak r}} \end{array} \right) \quad , \quad \mbox{ здесь } \ \mathbf A_j - \mbox{ матрица порядка }\ {\mathfrak m}_j\times {\mathfrak m}_j \ . $$ В свою очередь, каждая из составляющих матриц $ \mathbf A_j $ имеет снова блочно-диагональный вид $$ \mathbf A_j= \left( \begin{array}{cccc} {\mathbf A}_{j1} & \mathbb O & \dots & \mathbb O \\ \mathbb O & {\mathbf A}_{j2} & \dots & \mathbb O \\ \vdots & & \ddots & \vdots\\ \mathbb O & \mathbb O & \dots & {\mathbf A}_{j \ell_j} \end{array} \right) $$ где на диагонали стоят клетки Жордана, т.е. матрицы вида $$ {\mathfrak J}_k (\lambda_j) = \left( \begin{array}{cccccc} \lambda_j & & & & & \\ 1 & \lambda_j & & & & \\ 0 & 1 & \lambda_j & & \mathbb O & \\ \vdots & & \ddots & \ddots& & \\ 0 & 0 & 0 & \dots & \lambda_j & \\ 0 & 0 & 0 & \dots & 1 & \lambda_j \end{array} \right)_{k \times k} \ . $$ Теперь наша задача --- свести вычисление произвольного полинома от $ {\mathbf A}_{_{\mathfrak J}} $ к вычислению этого же полинома от клеток Жордана: $ g({\mathbf A}_{_{\mathfrak J}}) $ --- к $ g({\mathfrak J}_k (\lambda_j)) $. ===Структура степенной функции== !!Т!! **Теорема 3.** //Если матрица// $ {\mathbf D} $ ---// блочно-диагональная, то и// $ {\mathbf D}^N $ --- //блочно-диагональная//: $$ \left( \begin{array}{cccc} {\mathbf D}_1 & \mathbb O & \dots & \mathbb O \\ \mathbb O & {\mathbf D}_2 & \dots & \mathbb O \\ \vdots & & \ddots & \vdots \\ \mathbb O & \mathbb O & \dots & {\mathbf D}_r \end{array} \right)^N= \left( \begin{array}{cccc} {\mathbf D}_1^N & \mathbb O & \dots & \mathbb O \\ \mathbb O & {\mathbf D}_2^N & \dots & \mathbb O \\ & & \ddots & \\ \mathbb O & \mathbb O & \dots & {\mathbf D}_r^N \end{array} \right) \ . $$ //Здесь// $ {\mathbf D}_1, \dots, {\mathbf D}_r $ --- //квадратные матрицы//[[Не обязательно одинаковых порядков.]]. !!Т!! **Теорема 4.** //Если матрица// $ L_{} $ --- //((:algebra2#треугольная нижнетреугольная)), то и// $ L^N $ --- //нижнетреугольная//. Теоремы $ 3 $ и $ 4 $ сводят вычисление степени матрицы $ {\mathbf A} $ к вычислению степени ее клеток Жордана $ {\mathfrak J}_k (\lambda_j) $. !!Т!! **Теорема 5.** //Имеет место равенство:// $$ \left( \begin{array}{rrrrrr} \lambda & & & & & \\ 1 & \lambda & &\mathbb O & & \\ 0& 1 & \lambda & & & \\ \vdots & & \ddots & \ddots & & \\ 0 & 0 & \dots & 1 & \lambda & \\ 0 & 0 & \dots & 0 & 1 &\lambda \end{array} \right)_{k\times k}^N= $$ $$ = \left( \begin{array}{ccrlcc} \lambda^N & & & & & \\ C_N^1 \lambda^{N-1} & \lambda^N & &\mathbb O & & \\ C_N^2 \lambda^{N-2} & C_N^1 \lambda^{N-1} & \lambda^N & & & \\ \dots & & \ddots & \ \ \ddots & & \\ C_N^{k-2} \lambda^{N-k} & \dots & & C_N^1 \lambda^{N-1} &\lambda^N & \\ C_N^{k-1} \lambda^{N-k+1} & \dots & & C_N^2 \lambda^{N-2} & C_N^1 \lambda^{N-1} &\lambda^N \end{array} \right) $$ (//считаем здесь элементы с отрицательными показателями// $ \lambda $ //равными нулю//). //Более корректная запись матрицы в правой части возможна с помощью матрицы// $$H_j = \begin{array}{rl} \begin{array}{c} {\scriptstyle 0 \to} \\ {\scriptstyle 1 \to} \\ \vdots \\ {\scriptstyle j \to} \\ \vdots \\ {\scriptstyle k-1 \to} \end{array} \left(\begin{array}{llllll} 0 & & & & &\\ 0 & & & \mathbb O & &\\ \vdots & & & & &\\ 1 & & & & \\ \vdots & \ddots & & &\\ 0 & & 1 & \dots & 0 & 0 \end{array} \right) \end{array} =\left[ \begin{array}{ll} \mathbb O_{j\times (k-j)} & \mathbb O_{j\times j} \\ E_{(k-j) \times (k-j)} & \mathbb O_{(k-j)\times j} \end{array} \right]_{k\times k} $$ (//единицами заполнена// $ j_{} $-//я диагональ, считая от нулевой --- главной//): $$ \left[{\mathfrak J}_k (\lambda) \right]^N = $$ $$ =\lambda^N E + C_N^1 \lambda^{N-1} H_1 + C_N^2 \lambda^{N-2} H_2 + \dots +\left\{ \begin{array}{ccc} C_N^N H_N & npu & N ♦ ====Решение линейного разностного уравнения== !!§!! Настоящий пункт тесно связан с разделом ((:recurr#линейное_уравнение ЛИНЕЙНОЕ РАЗНОСТНОЕ УРАВНЕНИЕ)). Пусть рекуррентная последовательность задается уравнением $$ x_{n+K}=a_1 x_{n+K-1}+ \dots+ a_n x_K $$ и начальными данными $ x_0,x_1,\dots,x_{n-1} $. Введем в рассмотрение столбцы, состоящие из $ n_{} $ последовательных элементов этой последовательности, обозначив $$ X_0=\left( \begin{array}{l} x_0 \\ x_1 \\ \vdots \\ x_{n-1} \end{array} \right),\ X_1=\left( \begin{array}{l} x_1 \\ x_2 \\ \vdots \\ x_{n} \end{array} \right),\ X_2=\left( \begin{array}{l} x_2 \\ x_3 \\ \vdots \\ x_{n+1} \end{array} \right),\ \dots, X_K=\left( \begin{array}{l} x_K \\ x_{K+1} \\ \vdots \\ x_{K+n-1} \end{array} \right),\dots ; $$ а также следующую матрицу, известную как **матрица Фробениуса**: $$ {\mathfrak F}= \left( \begin{array}{lllllll} 0 & 1 & 0 & 0 & \dots & 0 & 0 \\ 0 & 0 & 1 & 0 & \dots & 0 & 0 \\ 0 & 0 & 0 & 1 & \dots & 0 & 0 \\ \vdots& &&&\ddots & & \vdots \\ 0 & 0 & 0 & 0 & \dots & 0 & 1 \\ a_n & a_{n-1} & a_{n-2} & & \dots & a_2 & a_1 \end{array} \right)_{n \times n} \ . $$ Используя правило ((:algebra2#умножение_матриц умножения матриц)), а также соотношение между элементами последовательности, получаем: $$ X_1={\mathfrak F}X_0,\ X_2={\mathfrak F}X_1,\dots, X_K={\mathfrak F}X_{K-1},\dots, $$ откуда имеем: $$ X_K={\mathfrak F}^KX_0 \quad npu \quad K\in \mathbb N \ . $$ Искомое выражение для $ x_{K} $ получится умножением первой строки матрицы $ {\mathfrak F}^K $ на столбец начальных данных $ X_{0} $. Таким образом, задача решения разностного уравнения сводится к задаче возведения в степень матрицы $ {\mathfrak F} $. Для нахождения $ {\mathfrak F}^{K} $ воспользуемся результатами предыдущего ((:algebra2:funmatrix#структура_степенной_функции пункта)). Найдя жорданову нормальную форму (**ЖНФ**) $ {\mathfrak F}_{\mathfrak J} $ и соответствующую матрицу преобразования базиса $ C_{} $, получим $$ {\mathfrak F}_{\mathfrak J} =C^{-1} \mathfrak F C \Longrightarrow {\mathfrak F}^{K}=C {\mathfrak F}_{_{\mathfrak J}}^{K} C^{-1} \, . $$ ((:algebra2:charpoly#характеристический_полином Характеристический полином матрицы Фробениуса)): $$\det ({\mathfrak F}- \lambda E)= (-1)^n(\lambda^n-a_1 \lambda^{n-1}-\dots-a_n) \ . $$ с точностью до знака совпадает с характеристическим полиномом последовательности. Обозначим его корни $ \lambda_1,\dots,\lambda_n $. Если они различны, то жорданова нормальная форма $ {\mathfrak F}_{_{\mathfrak J}} $ ((:mapping:operator#диагонализуемость_матрицы_оператора диагональна)). Если же среди этих корней имеются кратные, то установление структуры **ЖНФ** потребует усилий; однако же можно заранее утверждать, что эта форма диагональной не будет. !!Т!! **Теорема 6.** //Если все корни характеристического полинома различны, то решение разностного уравнения получается в виде// $$ x_{K}= C_1\lambda_1^K + \dots+ C_n \lambda_n^K \ , $$ //числа// $ C_{1},\dots,C_n $ //не зависят от// $ K_{} $ //и определяются с помощью начальных условий из системы линейных уравнений//: $$ \left\{\begin{array}{rrrrcl} C_1 &+C_2 &+\dots &+ C_n &=& x_0 \\ \lambda_1 C_1 &+ \lambda_2C_2&+\dots & + \lambda_n C_n & = & x_1 \\ \lambda_1^2 C_1 &+ \lambda_2^2C_2&+\dots & + \lambda_n^2 C_n & = & x_2 \\ \dots &&&&& \dots \\ \lambda_1^{n-1}C_1 &+ \lambda_2^{n-1}C_2&+\dots & + \lambda_n^{n-1} C_n & = & x_{n-1}. \end{array} \right. $$ **Доказательство** теоремы и ее обобщение на случай наличия кратных корней характеристического полинома ☞ ((:recurr:vspom2 ЗДЕСЬ)). ====Асимптотика степенной функции== **Задача.** Выяснить как себя ведет $ A^N $ при $ N\to +\infty $. Пример предыдущего пункта показывает, что существуют матрицы $ A_{} $, для которых некоторые элементы $ A^N $ неограниченно возрастают при $ N\to +\infty $. !!Т!! **Теорема 7.** //Если все собственные числа матрицы// $ A_{} $ //меньше// $ 1 $ //по абсолютной величине, т.е.// $ \{|\lambda_j|<1\}_{j=1}^n $, то $$ \lim_{N\to +\infty} A^N = \mathbb O_{n\times n} \, . $$ //Если существует хотя бы одно собственное число// $ \lambda_j $ //такое, что// $ |\lambda_j|>1 $, //то существует хотя бы один элемент матрицы// $ A^N $ //неограниченно возрастающий при// $ N\to +\infty $. Условия теоремы можно переформулировать в виде соответствующих неравенств на ((:algebra2:charpoly#собственное_число спектральный радиус)) матрицы. Проверка этих условий возможна без непосредственного вычисления собственных чисел матрицы $ A_{} $. Достаточно построить характеристический полином матрицы и применить к нему критерий ((:polynomial/zero_local#корни_в_области_z_1 Шура-Кона)). Cлучай существования единичного по модулю собственного числа матрицы $ A $ кажется исключительным, //маловероятным//. Вероятность попадания случайно брошенной комплексной точки на окружность $ |z|=1 $ равна $ 0 $. Однако реальный мир играет вероятностями --- см. ☞ ((:markov_chain ЦЕПИ МАРКОВА)). ===Вычисление полинома от матрицы== Теперь проведем анализ структуры матрицы $ g( A) $ с помощью жордановой нормальной формы. Способ вычисления матричной степени распространяется и на полином от матрицы: $$g({ A})= Cg({ A}_{_{\mathfrak J}})C^{-1}$$ и аналоги теорем $ 3 $ и $ 4 $ сводят вычисление $ g(A) $ к вычислению $ g(x_{}) $ от клеток Жордана. Поскольку $$g\left( {\mathfrak J}_k (\lambda) \right)= b_0\left[{\mathfrak J}_k (\lambda)\right]^m+b_1\left[{\mathfrak J}_k (\lambda)\right]^{m-1}+\dots+b_mE_{m\times m} $$ то на основании теоремы $ 5 $ получаем следующий результат !!Т!! **Теорема 8.** //Имеет место равенство// $$ g\left(\left[ \begin{array}{rrrrr} \lambda & & & & \\ 1 & \lambda & & \mathbb O & \\ 0& 1 & \lambda & & \\ \vdots & & \ddots & \ddots & \\ 0 & 0 & \dots & 1 &\lambda \end{array} \right]_{k\times k}\right)= \left[ \begin{array}{ccccc} g(\lambda) & & & & \\ g'(\lambda) & g(\lambda) & & \mathbb O & \\ \frac{g''(\lambda)}{2!}& g'(\lambda) & g(\lambda) & & \\ \vdots & & \ddots & \ddots & \\ \frac{g^{(k-1)}(\lambda)}{(k-1)!} & \frac{g^{(k-2)}(\lambda)}{(k-2)!} & \dots & g'(\lambda) & g(\lambda) \end{array} \right]= $$ $$ =g(\lambda)E+ g'(\lambda) H_1 + \frac{g''(\lambda)}{2!}H_2+\dots+ \frac{g^{(k-1)}(\lambda)}{(k-1)!} H_{k-1} \, . $$ !!?!! Можно ли утверждать, что геометрическая кратность собственного числа $ g(\lambda_j) $ матрицы $ g(A) $ совпадает с геометрической кратностью собственного числа $ \lambda_j $ матрицы $ A $ (т.е. что порядки соответствующих клеток Жордана одинаковы)? ===Аналитическая функция от матрицы== ====Норма матрицы. Матричный ряд== Нормой произвольной (не обязательно квадратной) матрицы $ A \in \mathbb C^{m\times n} $ называется неотрицательное число $ \| A \| $, удовлетворяющее условиям (аксиомам): 1. $ \| A \|=0 $ тогда и только тогда, когда $ A=\mathbb O_{m\times n} $; 2. для $ \forall \alpha\in \mathbb C $ справедливо $ \| \alpha A \|=|\alpha |\cdot \| A \| $; 3. для любых матриц $ A, B $ из $ \mathbb C^{m\times n} $ справедливо $ \| A + B \| \le \| A \|+\| B \| $; Три эти аксиомы являются универсальными аксиомами нормы в произвольном линейном векторном пространстве. Для матриц можно ввести дополнительную операцию --- операцию умножения. В этом случае норму подчиняют еще одной аксиоме. 4. для любых матриц $ A_{} $ и $ B_{} $, допускающих умножение $ A \cdot B $, справедливо $ \| A \cdot B \| \le \| A \| \cdot \| B \| $. Здесь следует отметить, что матрицы $ A, B $ и $ A\cdot B $ принадлежат, вообще говоря, __разным__ линейным пространствам. В каждом из этих пространств норма может быть задана по различным формулам. Более подробное изложение материала с особенностями введения нормы в произвольном линейном векторном пространстве ☞ ((:norm_space#норма_матрицы ЗДЕСЬ)). В настоящем и последующем пунктах мы ограничимся только рассмотрением норм векторов и норм квадратных матриц. Норму можно вводить разными способами. !!П!! **Пример.** Для матриц с комплексными элементами **евклидова норма** (или **норма Фробениуса**) вводится формулой: $$\| A \| = \sqrt{\sum_{j,k} |a_{jk}|^2} \ ;$$ эту формулу для матриц с вещественными элементами можно переписать в виде $$ \| A \| = \sqrt{ \operatorname{Sp}_{}\, (A \cdot A^{^{\top}})} \, . $$ Выполнение для нее аксиом 1 и 2 очевидно. Справедливость 3 следует из неравенства треугольника: $ |a_{jk}+b_{jk}|^2\le |a_{jk}|^2 +|b_{jk}|^2 $, а 4 следует из ((:algebra2:dets#теорема_бине_-_коши неравенства Коши-Буняковского)): $$|a_{j1}b_{1k}+\dots+ a_{jn}b_{nk}|^2 \le \left(|a_{j1}|^2+\dots+|a_{jn}|^2 \right) \left(|a_{1k}|^2+\dots+|a_{nk}|^2 \right) \, .$$ Эту норму можно рассматривать как обобщение понятия длины вектора в $ \mathbb R^{n} $: $ \| X_{n\times 1} \| = \sqrt{ x_1^2+\dots+x_n^2}=|X| $. Вообще, любая формула, задающая ((:euclid_space#определения скалярное произведение)) в евклидовом пространстве матриц, порождает и норму матрицы: $ \| A \|= \sqrt{\langle A,A \rangle} $. Только что введенная норма соответствует ((:algebra2:dets#теорема_бине_-_коши стандартному скалярному произведению)). !!Т!! **Теорема 9.** //Евклидова норма вещественной матрицы не меняется при умножении этой матрицы на произвольную ((:algebra2:ort_matrix#ортогональная_матрица ортогональную)).// **Доказательство** ☞ ((:norm_space#норма_матрицы ЗДЕСЬ)). !!П!! **Пример.** $ \displaystyle \| A \| = \max_j \sum_k |a_{jk}| $. Тогда $ \| X_{n\times 1} \| =\displaystyle{ \max_{j=1,\dots,n} |x_j|} $. !!П!! **Пример.** $ \displaystyle \| A \| = \max_k \sum_j |a_{jk}| $. Тогда $ \| X_{n\times 1} \| =\displaystyle{ \sum_{j=1}^n |x_j|} $. Введение понятия нормы позволяет упростить рассуждения о сходимости матричной последовательности $ \{ A_N \}_{N=1}^{\infty} $. В предыдущих пунктах эта сходимость понималась в смысле существования пределов у последовательностей элементов $ a_{jk}^{(N)} $ одновременно для всех индексов $ j_{} $ и $ k_{} $. Норма позволяет объединить исследование этих последовательностей на сходимость в изучение одной. !!Т!! **Теорема 10.** //Последовательность// $ \{ A_N \}_{N=1}^{\infty} $ //сходится при// $ N \to \infty $ //к матрице// $ A_{} $ //тогда и только тогда, когда// $$\lim_{N\to \infty} \| A_N - A \|=0 \, .$$ Матричный ряд $$ \sum_{j=1}^{\infty} A_j = A_1 + \dots + A_N+ \dots $$ называется **сходящимся** если существует __конечный__ предел последовательности $$\left\{ S_N = \sum_{j=1}^{N} A_j= A_1 + \dots + A_N \right\}_{N=1}^{\infty}$$ его частичных сумм. Тогда величина этого предела называется **суммой матричного ряда**: $$ S= \sum_{j=1}^{\infty} A_j = \lim_{N\to \infty} S_N \, .$$ Матричный ряд называется **расходящимся** если хотя бы для одной пары индексов $ j_{} $ и $ k_{} $ последовательность $ s_{jk}^{(N)} $ расходится. Матричный ряд называется **абсолютно сходящимся** если сходится числовой ряд его норм: $ \displaystyle \sum_{j=1}^{\infty} \| A_j \| $. !!Т!! **Теорема 11.** //Если матричный ряд сходится абсолютно, то он сходится и в обычном смысле.// !!Т!! **Теорема 12 [признак сравнения].** //Если ряд// $ \displaystyle \sum_{j=1}^{\infty} A_j $ //абсолютно сходится и// $ \| A_j \|\ge \| B_j \| $ //для// $ \forall j\in \mathbb N $, //то и ряд// $ \displaystyle \sum_{j=1}^{\infty} B_j $ //сходится абсолютно.// ====Матричный степенной ряд== Рассмотрим теперь степенной ряд $$ \sum_{j=0}^{\infty}b_j z^j=b_0+b_1z+b_2z^2+\dots $$ переменную в котором предполагаем комплексной: $ z \in \mathbb C $. Пусть $ R $ --- радиус сходимости этого ряда, т.е. ряд сходится при $ |z|R $. Известно, что $$R=\overline{\lim_{n\to \infty}}\left| \frac{b_n}{b_{n+1}} \right|= \overline{\lim_{n\to \infty}} \frac{1}{\sqrt[n]{|b_{n}|}} \, .$$ Рассмотрим теперь соответствующий **матричный степенной ряд** $$ \sum_{j=0}^{\infty} b_j Z^j =b_0E+b_1 Z +b_2 Z^2+\dots $$ при $ Z \in \mathbb C^{n\times n} $. !!Т!! **Теорема 13.** //Матричный степенной ряд сходится абсолютно для любой матрицы// $ Z $ //такой, что// $ \| Z\|!! Если ряд $ \sum_{j=0}^{\infty}b_j z^j $ сходится при $ \forall z \in \mathbb C $, то и ряд $ \sum_{j=0}^{\infty}b_j Z^j $ сходится при любой матрице $ Z\in \mathbb C^{n \times n} $. Сумма сходящегося степенного ряда $ \sum_{j=0}^{\infty}b_j Z^j $ будет функцией переменной матрицы $ Z $. Такая функция называется **аналитической функцией матрицы**. Если обозначить сумму ряда $ \sum_{j=0}^{\infty}Z^j $ через $ F(Z) $, то легко проверяется свойство: $ F(Z)(E-Z)=E $. Таким образом, ряд сходится к матрице $ (E-Z)^{-1} $ при $ \|Z \|<1 $. !!Т!! **Теорема 14.** //Если матрицы// $ A $ и $ B $ //((:mapping:operator#матрица_оператора подобны)), а// $ F $ --- //аналитическая функция, определенная для// $ A $, //то тогда она будет определена и для// $ B $, //и матрицы// $ F(A) $ и $ F(B) $ //также подобны:// $$ A \doteq B \quad \Rightarrow \quad F(A) \doteq F(B) \, . $$ **Доказательство.** По условию $ B=C^{-1} AC $ при некоторой неособенной матрице $ C\in \mathbb C^{n\times n} $. Рассмотрим $ N $-ю частичную сумму ряда: $$ F_N(Z)= \sum_{j=0}^{N} a_j Z^j\, . $$ В ☝ ((#анализ_с_помощью_жордановой_нормальной_формы ПУНКТЕ)) было доказано, что $$F_N(B)=C^{-1}F_N(A) C \, .$$ Переходя к пределу, получаем $$\lim_{N \rightarrow \infty} F_N(B)= C^{-1}\left( \lim_{N \rightarrow \infty} F_N(A) \right) C =C^{-1}F(A)C \, .$$ Таким образом, функция $ F $ определена и для $ B $ и $ F(B)=C^{-1}F(A)C $. ♦ !!Т!! **Теорема 15.** //Ряд// $ \sum_{j=0}^{\infty} b_j Z^j $ //сходится для любой матрицы// $ A $ //чей спектр лежит внутри круга сходимости:// $$ \{|\lambda_j|R \, . $$ **Доказательство** ☞ ((:algebra2:funmatrix:vspom1 ЗДЕСЬ)). !!=>!! Если $ \{|\lambda_j| ☞ ((:algebra2:funmatrix:vspom2 ЗДЕСЬ)). !!=>!! Для любой матрицы $ A $ матрица $ e^{A} $ обратима и $ \left( e^{A} \right)^{-1}=e^{-A} $ . Особое прикладное значение имеет матрица $$ e^{tA}= \sum_{j=0}^{\infty} \frac{t^j}{j!} A^j \, , $$ зависящая от параметра $ t\in \mathbb C $. Если продифференцировать ряд по этому параметру, то на основании теоремы ?? получим: $$ \frac{ d\, e^{t A}}{ d\, t}=\sum_{j=1}^{\infty} \frac{jt^{j-1}}{j!}A^j=A \sum_{j=1}^{\infty} \frac{t^{j-1}}{(j-1)!}A^{j-1}=Ae^{tA} \, . $$ Таким образом, $ e^{t A} $ является решением матричного дифференциального уравнения[[А также и матричного уравнения $ d\, X / d\, t= X A $.]] $$ \frac{ d\, X}{ d\, t}= A X \, . $$ Обычно это уравнение рассматривают не относительно квадратной матрицы $ X $, а относительно вектора-столбца $ X_{n\times 1} $, т.е. последнее уравнение представляет матричную запись системы обыкновенных дифференциальных уравнений: $$ \left\{ \begin{array}{cccccc} d\, x_1/d\, t &=&a_{11}x_1+&a_{12}x_2+&\dots+&a_{1n}x_n \, , \\ d\, x_2/d\, t &=&a_{21}x_1+&a_{22}x_2+&\dots+&a_{2n}x_n \, ,\\ \dots & & & &\dots & \\ d\, x_n/d\, t &=&a_{n1}x_1+&a_{n2}x_2+&\dots+&a_{nn}x_n \, . \end{array} \right. $$ При задании **начальных условий** $$ x_1(t_0)=x_{10},x_2(t_0)=x_{20},\dots , x_n(t_0)=x_{n0} \quad \iff \quad X(t_0)=X_0 $$ решение уравнения $ d\, X \big/ d\, t= A X $ представляет естественное обобщение одномерного (скалярного) случая: $$ X(t)=e^{(t-t_0)A}X_0 \, . $$ В пункте ?? указаны два способа вычисления аналитической функции матрицы. Применим их для нахождения $ e^{t A} $. $$ e^{t A}=Ce^{t A_{\mathfrak J}}C^{-1} $$ и вычисление $ e^{t\, x} $ от клетки Жордана производится по формуле $$ \exp \left( t \cdot \left[ \begin{array}{rrrrr} \lambda & & & & \\ 1 & \lambda & &\mathbb O & \\ 0& 1 & \lambda & & \\ \vdots & & \ddots & \ddots & \\ 0 & 0 & \dots & 1 &\lambda \end{array} \right]_{k\times k}\right)= \left[ \begin{array}{ccccc} e^{\lambda t} & & & & \\ te^{\lambda t} & e^{\lambda t} & &\mathbb O & \\ \frac{t^2}{2!}e^{\lambda t}& te^{\lambda t} & e^{\lambda t} & & \\ \vdots & & \ddots & \ddots & \\ \frac{t^{k-1}}{(k-1)!}e^{\lambda t} & \frac{t^{k-2}}{(k-2)!}e^{\lambda t} & \dots & te^{\lambda t} & e^{\lambda t} \end{array} \right]= $$ $$ =e^{\lambda t} \left( E+ t H_1 + \frac{t^2}{2!}H_2+\dots+ \frac{t^{k-1}}{(k-1)!} H_{k-1} \right) \, . $$ Матрицы $ \{H_j\} $ определяются в ☝ ((#структура_степенной_функции ПУНКТЕ)). !!?!! Доказать справедливость равенства: $ \det( e^A ) = e^{\operatorname{Sp} (A )} $. !!П!! **Пример.** Для системы дифференциальных уравнений $$ \left\{ \begin{array}{ccccc} d\, x_1 / d\, t &=&&x_2&+x_3, \\ d\, x_2 / d\, t &=&x_1&+x_2&-x_3, \\ d\, x_3 / d\, t &=&&x_2&+x_3 \end{array} \right. $$ **а)** найти решение при $ x_1(0)=1,x_2(0)=1,x_3(0)=1 $; **б)** найти все начальные условия $$ x_1(0)=x_{10},x_2(0)=x_{20},x_3(0)=x_{30}\, , $$ для которых решения будут ограниченными при $ t\to +\infty $. **Решение.** Здесь $ t_0=0 $, $ \det (A - \lambda E) = - \lambda (\lambda -1)^2 $. $$ A= \underbrace{ \left( \begin{array}{rrr} 2& -1& 1 \\ -1& 1 & 0\\ 1 & -1 & 1 \end{array} \right)}_{C} \underbrace{ \left( \begin{array}{rrr} 0& 0& 0 \\ 0& 1 & 0\\ 0 & 1 & 1 \end{array} \right) }_{{\bf A}_{\mathfrak J}} \underbrace{ \left( \begin{array}{rrr} 1& 0& -1 \\ 1 & 1 & -1 \\ 0 & 1 & 1 \end{array} \right) }_{C^{-1}} $$ $$ e^{t A}= \left( \begin{array}{rrr} 2& -1& 1 \\ -1& 1 & 0\\ 1 & -1 & 1 \end{array} \right) \left( \begin{array}{rrr} 1& 0& 0 \\ 0& e^{t} & 0\\ 0 & te^{t} & e^{t} \end{array} \right) \left( \begin{array}{rrr} 1& 0& -1 \\ 1 & 1 & -1 \\ 0 & 1 & 1 \end{array} \right)= $$ $$ =\left( \begin{array}{rrr} 2-e^{t}+te^t & t\, e^t & -2+ 2\, e^t-t\, e^t \\ -1 +e^t & e^t & 1-e^t \\ 1 -e^t+t\, e^t& t\, e^t & -1+2\, e^t-t\, e^t \end{array} \right) \, . $$ Домножая эту матрицу справа на столбец $ [1,1,1]^{^{\top}} $, получаем $$x_1(t)=e^t(1+t),\, x_2(t)=e^t,\, x_3(t)=e^t(1+t) \, . $$ Для решения **б)** домножим последнюю матрицу справа на столбец $ [x_{10},x_{20},x_{30}]^{^{\top}} $. Получившийся столбец можно представить в виде линейной комбинации трех: $$ \left( \begin{array}{c} 2x_{10}-2x_{30} \\ -x_{10}+x_{30} \\ x_{10} - x_{30} \end{array} \right) +e^t \left( \begin{array}{c} -x_{10}+2\,x_{30} \\ x_{10}+x_{20}-x_{30} \\ -x_{10} +2\, x_{30} \end{array} \right) +t\, e^t \left( \begin{array}{c} x_{10}+x_{20}-x_{30} \\ 0 \\ x_{10}+x_{20}-x_{30} \end{array} \right) $$ Решение может быть ограниченным лишь при условии, когда столбцы при $ e^t $ и $ t\, e^t $ будут нулевыми. Решаем получившуюся систему линейных однородных уравнений относительно $ x_{10},x_{20} $ и $ x_{30} $, получаем, что при любом $ x_{30} $ решение, проходящее через точку $ [2\, x_{30},-x_{30},x_{30}]^{^{\top}} $ будет ограниченным; более того, оно будет //стационарным//, т.е. не покинет этой точки при изменении $ t $. ♦ !!П!! **Пример.** Найти решение системы дифференциальных уравнений $$ \left\{ \begin{array}{ccrrrr} d\, x_1 / d\, t &=&-9\,x_1&+12\,x_2&-7\,x_3 &-7\, x_4, \\ d\, x_2 / d\, t &=&-25\,x_1&+35\,x_2&-20\,x_3&-22\, x_4 , \\ d\, x_3 / d\, t &=&-16\,x_1&+24\,x_2&-14\,x_3&-15\, x_4, \\ d\, x_4 / d\, t &=&-17\,x_1&+22\,x_2&-12\,x_3&-14\, x_4, \end{array} \right. $$ при $ x_1(0)=1,x_2(0)=0,x_3(0)=1,x_4(0)=0 $. **Решение.** Имеем: $$ f(\lambda)=\det (A-\lambda E) = \lambda^4+2\lambda^3+6\lambda^2+2\lambda+5 \, .$$ Спектр матрицы $ \{ -1 \pm 2 \mathbf i, \ \pm \mathbf i \} $ состоит из мнимых чисел. Для вычисления $ e^{At} $ можно воспользоваться теоремой 17. Вычисления частных при делении $ f(\lambda) $ на линейные полиномы $ \lambda- \lambda_{\ast} $ и $ \lambda- \overline{\lambda_{\ast}} $ упрощаются соображениями комплексной сопряженности: $$ f_1(\lambda)\equiv \frac{f(\lambda)}{\lambda-(-1+2 \mathbf i))}\equiv \lambda^3+(1+2 \mathbf i)\lambda^2+\lambda+(1+2 \mathbf i), $$ $$ f_2(\lambda)\equiv \frac{f(\lambda)}{\lambda-(-1-2 \mathbf i))}\equiv \overline{f_1(\lambda)} \equiv \lambda^3+(1-2 \mathbf i)\lambda^2+\lambda+(1-2 \mathbf i), $$ $$ f_3(\lambda)\equiv \frac{f(\lambda)}{\lambda-\mathbf i}\equiv \lambda^3+(2+\mathbf i)\lambda^2+(5+2\mathbf i)\lambda+5 \mathbf i \, , $$ $$ f_4(\lambda)\equiv \frac{f(\lambda)}{\lambda+\mathbf i}\equiv \overline{f_3(\lambda)} \equiv \lambda^3+(2-\mathbf i)\lambda^2+(5-2\mathbf i)\lambda-5 \mathbf i \, . $$ Аналогичное упрощение возникает и при вычислениях полиномов от матрицы, т.е. $ \{f_j(A)\} $: $$ f_1(A)= \left( \begin{array}{rrrr} 32+26 \mathbf i & -40-20 \mathbf i & 20+10 \mathbf i & 28+4 \mathbf i \\ 73+88 \mathbf i & -98-76 \mathbf i & 49+38 \mathbf i & 74+26 \mathbf i\\ 54+46 \mathbf i & -68-36 \mathbf i & 34+18 \mathbf i & 48+8 \mathbf i\\ 42+66 \mathbf i & -60-60 \mathbf i & 30+30 \mathbf i & 48+24 \mathbf i \end{array} \right)\, , f_2(A)=\overline{f_1(A)} , $$ $$ f_3(A)= \left( \begin{array}{rrrr} 7-\mathbf i & -2+14 \mathbf i & -3-9 \mathbf i & 2-12 \mathbf i\\ 17-6 \mathbf i &2+36 \mathbf i &-12-21 \mathbf i & -1-31 \mathbf i \\ 13-9 \mathbf i & 10+30 \mathbf i & -15-15 \mathbf i & -8-26 \mathbf i \\ 7-\mathbf i &-2+14 \mathbf i & -3-9 \mathbf i & 2-12 \mathbf i \end{array} \right)\, , f_4(A)=\overline{f_3(A)} . $$ Формулы решения системы дифференциальных уравнений по формуле $$ \left(\sum_{j=1}^4 e^{\lambda_j t} \frac{f_j(A)}{f_j(\lambda_j)}\right) \left( \begin{array}{c} 1 \\ 0 \\ 1 \\ 0 \end{array} \right) \, . $$ приводим к вещественному виду с использованием ((:complex_num#экспоненциальное_представление_комплексного_числа формулы Эйлера)) представления экспонент от мнимых чисел: $$ e^{\lambda_j t} = e^{t \mathfrak{R}\mathbf{e} (\lambda_j) } \left\{\cos ( t \mathfrak{I}\mathbf{m}(\lambda_j)) + \mathbf i \sin ( t \mathfrak{I}\mathbf{m}(\lambda_j)) \right\} \, . $$ **Ответ.** $$ x_1(t)=\frac{1}{5}( 17 e^{-t} \cos (2t)-31 e^{-t} \sin (2t) -2 \cos t - \sin t )\, , $$ $$ x_2(t)=\frac{1}{10}( 59 e^{-t} \cos (2t)-187 e^{-t} \sin (2t) -59 \cos t - 17\sin t )\, , $$ $$ x_3(t)=\frac{1}{5}( 28 e^{-t} \cos (2t)-54 e^{-t} \sin (2t) -23 \cos t - 14\sin t )\, , $$ $$ x_4(t)=\frac{1}{10}( 12 e^{-t} \cos (2t)-66 e^{-t} \sin (2t) -12 \cos t - \sin t )\, . $$ ---- Если при любых начальных условиях решение уравнения $$ \frac{ d\, X}{ d\, t}= A X \, . $$ ограничено при $ t \to +\infty $, то будем называть это уравнение **устойчивым по Ляпунову**. Устойчивое уравнение называется **асимптотически устойчивым по Ляпунову** если все решения стремятся к $ \mathbb O_{n\times 1} $ при $ t \to +\infty $. Уравнение называется **неустойчивым по Ляпунову**, если существует хотя бы один набор начальных условий, для которого соответствующее решение $ X(t) $ неограничено при $ t \to +\infty $. В дальнейшем будем говорить просто об устойчивости, имея в виду устойчивость по Ляпунову. Представление решения уравнения формулой $$ X(t)=e^{(t-t_0)A}X_0 $$ позволяет свести исследование устойчивость этого уравнения к анализу спектра матрицы $ A $, либо же --- в случае наличия кратных собственных чисел матрицы --- к ((#анализ_с_помощью_жордановой_нормальной_формы анализу ее жордановой нормальной формы)) $ A_{\mathfrak J} $. !!Т!! **Теорема 20.** //Уравнение// $ d\, X \big/ d\, t= A X $ **а)** //устойчиво тогда и только тогда, когда// $$ \mathfrak{R}\mathbf{e} (\lambda_j) \le 0 \quad npu \ j \in \{1,\dots,n\} \, ,$$ //и клетки Жордана в ЖНФ// $ A_{\mathfrak J} $, //соответствующие собственным числам с// $ \mathfrak{R}\mathbf{e} (\lambda_j) = 0 $, //имеют порядок// $ 1 $; **б)** //асимптотически устойчиво тогда и только тогда, когда// $$ \mathfrak{R}\mathbf{e} (\lambda_j) < 0 \quad npu \ j \in \{1,\dots,n\} $$ (//т.е. спектр матрицы// $ A $ //лежит в левой полуплоскости комплексной плоскости//). Конструктивная проверка последнего условия возможна чисто алгебраическими методами. Действительно, это условие означает устойчивость характеристического полинома $ f(\lambda)=\det (A-\lambda E) $ и может быть проверено с помощью критериев ((:dets:resultant#поиск_мнимого_корня_полинома Рауса)) или ((dets:resultant#устойчивость_полинома Льенара-Шипара)) за конечное число элементарных операций над коэффициентами. !!=>!! Уравнение $ d\, X \big/ d\, t= A X $ с симметричной матрицей $ A $ **а)** устойчиво тогда и только тогда, когда матрица ((:2form#знакоопределенность отрицательно полуопределена)); **б)** асимптотически устойчиво тогда и только тогда, когда матрица ((:2form#знакоопределенность отрицательно определена)). Возникает сильное желание обобщить предлагаемый подход на систему уравнений $$ \frac{ d\, X}{ d\, t}= A(t) X $$ с матрицей, зависящей от $ t $. Например, в случае, когда $ A(t) $ является ((:algebra2#полином_от_матрицы_и_матричный_полином матричным полиномом)) $$ A(t)=A_0t^K+A_1t^{K-1} + \dots + A_K \quad npu \ \{A_0,A_1,\dots,A_K\} \subset \mathbb R^{n\times n} $$ соблазнительно записать решение в виде $$ X(t)=e^{\int_{t_0}^t A(\tau) d \tau} X_0 $$ при $$ \int_{t_0}^t A(\tau) d \tau= A_0 \frac{(t^{K+1}-t_0^{K+1})}{(K+1)!}+A_1 \frac{(t^{K}-t_0^{K})}{K!} + \dots + A_K (t-t_0) \, . $$ К сожалению, в общем случае, этот подход не сработает. Причины этого объясняются ☞ ((:algebra2:funmatrix:matricant ЗДЕСЬ)). ====Матричные синус и косинус== Решение дифференциального уравнения второго порядка, описывающего, например, закон Гука $$\frac{ d\,^2 x}{ d\, t^2}= a\, x \ , \ \{ x,a,t\} \subset \mathbb R, \ x(t_0)=x_0, \frac{ d\, x(t)}{ d\, t}\Bigg|_{t=t_0}= x_0^{\prime} $$ представимо в виде $$ x(t)=\left\{ \begin{array}{ccc} \displaystyle \frac{\sqrt{a}x_0+x_0^{\prime}}{2\sqrt{a}} e^{\sqrt{a}(t-t_0)} + \frac{x_0-x_0^{\prime}}{2\sqrt{a}} e^{-\sqrt{a}(t-t_0)} & npu & a>0, \\ \displaystyle x_0 \cos \left( \sqrt{|a|}(t-t_0) \right) + \frac{x_0^{\prime}}{\sqrt{|a|}} \sin \left( \sqrt{|a|}(t-t_0) \right) & npu & a<0, \\ x_0+x_0^{\prime}(t-t_0) & npu & a=0 \, . \end{array} \right. $$ По аналогии поставим задачу поиска решения для системы уравнений $$ \frac{ d^2 X}{ d\, t^2}=AX $$ при матрице $ A \in \mathbb R^{n\times n} $. Желательно найти такие матричные аналоги для используемых операций, чтобы формулы для решения сохранили тот же вид. Аналогами тригонометрических функций являются **матричные синус** и **косинус**: $$ \sin Z = \sum_{j=1}^{\infty} (-1)^{j-1}\frac{Z^{2j-1}}{(2j-1)!}= Z- \frac{Z^3}{3!}+\frac{Z^5}{5!}-\dots $$ $$ \cos Z = \sum_{j=0}^{\infty} (-1)^{j}\frac{Z^{2j}}{(2j)!}= E- \frac{Z^2}{2!}+\frac{Z^4}{4!}-\dots $$ На основании следствия к теореме $ 13 $ оба ряда сходятся при любой матрице $ Z \in \mathbb C^{n\times n} $. !!П!! **Пример.** Вычислить $ \cos $ и $ \sin $ от матрицы $$ A=\left( \begin{array}{rr} 0 & 1 \\ -1 & 0 \end{array} \right) \, . $$ **Решение** проведем двумя способами. Сначала следуем формальному определению. $$ A^2= \left( \begin{array}{rr} -1 & 0 \\ 0 & -1 \end{array} \right),\ A^3= \left( \begin{array}{rr} 0 & -1 \\ 1 & 0 \end{array} \right), \ A^4= \left( \begin{array}{rr} 1 & 0 \\ 0 & 1 \end{array} \right), \ A^5= \left( \begin{array}{rr} 0 & 1 \\ -1 & 0 \end{array} \right) = A, $$ $$ A^6= \left( \begin{array}{rr} -1 & 0 \\ 0 & -1 \end{array} \right)=A^2,\dots $$ Очевидна цикличность получающейся матричной последовательности. $$ \cos A= \left( \begin{array}{rr} 1 & 0 \\ 0 & 1 \end{array} \right)-\frac{1}{2} \left( \begin{array}{rr} -1 & 0 \\ 0 & -1 \end{array} \right) + \frac{1}{4!} \left( \begin{array}{rr} 1 & 0 \\ 0 & 1 \end{array} \right) - \dots = $$ $$ = \left( \begin{array}{cc} 1+1/2+1/4!+\dots & 0 \\ 0 & 1+1/2+1/4!+\dots \end{array} \right) = \left( \begin{array}{cc} (e+e^{-1})/2 & 0 \\ 0 & (e+e^{-1})/2 \end{array} \right) \, . $$ Аналогично: $$ \sin A= \left( \begin{array}{cc} 0 & (e-e^{-1})/2 \\ -(e-e^{-1})/2 & 0 \end{array} \right) \, . $$ А теперь проверим с помощью интерполяционного представления. Вычислим характеристический полином: $$ \det (A-\lambda E) = \lambda^2 +1 \equiv (\lambda- \mathbf i)(\lambda+ \mathbf i) \, . $$ Тогда $$ \cos A = \frac{\cos \mathbf i}{2\mathbf i} (A+\mathbf i E) + \frac{\cos (-\mathbf i)}{-2\mathbf i} (A-\mathbf i E)=E \cos \mathbf i \, . $$ Хотя и трудно поверить, но можно формально проверить справедливость равенства $$ \cos \mathbf i = \frac{e+e^{-1}}{2} \, . $$ То есть косинус //чисто мнимого// числа равен числу вещественному (да еще и большему $ 1 $)! Но это действительно следует из формального определения косинуса как суммы степенного ряда. ♦ !!Т!! **Теорема 21.** //Справедливо основное тригонометрическое тождество// $$ \cos^2 Z + \sin^2 Z \equiv E_{n\times n} \, . $$ ====Квадратный корень из матрицы== Сложности возникают при определении $ \sqrt{ A} $. Формально, **корнем квадратным из матрицы** $ {\mathbf A} $ называется решение матричного уравнения $$ X^2=A $$ Уже для матриц второго порядка это уравнение не всегда разрешимо: например, не существует решения при $$A = \left( \begin{array}{cc} 0 & 0 \\ 1 & 0 \end{array} \right) \ . $$ С другой стороны, при $$A = \left( \begin{array}{rr} -1 & 0 \\ 0 & -1 \end{array} \right) $$ существует бесконечное множество решений $$ X= \left( \begin{array}{cc} \alpha & -(\alpha^2+1)/\beta \\ \beta & -\alpha \end{array} \right) \ , $$ задаваемое двумя параметрами $ \alpha $ и $ \beta \ne 0 $. !!Т!! **Теорема 22.** //Решение уравнения// $$ X^2=A $$ **а)** //всегда существует при// $ \det A \ne 0 $; **б)** //всегда существует среди вещественных симметричных матриц, если// $ A $ --- //симметричная и ((:2form#знакоопределенность положительно полуопределенная))//. **Доказательство** проведем только для **б)**. Симметричная матрица $ A $ приводится к ((:algebra2:symmetric:vspom1 диагональному виду с помощью ортогональной матрицы)): $$ P^{^{\top}}{\mathbf A}P= \left( \begin{array}{cccc} \lambda_1 & & & \mathbb O \\ & \lambda_2 & & \\ && \ddots & \\ \mathbb O && & \lambda_n \end{array} \right) \quad npu \quad P^{^{\top}}=P^{-1} \ . $$ Легко видеть, что матрица $$ X= P \left( \begin{array}{cccc} \sqrt{\lambda_1} & & & \mathbb O \\ & \sqrt{\lambda_2} & & \\ && \ddots & \\ \mathbb O&& & \sqrt{\lambda_n} \end{array} \right)P^{^{\top}} $$ является решением уравнения $ X^2=A $. Здесь под $ \sqrt {.} $ понимается произвольное значение квадратного корня. Это значение будет вещественным при $ \lambda_j\ge 0 $. Если матрица $ A $ положительно полуопределена, то все $ \lambda_j $ неотрицательны. Таким образом, последняя формула определяет вещественное решение; матрица $ X $ будет симметричной и может быть выбрана положительно полуопределенной. ♦ !!П!! **Пример.** Вычислить $$\sqrt{ \left( \begin{array}{rrr} 24 & 6 & -12 \\ 6 &33 & 6\\ -12 & 6 & 24 \end{array} \right) } \ . $$ **Решение.** $ \det (A - \lambda E) = - (\lambda-9) (\lambda -36)^2 $. Поскольку матрица $ A $ симметрична, то привести ее к диагональному виду можно с помощью ортогональной матрицы $ C $. Мы, однако же, используем общий ((:mapping:operator#диагонализуемость_матрицы_оператора алгоритм диагонализации)) чтобы получить возможно большее число ответов: $$ {\mathbf A}= \underbrace{ \left( \begin{array}{rrr} 1& 0& 2 \\ 2& 2 & -1\\ 0 & 1 & 2 \end{array} \right)}_{C} \underbrace{ \left( \begin{array}{rrr} 36& 0& 0 \\ 0& 36 & 0\\ 0 & 0 & 9 \end{array} \right) }_{{\mathbf A}_{\mathfrak J}} \underbrace{ \left( \begin{array}{rrr} 5/9& 2/9& -4/9 \\ -4/9 & 2/9 & 5/9 \\ 2/9 & -1/9 & 2/9 \end{array} \right)}_{C^{-1}} $$ $$ \sqrt{{\mathbf A}}= \underbrace{ \left( \begin{array}{rrr} 1& 0& 2 \\ 2& 2 & -1\\ 0 & 1 & 2 \end{array} \right)}_{C} \underbrace{ \left( \begin{array}{rrr} \pm 6& 0& 0 \\ 0& \pm 6 & 0\\ 0 & 0 & \pm 3 \end{array} \right) }_{\sqrt{{\mathbf A}_{\mathfrak J}}} \underbrace{ \left( \begin{array}{rrr} 5/9& 2/9& -4/9 \\ -4/9 & 2/9 & 5/9 \\ 2/9 & -1/9 & 2/9 \end{array} \right) }_{C^{-1}} $$ **Ответ.** $ \sqrt{A}= $ $$ \pm\underbrace{ \frac{1}{3}\left( \begin{array}{rrr} 14& 2& -4 \\ 2 & 17 & 2 \\ -4 & 2 & 14 \end{array} \right)}_{+++\ \sqrt{A_{\mathfrak J}}} \ ; \ \pm\underbrace{ \frac{1}{3}\left( \begin{array}{rrr} 14& 2& -4 \\ 34 & 1 & -38 \\ 12 & -6 & -6 \end{array} \right)}_{+-+\ \sqrt{A_{\mathfrak J}}} \ ; \ \pm\underbrace{ \left( \begin{array}{rrr} -2& -2& 4 \\ -2 & -5 & -2 \\ 4 & -2 & -2 \end{array} \right)}_{--+\ \sqrt{A_{\mathfrak J}}} \ ; \ $$ $$ \pm\underbrace{ \frac{1}{3}\left( \begin{array}{rrr} 6& 6& -12 \\ 38 & -1 & -34 \\ 4 & -2 & -14 \end{array} \right)}_{+-- \ \sqrt{A_{\mathfrak J}}} \ . $$ !!Т!! **Теорема 23.** //Если// $ A $ ---//симметричная матрица такая, что// * //она положительно определена//; * //матрица// $ E-A $ //положительно определена//; //то рекуррентная матричная последовательность// $$ X_0=\mathbb O, \ \left\{ X_{j}=X_{j-1}+\frac{1}{2}(A-X_{j-1}^2) \right\}_{j=1}^{\infty} $$ //сходится к положительно определенному квадратному корню из// $ A $. Условия на матрицу $ A $ эквивалентны тому, что ее спектр целиком лежит в интервале $ [0,1] $ (следствие ☞ ((:algebra2:symmetric#lokalizacija_sobstvennyx_chisel теоремы Коши)) ). !!П!! **Пример.** Для $$ A=\left(\begin{array}{rrr} 0.541667 & 0.205342 & -0.372008 \\ 0.205342 & 0.811004 & 0.166667 \\ -0.372008 & 0.166667 & 0.522329 \end{array} \right) $$ имеем (все матрицы --- симметричные) $$ X_0=\mathbb O_{3\times 3}, X_1=\left(\begin{array}{rrr} 0.2708335 & 0.102671 & -0.186004\\ \ast & 0.405502 & 0.083333\\ \ast & \ast & 0.261164 \end{array} \right), \dots, $$ $$ X_{12}=\left(\begin{array}{rrr} 0.640657 & 0.167720& -0.315098\\ \ast & 0.871895 & 0.147379\\ \ast & \ast & 0.630487 \end{array} \right) $$ и $$ X_{12}^2-A \approx \left(\begin{array}{rrr} -0.004 & 0.0019 & -0.0038\\ \ast & -0.0009& 0.0019\\ \ast & \ast & -0.0038 \end{array} \right) \, . $$ ==Задачи== ☞ ((:algebra2:funmatrix:problems ЗДЕСЬ)) ==Источники== **Демидович Б.П.** //Лекции по математической теории устойчивости.// М.: Изд-во МГУ: ЧеРо, 1998