Задача. Найти базис пространства $ \mathbb V_{} $, в котором матрица линейного оператора $ \mathcal A_{} $ имеет наиболее простой вид.
В настоящем пункте пространство $ \mathbb V_{} $ размерности $ \dim \mathbb V_{} = n $ предполагается комплексным.
В пункте ДИАГОНАЛИЗУЕМОСТЬ МАТРИЦЫ ОПЕРАТОРА было установлено, что если возможно найти базис пространства $ \mathbb V_{} $, состоящий из собственных векторов оператора, то в этом базисе матрица оператора будет диагональной. В частности, существование такого базиса всегда гарантировано в случае, когда характеристический полином оператора $ \mathcal A_{} $ имеет только простые корни: в этом случае система из собственных векторов оператора, принадлежащих различным собственным числам, гарантировано линейно независима. Случай наличия кратных корней $$ f(\lambda)= \det (\mathcal A - \lambda \mathcal E) \equiv (-1)^n(\lambda - \lambda_1)^{{\mathfrak m}_1} \times \dots \times (\lambda - \lambda_{{\mathfrak r}})^{ {\mathfrak m}_{{\mathfrak r}}} \quad ; $$ $$ {\mathfrak m}_1+\dots+{\mathfrak m}_{{\mathfrak r}}=n, \ \lambda_k \ne \lambda_{\ell} \ npu \ k \ne \ell, $$ при хотя бы одном $ {\mathfrak m}_j>1 $ оказывается «пограничным»: оператор может оказаться как диагонализуемым, так и недиагонализуемым.
Стратегия действий: пространство $ \mathbb V_{} $ удается разбить в прямую сумму подпространств $$ \mathbb V_{} =\mathbb V_1 \oplus \dots \oplus \mathbb V_{\mathfrak r}\ , \quad \dim \mathbb V_j={\mathfrak m}_j $$ инвариантных относительно $ \mathcal A_{} $: $ \mathcal A(\mathbb V_j) \subset \mathbb V_j $. При этом $ \mathbb V_j $ обязательно будет включать собственные векторы, принадлежащие $ \lambda_{j} $, но, помимо них — в случае когда алгебраическая кратность собственного числа превосходит его геометрическую кратность: $$ {\mathfrak m}_j > \ell_j = \operatorname{dfc} (\mathcal A - \lambda_j {\mathcal E}) $$ — и другие: так называемые, корневые. На основании теоремы из ☞ ПУНКТА в базисе $ \mathbb V_{} $, составленном объединением базисов $ \mathbb V_j $, матрица оператора будет иметь блочно-диагональный вид $$ \left( \begin{array}{cccc} \mathbf A_1 & \mathbb O & \dots & \mathbb O \\ \mathbb O & \mathbf A_2 & \dots & \mathbb O \\ & & \ddots & \\ \mathbb O & \mathbb O & \dots & \mathbf A_{{\mathfrak r}} \end{array} \right) \quad , \quad \mbox{ здесь } \ \mathbf A_j - \mbox{ матрица порядка }\ {\mathfrak m}_j\times {\mathfrak m}_j \ . $$
Каждый из базисов составляющих $ \mathbb V_{} $ подпространств $ \mathbb V_j $ удается подобрать так, чтобы матрица $ \mathbf A_j $ имела снова блочно-диагональный вид $$ \mathbf A_j= \left( \begin{array}{cccc} {\mathbf A}_{j1} & \mathbb O & \dots & \mathbb O \\ \mathbb O & {\mathbf A}_{j2} & \dots & \mathbb O \\ & & \ddots & \\ \mathbb O & \mathbb O & \dots & {\mathbf A}_{j \ell_j} \end{array} \right) $$ где на диагонали стоят матрицы вида $$ {\mathfrak J}_k (\lambda_j) = \left( \begin{array}{cccccc} \lambda_j & 0 & 0 & \dots & 0 & 0 \\ 1 & \lambda_j & 0 & \dots & 0 & 0 \\ 0 & 1 & \lambda_j & \dots & 0 & 0 \\ \vdots & & \ddots & \ddots& & \vdots \\ 0 & 0 & 0 & \dots & 1 & \lambda_j \end{array} \right)_{k \times k} $$ называемые (нижними) клетками Жордана1).
Указанный вид матрицы оператора $ \mathcal A $ называется канонической формой Жордана2) или жордановой нормальной формой (ЖНФ), а соответствующий базис пространства — каноническим базисом. Жорданову нормальную форму оператора $ \mathcal A $ будем обозначать $ \mathbf A_{_{\mathfrak J}} $.
Частным видом ЖНФ является диагональный:
$$ \mathbf A_{_{\mathfrak J}} = A_{diag}= \left( \begin{array}{cccc} \lambda_1 & 0 & \dots & 0 \\ 0 & \lambda_2 & \dots & 0 \\ & & \ddots & \\ 0 & 0 & \dots & \lambda_n \end{array} \right) \ ; $$ в этом случае все клетки Жордана — первого порядка.
На языке матричного формализма задача построения ЖНФ и канонического базиса может быть переформулирована следующим образом: пусть имеется некоторый исходный базис $ \{X_1,\dots,X_n\} $ пространства $ \mathbb V_{} $, в котором матрица оператора равна $ \mathbf A_{} $. Требуется найти матрицу перехода $ C_{} $ от этого базиса к некоторому новому, обеспечивающую выполнение равенства $$ C^{-1} \mathbf A C = \mathbf A_{_{\mathfrak J}} \ . $$ Про матрицу $ \mathbf A_{_{\mathfrak J}} $ заранее известна лишь та информация, что все ее элементы — нулевые, за исключением разве лишь элементов двух ее диагоналей — главной и следующей за ней вниз.
Пусть $ g(\lambda),g_1(\lambda),g_2(\lambda) $ — произвольные полиномы над $ \mathbb C_{} $.
Говорят, что операторный полином $ g(\mathcal A) $ — аннулирующий для вектора $ X\in \mathbb V_{} $ если $ g(\mathcal A)(X)=\mathbb O $.
Теорема 1. Множество векторов $ X_{}\in \mathbb V $, аннулируемых $ g(\mathcal A) $, образует линейное подпространство пространства $ \mathbb V_{} $.
Доказательство. Действительно, это множество является ядром оператора $ g(\mathcal A) $ и по теореме 1 из ☞ ПУНКТА, оно является линейным подпространством. ♦
Теорема 2. Если полиномы $ g_1(\lambda) $ и $ g_2(\lambda) $ взаимно просты: $ \operatorname{HOD} (g_1,g_2)=1 $, то подпространства векторов, аннулируемых $ g_1(\mathcal A) $ и $ g_2(\mathcal A) $, имеют тривиальное пересечение.
Доказательство. Если $ \operatorname{HOD} (g_1,g_2)=1 $, то существуют полиномы $ \{ p_1(\lambda),p_2(\lambda)\} \subset \mathbb C[\lambda] $, обеспечивающие выполнение тождества Безу: $$p_1(\lambda)g_1(\lambda)+p_2(\lambda)g_2(\lambda) \equiv 1 \ . $$ Тогда при подстановке в это тождество оператора получим: $$ p_1(\mathcal A)g_1(\mathcal A)+p_2(\mathcal A)g_2(\mathcal A) = \mathcal E \ , $$ где $ \mathcal E $ — тождественный оператор.
Если существует $ X \in \mathbb V_{} $ такой, что $ g_1(\mathcal A)(X)=\mathbb O $ и $ g_2(\mathcal A)(X)=\mathbb O $, то из последнего тождества следует, что $$p_1(\mathcal A)g_1(\mathcal A)(X)+p_2(\mathcal A)g_2(\mathcal A)(X) = \mathcal E(X) \quad \Longrightarrow \mathbb O=X \ . $$ ♦
Теорема 3. Если полиномы $ g_1(\lambda) $ и $ g_2(\lambda) $ взаимно просты и вектор $ X\ne \mathbb O $ аннулируется произведением $ g_1(\mathcal A)g_2(\mathcal A) $, то этот вектор можно представить в виде суммы $ X=X_1+X_2 $, где $ X_{j} $ аннулируется $ g_j(\mathcal A) $.
Доказательство. Воспользуемся равенством из последней теоремы: $$\underbrace{p_1(\mathcal A)g_1(\mathcal A)(X)}_{= X_2}+ \underbrace{p_2(\mathcal A)g_2(\mathcal A)(X)}_{= X_1} = \mathcal E (X)=X \ .$$ Тогда $ g_2(\mathcal A)(X_2)=p_1(\mathcal A)g_1(\mathcal A)g_2(\mathcal A)(X)=p_1(\mathcal A)(\mathbb O)=\mathbb O $, т.е. $ X_2 $ аннулируется $ g_2(\mathcal A) $. Аналогично доказывается, что $ g_1(\mathcal A)(X_1)=\mathbb O $. ♦
Если вектор $ X_{} $ аннулируется произведением
$$ g(\mathcal A)=g_1(\mathcal A)\times \dots \times g_{{\mathfrak r}}(\mathcal A) , $$ где полиномы $ g_1(\lambda),\dots, g_{{\mathfrak r}}(\lambda) $ попарно взаимно просты, то его можно представить в виде суммы $$ X=X_1+\dots+X_{{\mathfrak r}} \ \mbox{ где } X_j \ \mbox{ аннулируется } \ g_j(\mathcal A) . $$
Полином $ g(\lambda) \not\equiv 0 $ называется аннулирующим полиномом оператора $ \mathcal A_{} $, если $ g(\mathcal A)= \mathcal O $.
Пример. В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степеней $ \le 3 $ оператор $ \mathcal A_{} $ действует по правилу:
$$ \mathcal A (F(x)) = F(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ т.е. полином $ F_{}(x) $ отображается в остаток от деления произведения $ F(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Найти аннулирующий полином оператора.
Решение. Поскольку про аннулирующий полином $ g(\lambda) $ нам заранее не известна даже его степень, будем искать подбором как его степени (идя по возрастанию), так и его коэффициентов. Пусть $$ g(\lambda) = A_0 + A_1 \lambda+ A_2 \lambda^2+ \dots . $$ Условие $ g(\mathcal A)= \mathcal O $ перепишем в виде $$ A_0 \mathcal E + A_1 \mathcal A+ A_2 \mathcal A^2+ \dots = \mathcal O \ . $$ В примере ☞ ПУНКТА степень оператора $ \mathcal A^K $ вычислялась формулой $$ \mathcal A^k(F(x))=(x^2-2)^K F(x) \pmod{x^4-x^3-x^2+x} \ . $$ Исходя из этого, аннулирующий полином должен обеспечивать выполнение условия $$ ( A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2+ \dots) F(x) \equiv 0 \ \pmod{x^4-x^3-x^2+x} ; $$ причем это тождество должно быть выполнено для любого полинома $ F_{}(x) $. Отсюда следует, что полином $ ( A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2+ \dots) $ должен делиться нацело на $ x^4-x^3-x^2+x $. Для удовлетворения этого требования делаем теперь гипотезу о степени этого полинома и пробуем подобрать коэффициенты. Предположим, что $ \deg g \le 1 $, но такой полином может делиться на полином степени $ 4_{} $ только при условии выполнения равенств $ A_0=0,A_1=0 $; что нас совершенно не интересует. Пусть $ \deg g=2 $, тогда если полином $ A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2 $ делится на полином степени $ 4_{} $, то должен отличаться от делителя только постоянным множителем: $$ A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2 \equiv C (x^4-x^3-x^2+x) \quad npu \quad C \in \mathbb C \ . $$ Легко проверить, что это возможно только в тривиальном случае: $ A_0=0,A_1=0,A_2=0 $. Случай $ \deg g=3 $ требует уже более сложных расчетов: произведем деление с остатком $$ A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2+ A_3 (x^2-2)^3 \equiv $$ $$ \equiv (A_2-4\,A_3)\,x^3+(A_1-3\,A_2+7\,A_3)\,x^2+ $$ $$ +(-A_2+4\,A_3)\,x+A_0-2\,A_1+4\,A_2-8\,A_3 \pmod{x^4-x^3-x^2+x} \ . $$ Остаток будет тождественно равен нулю тогда и только тогда, когда $$ A_2=4\,A_3,\ A_1=5\, A_3,\ A_0=2\, A_3 \ . $$ Эти условия — с точностью, до постоянного сомножителя — определяют аннулирующий полином .
Ответ. Аннулирующим полиномом минимально возможной степени является $ \lambda^3+4\, \lambda^2+ 5\, \lambda+2 $.
Аннулирующий полином оператора $ \mathcal A_{} $ минимально возможной степени называется минимальным аннулирующим полиномом.
Существование хотя бы одного аннулирующего полинома оператора гарантируется теоремой Гамильтона-Кэли: если $ f(\lambda) $ — характеристический полином оператора $ \mathcal A_{} $, то $ f(\mathcal A)={\mathcal O} $. Таким образом, можно утверждать, что для минимального аннулирующего полинома выполняется условие $ \deg g \le \dim \mathbb V $. Предыдущий пример показывает, что это неравенство может оказаться и строгим. Обратим внимание, что для оператора из этого примера характеристический полином равен $ (\lambda+2)(\lambda+1)^3 $ и полученный аннулирующий полином является его делителем: он равен $ (\lambda+2)(\lambda+1)^2 $.
Теорема 4. Аннулирующий полином $ g(\lambda_{}) $ оператора $ \mathcal A_{} $ имеет те же корни, что и характеристический полином этого оператора.
Доказательство от противного. Пусть $ \lambda_{\ast} \in \mathbb C $ — корень характеристического полинома оператора $ \mathcal A_{} $, но $ g(\lambda_{}) $ не имеет $ \lambda_{\ast} $ корнем. Числу $ \lambda_{\ast} $ принадлежит корневой вектор $ \mathfrak X_{\ast} $ высоты $ 1_{} $ (собственный вектор) оператора $ \mathcal A_{} $: $ (\mathcal A- \lambda_{\ast} \mathcal E)(\mathfrak X_{\ast})=\mathbb O $. С другой стороны, поскольку $ \operatorname{HOD}( g(\lambda_{}), \lambda- \lambda_{\ast})=1 $, то, по теореме 2, вектор $ \mathfrak X_{\ast} $ не должен аннулироваться оператором $ g(\mathcal A) $. Однако это противоречит предположению о том, что $ g(\mathcal A) $ — аннулирующий полином оператора. ♦
Теорема 5. Минимальный аннулирующий полином оператора является делителем его характеристического полинома. Два минимальных аннулирующих полинома оператора различаются, разве лишь, постоянным множителем.
Доказательство. Предположим противное: пусть минимальный аннулирующий полином $ g(\lambda) $ не является делителем $ f(\lambda) $. Тогда при делении $ f(\lambda) $ на $ g(\lambda) $ возникает нетривиальный остаток: $$ f(\lambda)\equiv g(\lambda) q(\lambda) + r(\lambda) \quad npu \quad \deg r < \deg g \ . $$ Поскольку $ f(\lambda) $ и $ g(\lambda) $ — аннулирующие для $ \mathcal A $, то и $ r(\lambda)= f(\lambda) - g(\lambda) q(\lambda) $ является аннулирующим. Но это противоречит тому, что, по предположению, $ g(\lambda) $ — минимальный аннулирующий полином.
Если $ \tilde g(\lambda) $ — еще один минимальный аннулирующий полином оператора, то обязательно $ \deg \tilde g = \deg g $. Если предположить, что у полиномов $ g(\lambda) $ и $ \tilde g(\lambda) $ имеются различные сомножители, то полином $ \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) $ будет иметь степень меньшую $ \deg \tilde g = \deg g $. Для $ \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) $ имеет место линейное представление: $$ \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) \equiv p_1(\lambda) g(\lambda) + p_2(\lambda) \tilde g(\lambda) \ \ npu \quad \{p_1(\lambda),p_2(\lambda) \} \subset \mathbb C[\lambda] . $$ Тогда $ \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) $ является аннулирующим полиномом оператора. Но тогда $ g(\lambda) $ и $ \tilde g(\lambda) $ не могут быть минимальными аннулирующими. ♦
Следствиями теорем 4 и 5 является следующий результат.
Минимальный аннулирующий полином оператора $ \mathcal A_{} $ совпадает (с точностью до постоянного сомножителя) с характеристическим полиномом этого оператора при условии отсутствия у этого полинома кратных корней. В общем случае, пусть разложение характеристического полинома оператора имеет вид
$$ f(\lambda)= \det (\mathcal A - \lambda \mathcal E) \equiv (-1)^n(\lambda - \lambda_1)^{{\mathfrak m}_1} \times \dots \times (\lambda - \lambda_{{\mathfrak r}})^{ {\mathfrak m}_{{\mathfrak r}}} \quad ; \quad {\mathfrak m}_1+\dots+{\mathfrak m}_{{\mathfrak r}}=n, \ \lambda_k \ne \lambda_{\ell} \ npu \ k \ne \ell. $$ Минимальный аннулирующий полином имеет вид $$ g(\lambda)=(\lambda-\lambda_1)^{\mathfrak n_1}\times \dots \times (\lambda-\lambda_{\mathfrak r})^{\mathfrak n_{\mathfrak r}} , $$ где показатели $ \{\mathfrak n_j \}_{j=1}^{\mathfrak r} $ могут принимать значения из множеств $ \{\{1,\dots,\mathfrak m_j \}\}_{j=1}^{\mathfrak r} $.
Теорема Гамильтона-Кэли эквивалентна равенству $$ (\mathcal A- \lambda_1 \mathcal E)^{{\mathfrak m}_1} \times \dots \times (\mathcal A - \lambda_{{\mathfrak r}}\mathcal E)^{ {\mathfrak m}_{{\mathfrak r}}} = \mathcal O \ . $$ Из следствия к теореме $ 3 $ тогда вытекает, что произвольный вектор $ X_{} \in \mathbb V $ может быть представлен в виде суммы $$X=X_1+\dots+X_{{\mathfrak r}} \ , \qquad \mbox{ где } \ X_j \quad \mbox{ аннулируется } \ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j} \ . $$ и такое представление единственно, т.е. $ \mathbb V_{} $ раскладывается в прямую сумму $$ \mathbb V= \mathbb V_1\oplus \dots \oplus \mathbb V_{{\mathfrak r}} \ , \qquad \mbox{ где } \ \mathbb V_{j} \mbox{ аннулируется } \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j } \ . $$
Теорема 6. Линейное подпространство векторов, аннулируемых $ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j} $, инвариантно относительно $ \mathcal A_{} $.
Доказательство. Действительно, если $$ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j}(X)=\mathbb O \, ,$$ то и $$ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j}(\mathcal A(X))=\mathcal A(\left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j}(X))= \mathbb O \, . $$ ♦
На основании теоремы из ☞ ПУНКТА в базисе $ \mathbb V_{} $, составленном объединением базисов $ \mathbb V_j $, матрица оператора будет иметь блочно-диагональный вид
$$ \left( \begin{array}{cccc} \mathbf A_1 & \mathbb O & \dots & \mathbb O \\ \mathbb O & \mathbf A_2 & \dots & \mathbb O \\ & & \ddots & \\ \mathbb O & \mathbb O & \dots & \mathbf A_{{\mathfrak r}} \end{array} \right) \ . $$ Итак, мы следуем изложенной в начале раздела схеме; остается только подобрать хорошие базисы для самих подпространств $ \mathbb V_j $.
Задача. Построить такой базис подпространства $ \mathbb V_j $, в котором соответствующий блок $ {\mathbf A}_j $ матрицы оператора $ \mathcal A_{} $ будет состоять из клеток Жордана.
Ненулевой вектор $ X_{}\in \mathbb V $ называется корневым вектором оператора $ \mathcal A_{} $, принадлежащим собственному числу $ \lambda_{j}^{} $ если он аннулируется оператором $ (\mathcal A - \lambda_{j} \mathcal E)^k $ при некотором $ k_{}\in \mathbb N $: $ (\mathcal A - \lambda_{j} \mathcal E)^k(X)=\mathbb O $. Наименьший из показателей $ k_{} $ с таким свойством называется высотой корневого вектора $ X_{} $: $$ . \mbox{ Высота }\ (X) = h \iff (\mathcal A - \lambda_{j} \mathcal E)^h(X)=\mathbb O,\ (\mathcal A - \lambda_{j} \mathcal E)^{h-1}(X)\ne \mathbb O \ .$$
Пример 1. Любой собственный вектор оператора $ \mathcal A_{} $ будет его корневым высоты $ 1 $.
Рассмотрим теперь пример, разобранный в ☞ ПУНКТЕ.
Пример 2. В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степеней $ \le 3 $ оператор $ \mathcal A_{} $ действует по правилу
$$ \mathcal A (f(x)) = F(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ т.е. полином $ F_{}(x) $ отображается в остаток от деления произведения $ F(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Найти корневые векторы этого оператора.
Решение. Оператор имеет два собственных числа $ \lambda_1=-2 $ и $ \lambda_2=-1 $, причем последнее — кратности $ 3_{} $. Корневыми векторами высоты $ 1_{} $ являются собственные векторы, принадлежащие этим собственным числам, т.е. $$ \{ t(x+1)(x-1)^2 \ \mid \ t\ne 0 \} \quad \mbox{ и } \quad \{ (t_1x+t_2)x(x-1) \ \mid \ (t_1,t_2) \ne (0,0) \} \ $$ соответственно.
Далее, ищем корневые векторы высоты $ 2_{} $, принадлежащие собственному числу $ \lambda_1=-2 $. $$ (\mathcal A +2 \, \mathcal E)^2 (F(x))=x^4 F(x) \pmod{x^4-x^3-x^2+x} $$ и наша задача состоит в нахождении полинома $ F_{}(x) $, для которого последнее выражение равно тождественно нулевому полиному. Очевидно, что множество всех таких полиномов $$ \{ t(x^3-x^2-x+1) \ \mid \ t\ne 0 \} $$ совпадает с уже полученным выше множеством собственных векторов (полиномов). Понятно также, что дальнейшее увеличение степени оператора $ (\mathcal A +2 \, \mathcal E) $ иных полиномов не даст. Следовательно, рассматриваемому собственному числу принадлежат только корневые векторы (полиномы) высоты $ 1_{} $.
Для собственного числа $ \lambda_1=-1 $ сценарий оказывается несколько менее тривиальным: $$ (\mathcal A +\mathcal E)^2 (F(x))=(x^2-1)^2 F(x) \pmod{x^4-x^3-x^2+x} \ . $$ Полином $ (x^2-1)^2 F(x) $ делится нацело на $ x(x+1)(x-1)^2 $ при полиноме $$ F_{}(x) \in \{ (u_1x^2+u_2x+u_3)x \mid \ (u_1,u_2,u_3) \in \mathbb R^3 \} \ . $$ Некоторое подмножество этого множества составляют собственные векторы (полиномы): $$ \{ (t_1x+t_2)(x-1)x \ \mid \ (t_1,t_2) \in \mathbb R^2 \} \ \subset \{ (u_1x^2+u_2x+u_3)x \mid \ (u_1,u_2,u_3) \in \mathbb R^3 \} , $$ но появляются и корневые векторы (полиномы) высоты $ 2_{} $. Чтобы понять какие это векторы обратим внимание, что полиномы из левого множества все делятся на $ (x-1) $, т.е. имеют корнем $ 1_{} $. Следовательно высоту $ 2_{} $ будут иметь полиномы $ (u_1x^2+u_2x+u_3)x $, для которых $ 1_{} $ не является корнем, т.е. удовлетворяющие условию $ u_1+u_2+u_3 \ne 0 $.
Если мы попытаемся найти полиномы высоты $ 3_{} $, то нас ожидает неудача — множество решений $ (\mathcal A +\mathcal E)^3 (F(x)) $ совпадает с предыдущим. ♦
Пример 3. Найти корневые векторы матрицы
$$ \mathbf A=\left( \begin{array}{rrrrrrrr} 3 & 0 & 1 & 1 & 0 & 1 & -1 & 0 \\ 0 & 3 & -2 & -1 & -1 & -2 & 1 & -1 \\ 2& 3 & 0 & 0 & -2 & -2 & 0 & -2 \\ -3 & -3 & 1 & 1 & 2 & 1 & 1 & 2 \\ -1 & -1 & 0 & 0 & 2 & -1 & 1 & 0 \\ -1 & -1 & 0 & -1 & 1 & 3 & 0 & 1 \\ -1 & -1 & 0 & -1 & 1 & 1 & 2 & 1 \\ 0& 0& 0 & 0 & 0 & 0 & 0 & 2 \end{array} \right) \ . $$
Решение. $ \det (\mathbf A- \lambda E) \equiv ( \lambda -2)^8 $. У матрицы имеется единственное собственное число $ \lambda_1=2 $ алгебраической кратности $ 8_{} $. Составим матрицу $$ \mathbf B=\mathbf A- 2\, E= \left( \begin{array}{rrrrrrrr} 1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\ 0 & 1 & -2 & -1 & -1 & -2 & 1 & -1\\ 2 & 3 & -2 & 0 & -2 & -2 & 0 & -2\\ -3 & -3 & 1 & -1 & 2 & 1 & 1 & 2\\ -1 & -1 & 0 & 0 & 0 & -1 & 1 & 0\\ -1 & -1 & 0 & -1 & 1 & 1 & 0 & 1\\ -1 & -1 & 0 & -1 & 1 & 1 & 0 & 1\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{array} \right) $$ и найдем корневые векторы высоты $ 1_{} $ как решения системы однородных уравнений $ \mathbf B X = \mathbb O $. Методом Гаусса сводим эту систему к $$ \left( \begin{array}{rrrrrrrr} 1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\ 0& 1 & -2 & -1 & -1 & -2 & 1 & -1 \\ 0 & 0 & 2 & 1 & 1 & 2 & -1 & 1\\ 0& 0 & 0 & 1 & -1 & -2 & 1 & -1 \end{array} \right) X = \mathbb O \iff $$ $$ \iff \quad \left\{ \begin{array}{rrrrrrrrr} x_1 & & -x_3 & +x_4 & +x_5 & & & & =0,\\ & x_2 & & & & & & & =0, \\ & & x_3 & +x_4 & & & & & =0,\\ & & & x_4 & -x_5 & -2\,x_6 & +x_7 & -x_8 & = 0. \end{array} \right. $$ Геометрическая кратность собственного числа равна $ 4_{} $. Строим фундаментальную систему решений (ФСР) для этой системы; переменные $ x_5,x_6,x_7,x_8 $ можно взять в качестве основных: $$ \begin{array}{rrrr|rrrr} x_1 & x_2 & x_3 & x_4 & x_5 & x_6 & x_7 & x_8 \\ \hline 0 & 0 & -1 & 1 & 1 & 0 & 0 & 0 \\ -1 & 0 & -2 & 2 & 0 & 1 & 0 & 0 \\ 1 & 0 & 1 & -1 & 0 & 0 & 1 & 0 \\ 0 & 0 & -1 & 1 & 0 & 0 & 0 & 1 \end{array} $$ Таким образом, ФСР состоит из векторов $$ X_1=[0,0,-1,1,1,0,0,0]^{\top},\ X_2=[-1,0,-2,2,0,1,0,0]^{\top},\ $$ $$ X_3=[1,0,1,-1,0,0,1,0]^{\top},\ X_4=[0,0,-1,1,0,0,0,1]^{\top} \ . $$ Любая нетривиальная линейная комбинация $ \alpha_1X_1+\alpha_2X_2+\alpha_3X_3+\alpha_4X_4 $ будет корневым вектором высоты $ 1_{} $.
Теперь отыщем корневые векторы высоты $ 2_{} $. Для этого вычислим матрицу $ \mathbf B^2 $ и решим систему уравнений $ \mathbf B^2 X=\mathbb O $: $$ \left( \begin{array}{rrrrrrrr} 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\ 2 & 1 & 0 & 1 & -1 & 0 & -1 & -1\\ -2 & -1 & 0 & -1 & 1 & 0 & 1 & 1\\ -1 & -1 & 1 & 0 & 1 & 1 & 0 & 1\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{array} \right) X = \mathbb O \quad \iff $$ $$ \iff \quad \left\{ \begin{array}{rrrrrrrrr} x_1 & & +x_3 & +x_4 & & +x_6 & -x_7 & & =0,\\ & x_2 & -2\,x_3 & -x_4 & -x_5 & -2\,x_6 & +x_7 & -x_8 & =0. \end{array} \right. $$ Для этой системы ФСР состоит из $ 6_{} $ векторов и ее можно строить разными способами. Например, ее можно строить дополнением системы корневых векторов высоты $ 1_{} $ — это позволит выделить корневые векторы высоты большей $ 1_{} $. Для того, чтобы организовать такую процедуру пополнения, достаточно перебросить часть переменных, которые были зависимыми при нахождении ФСР в предыдущей системе $ \mathbf B X= \mathbb O $, к основным переменным. Такими переменными можно взять $ x_{3} $ и $ x_{4} $: $$ \begin{array}{rr|rrrrrr} x_1 & x_2 & x_3 & x_4 & x_5 & x_6 & x_7 & x_8 \\ \hline -1 & 2 & 1 & 0 & 0 & 0 & 0 & 0 \\ -1 & 1 & 0 & 1 & 0 & 0 & 0 & 0 \\ \hline 0 & 0 & -1 & 1 & 1 & 0 & 0 & 0 \\ -1 & 0 & -2 & 2 & 0 & 1 & 0 & 0 \\ 1 & 0 & 1 & -1 & 0 & 0 & 1 & 0 \\ 0 & 0 & -1 & 1 & 0 & 0 & 0 & 1 \end{array} $$ Векторы $$ X_5 = [-1, 2, 1, 0, 0, 0, 0, 0]^{\top} \quad u \quad X_6 = [-1, 1, 0, 1, 0, 0, 0, 0]^{\top} $$ являются корневыми векторами высоты $ 2_{} $, и такая же высота будет у любого вектора $$ \alpha_1X_1+\alpha_2X_2+\alpha_3X_3+\alpha_4X_4 + \beta_1 X_5 + \beta_2 X_6 \quad npu \quad \{\alpha_1,\dots,\alpha_4, \beta_1, \beta_2\} \subset \mathbb C, |\beta_1|+ |\beta_2| \ne 0 \ . $$ Далее, для нахождения корневых векторов высоты $ 3_{} $ решим систему $ \mathbf B^3 X=\mathbb O $: $$ \left( \begin{array}{rrrrrrrr} 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\ -1 & 0 & -1 & -1 & 0 & -1 & 1 &0\\ -1 & 0 & -1 & -1 & 0 & -1 & 1 &0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 &0 \end{array} \right) X = \mathbb O \quad \iff $$ $$ \iff \quad x_1+x_3 +x_4+x_6 -x_7 =0 \ . $$ Снова строим ФСР дополнением ранее полученных векторов $ X_1,\dots,X_6 $. В разряд основных переменных переходит $ x_{2} $ и вектором высоты $ 3_{} $ будет $$ X_7=[0,1,0,0,0,0,0,0]^{\top} \ . $$ Очередное возведение в степень матрицы $ \mathbf B $ приводит к нулевой матрице: $ \mathbf B^4=\mathbb O $. Любой вектор $ \mathbb C^8 $ является решением системы $ \mathbf B^4X=\mathbb O $. Вектором высоты $ 4_{} $ возьмем вектор $$ X_8=[1,0,0,0,0,0,0,0]^{\top} \ . $$ Векторов высоты большей $ 4_{} $ у матрицы нет. ♦
Теорема 7. Высота корневого вектора, принадлежащего $ \lambda_{j}^{} $, не превосходит кратности этого числа в характеристическом полиноме (т.е. его алгебраической кратности).
В дальнейшем максимально возможную высоту корневого вектора для числа $ \lambda_{j}^{} $ будем обозначать $ \mathfrak h_j $.
Доказательство. Пусть существует вектор $ X_{}\in \mathbb V $ такой, что $$ (\mathcal A - \lambda_j {\mathcal E})^{\mathfrak h_j}(X)=\mathbb O,\quad (\mathcal A - \lambda_j {\mathcal E})^{\mathfrak h_j-1}(X) \ne \mathbb O $$ при $ \mathfrak h_j>{\mathfrak m}_j $. Обозначим $$ \widetilde X = (\mathcal A - \lambda_j {\mathcal E})^{{\mathfrak m}_j}(X),\quad g(\lambda) = f(\lambda)/(\lambda-\lambda_j)^{{\mathfrak m}_j} \ .$$ По определению, вектор $ \widetilde X $ — корневой, принадлежащий $ \lambda_{j}^{} $, высоты $ \mathfrak h_j-{\mathfrak m}_j $. Поскольку $ g(\lambda) $ не имеет корнем $ \lambda_{j}^{} $, то $ \operatorname{HOD} (g(\lambda),(\lambda-\lambda_j)^{\mathfrak h_j-{\mathfrak m}_j})=1 $. По теореме 2: $ g(\mathcal A)(\widetilde X)\ne \mathbb O $. Но тогда $$g(\mathcal A)(\mathcal A - \lambda_j {\mathcal E})^{{\mathfrak m}_j}(X)\ne \mathbb O \Longrightarrow f(\mathcal A)(X)\ne \mathbb O \ ,$$ что противоречит тому, что $ f(\mathcal A)={\mathcal O} $. ♦
Теорема 8. Множество корневых векторов, принадлежащих $ \lambda_{j}^{} $, дополненное нулевым вектором, образует линейное подпространство.
Это подпространство, которое мы выше обозначали $ \mathbb V_{j} $, называется корневым подпространством оператора $ \mathcal A_{} $, принадлежащим данному собственному числу $ \lambda_{j}^{} $.
Теорема 9. Корневые подпространства, принадлежащие различным собственным числам оператора $ \mathcal A_{} $, имеют тривиальное пересечение: $$ \mathbb V_j \bigcap \mathbb V_k = \{ \mathbb O \} \qquad npu \quad \lambda_j \ne \lambda_k \ . $$
Доказательство. Следствие теоремы 2. ♦
Теорема 10. Пространство $ \mathbb V_{} $ раскладывается в прямую сумму корневых подпространств оператора $ \mathcal A $: $$\mathbb V=\mathbb V_1 \oplus \dots \oplus \mathbb V_{{\mathfrak r}}\ . $$
Для построения базиса корневого подпространства $ \mathbb V_{j} $ выделим в нем подпространства корневых векторов высот $ \le s $: $$ \mathbb Q_s = \mathcal{K}er (\mathcal A-\lambda_{j} \, {\mathcal E})^s \ , \ \mathbb Q_0 = \{\mathbb O\} \ .$$ Понятно, что имеет место вложенность $$\mathbb Q_0 \subset \mathbb Q_1 \subset \dots \subset \mathbb Q_{\mathfrak h_j} = \mathbb V_j \ .$$
Теорема 11. Если векторы $ X_1,\dots,X_k $ принадлежат $ \mathbb Q_s $ и линейно независимы относительно $ \mathbb Q_{s-1} $, то векторы $ (\mathcal A - \lambda_j {\mathcal E})(X_1),\dots, (\mathcal A - \lambda_j {\mathcal E})(X_k) $ принадлежат $ \mathbb Q_{s-1} $ и линейно независимы относительно $ \mathbb Q_{s-2} $.
Доказательство. Если $ X\in \mathbb Q_s $ то $ (\mathcal A - \lambda_j {\mathcal E})^s(X)=\mathbb O $, т.е. $$(\mathcal A - \lambda_j {\mathcal E})^{s-1}\left( (\mathcal A - \lambda_j {\mathcal E})(X) \right)=\mathbb O \ ,$$ но это и означает, что $ (\mathcal A - \lambda_j {\mathcal E})(X) \in \mathbb Q_{s-1} $.
Предположим теперь, что существуют скаляры $ c_1,\dots,c_k $ такие, что $$ \begin{array}{ccc} &c_1 (\mathcal A - \lambda_j {\mathcal E})(X_1)+\dots+c_k (\mathcal A - \lambda_j {\mathcal E})(X_k) \in \mathbb Q_{s-2}& \iff \\ \iff (\mathcal A - \lambda_j {\mathcal E})^{s-2} &\left(c_1 (\mathcal A - \lambda_j {\mathcal E})(X_1)+\dots +c_k (\mathcal A - \lambda_j {\mathcal E})(X_k) \right)=\mathbb O \quad \ & \iff \\ \iff (\mathcal A - \lambda_j {\mathcal E})^{s-1}& \left(c_1X_1+\dots +c_k X_k \right) = \mathbb O \ \qquad \Rightarrow \quad c_1X_1+\dots +c_k X_k \in \mathbb Q_{s-1} \ . & \end{array} $$ По условию теоремы последнее соотношение возможно только при $ c_1=0,\dots, c_k=0 $. ♦
Чтобы не усложнять индексы, всюду в алгоритме полагаем $ \mathfrak h = \mathfrak h_j $.
0. Считаем, что на этом этапе построены базисы всех подпространств $ \mathbb Q_1, \mathbb Q_2,\dots, \mathbb Q_{\mathfrak h} $. При этом базис каждого подпространства $ \mathbb Q_s $ при $ s\in \{2,\dots,\mathfrak h\} $ получен дополнением базиса подпространства $ \mathbb Q_{s-1} $. Обозначим $$ \mathcal B = \mathcal A - \lambda_j {\mathcal E} \quad, k_1 = \dim \mathbb Q_1,\ k_{s} = \dim \mathbb Q_s- \dim \mathbb Q_{s-1} \quad npu \quad s\in \{2,\dots,\mathfrak h\} ; $$ таким образом, $ k_{s} $ — число векторов относительного базиса $ \mathbb Q_s $ над $ \mathbb Q_{s-1} $. Число $ k_1+k_2+\dots+k_{_{\mathfrak h_j}} $ равно алгебраической кратности, а число $ k_{1} $ равно геометрической кратности собственного числа $ \lambda_{j} $: $$ k_1+k_2+\dots+k_{_{\mathfrak h_j}}= \mathfrak m_j= \dim \mathbb V_j,\ k_1= \ell_j= \operatorname{dfc} \left( \mathcal A - \lambda_j {\mathcal E} \right) \ . $$
Для визуализации последующего алгоритма построения канонического базиса удобно представить результаты этого этапа в виде схемы:
Мы наблюдаем разноэтажное здание, число квартир на каждом этаже которого не превосходит числа квартир на предыдущем. В ходе дальнейшего алгоритма, часть «жильцов» останется на месте, а часть может быть замещена другими.
1. Выберем $ Y_{1},\dots,Y_{k_{_{\mathfrak h}}} $ — относительный базис3) $ \mathbb Q_{\mathfrak h}=\mathbb V_j $ над $ \mathbb Q_{\mathfrak h-1} $.
2. По теореме 11 векторы $ \mathcal B(Y_{1}),\dots,\mathcal B(Y_{k_{_{\mathfrak h}}}) $ принадлежат $ \mathbb Q_{\mathfrak h-1} $ и л.н.з. относительно $ \mathbb Q_{\mathfrak h-2} $. Если $ k_{\mathfrak h}=k_{\mathfrak h-1} $ то переходим к шагу 3 , в противном случае дополним полученные векторы до относительного базиса $ \mathbb Q_{\mathfrak h-1} $ над $ \mathbb Q_{\mathfrak h-2} $: пусть система $$\mathcal B(Y_{1}), \dots,\mathcal B(Y_{k_{\mathfrak h}}),Y_{k_{\mathfrak h}+1},\dots, Y_{k_{(\mathfrak h-1)}}$$ является этим базисом.
3. По теореме 11 векторы $$\mathcal B^2(Y_{1}), \dots,\mathcal B^2(Y_{k_{\mathfrak h}}),\mathcal B(Y_{k_{\mathfrak h}+1}),\dots, \mathcal B(Y_{k_{_{(\mathfrak h-1)}}})$$ принадлежат $ \mathbb Q_{\mathfrak h-2} $ и л.н.з. относительно $ \mathbb Q_{\mathfrak h-3} $. Если $ k_{\mathfrak h-1}=k_{\mathfrak h-2} $ то переходим к шагу 4 , в противном случае дополним эти векторы до относительного базиса $ \mathbb Q_{\mathfrak h-2} $ над $ \mathbb Q_{\mathfrak h-3} $.
4. Продолжаем процесс…
...
h - 1. $ \dots $
h. Действуем оператором $ \mathcal B $ на векторы, полученные на предыдущем шаге: $$ \mathcal B^{\,\mathfrak h-1}(Y_{1}), \dots,\mathcal B^{\,\mathfrak h-1}(Y_{k_{\mathfrak h}}),\mathcal B^{\,\mathfrak h-2}(Y_{k_{\mathfrak h}+1}),\dots,\mathcal B^{\,\mathfrak h-2}(Y_{k_{_{(\mathfrak h-1)}}}),\dots, \mathcal B(Y_{k_{_3}+1}),\dots,\mathcal B(Y_{k_{_2}}) . $$ Получившиеся векторы принадлежат $ \mathbb Q_1 $ и л.н.з. относительно $ \mathbb Q_{0} $, т.е. линейно независимы в обычном понимании. Если $ k_{2}=k_{1} $, то процесс заканчивается. В противном случае дополним эти векторы до базиса $ \mathbb Q_1 $: пусть $$ \begin{array}{ccc} & \mathcal B^{\,\mathfrak h-1}(Y_{1}), \dots,\mathcal B^{\,\mathfrak h-1}(Y_{k_{\mathfrak h}}),\mathcal B^{\,\mathfrak h-2}(Y_{k_{\mathfrak h}+1}),\dots,\mathcal B^{\,\mathfrak h-2}(Y_{k_{_{(\mathfrak h-1)}}}),\dots, & \\ & \qquad \dots, \quad \mathcal B(Y_{k_{_3}+1}),\dots,\mathcal B(Y_{k_{_2}}), Y_{k_{_2}+1},\dots, Y_{k_{1}} & \end{array} $$ этот базис.
Базис $ \mathbb V_{j} $ получается объединением всех векторов, полученных в алгоритме. Действительно, $$ .\mbox{ базис } \ \mathbb Q_2 = \big\{ \mbox{ базис } \ \mathbb Q_1 \big\} \bigcup \big\{ \mbox{ относит. базис } \ \mathbb Q_2 \ \mbox{ над } \ \mathbb Q_1 \big\} \ , $$ $$ .\mbox{ базис } \mathbb Q_3 = \big\{ \mbox{ базис } \ \mathbb Q_2 \big\} \bigcup \big\{ \mbox{ относит. базис } \ \mathbb Q_3 \ \mbox{ над } \ \mathbb Q_2 \big\} \ , $$ $$ \dots \qquad \dots $$ $$ .\mbox{ базис } \underbrace{\mathbb Q_{_{\mathfrak h}}}_{=\mathbb V_j} = \big\{ \mbox{ базис } \ \mathbb Q_{\mathfrak h-1} \big\} \bigcup \big\{ \mbox{ относит. базис } \ \mathbb Q_{\mathfrak h} \ \mbox{ над } \ \mathbb Q_{\mathfrak h-1} \big\} \ . $$
Структура жордановой нормальной формы оператора $ \mathcal A_{} $
В ЖНФ оператора $ \mathcal A_{} $ собственному числу $ \lambda_{j} $ соответствует $ k_{1} $ клеток Жордана. Они имеют следующую структуру:
Пусть эти клетки расположены на диагонали ЖНФ по убыванию их порядков: $$ \underbrace{{\mathfrak J}_{\mathfrak h} (\lambda_j), \dots, {\mathfrak J}_{\mathfrak h} (\lambda_j)}_{k_{\mathfrak h}}, \underbrace{{\mathfrak J}_{\mathfrak h-1} (\lambda_j),\dots, {\mathfrak J}_{\mathfrak h-1} (\lambda_j)}_{k_{\mathfrak h-1}-k_{\mathfrak h}},\dots, \underbrace{{\mathfrak J}_{2} (\lambda_j),\dots, {\mathfrak J}_{2} (\lambda_j)}_{k_2- k_3}, \underbrace{{\mathfrak J}_{1} (\lambda_j),\dots, {\mathfrak J}_{1} (\lambda_j)}_{k_1- k_2} \ . $$
Структура соответствующего канонического базиса
В каноническом базисе корневые векторы, соответствующие указанной последовательности клеток, следует упорядочить по следующему правилу:
1. Векторы канонического базиса, соответствующие подпоследовательности клеток Жордана максимального порядка $ \mathfrak h $ в ЖНФ, берутся в следующей последовательности: $$ Y_1, \mathcal B(Y_1), \dots, \mathcal B^{\mathfrak h -1}(Y_1), \dots, Y_{k_{\mathfrak h}}, \mathcal B (Y_{k_{\mathfrak h}}), \dots, \mathcal B^{\mathfrak h -1}(Y_{k_{\mathfrak h}}) . $$ Если обратиться к схеме построения относительных базисов подпространств, то предложенный алгоритм упорядочивания векторов канонического базиса иллюстрируется следующим образом: сначала мы «выселяем из квартир» всех жильцов, которые жили в них в пункте алгоритма за номером 0 (см. схему выше), кроме тех, кто живет на самом верхнем — $ \mathfrak h $-м — этаже. Начинаем заселение квартир, идя по стоякам сверху вниз. Квартиранты верхней квартиры «размножаются» с заселением нижних квартир, но строго в том же стояке. Как только заселяем весь стояк вплоть до первого этажа, переходим к соседнему стояку и снова начинаем «заселение» с самой верхней квартиры.
2. Когда все $ k_{\mathfrak h} $ стояков (их еще называют «башнями») максимальной высоты $ \mathfrak h $ заселены, ищем стояки высоты $ \mathfrak h-1 $. Их может вовсе не оказаться (если $ k_{\mathfrak h-1}= k_{\mathfrak h} $). Но если хотя бы один имеется, то мы позволяем заселиться во все оставшиеся квартиры $ (\mathfrak h-1) $-го этажа тем жильцам, которые жили на этом этаже до выселения — корневым векторам высоты $ \mathfrak h-1 $, т.е. жильцов выбираем среди $ X_{\mathfrak h-1,1},\dots, X_{\mathfrak h-1,k_{_{(\mathfrak h-1)}}} $. При одном дополнительном ограничении: «заселяются» только такие «старые» корневые векторы, которые вместе с «новосёлами» на этом этаже — векторами $ \mathcal B(Y_1), \dots, B (Y_{k_{\mathfrak h}}) $ — образуют относительный базис $ \mathbb Q_{\mathfrak h-1} $ над $ \mathbb Q_{\mathfrak h-2} $. Количество таких векторов равно $ k_{\mathfrak h-1} - k_{\mathfrak h} $, и мы их обозначаем $ Y_{k_{\mathfrak h}+1},\dots, Y_{k_{(\mathfrak h-1)}} $. Каждый из них порождает заселение целого стояка — по образу и подобию сценария предыдущего пункта. Векторы, взятые в порядке $$ Y_{k_{\mathfrak h}+1}, \mathcal B(Y_{k_{\mathfrak h}+1}),\dots, \mathcal B^{\mathfrak h-2}(Y_{k_{\mathfrak h}+1}), \dots, Y_{k_{(\mathfrak h-1)}}, \mathcal B(Y_{k_{(\mathfrak h-1)}}),\dots, \mathcal B^{\mathfrak h-2}(Y_{k_{(\mathfrak h-1)}}) $$ — это следующие векторы канонического базиса, соответствующие подпоследовательности клеток порядка $ \mathfrak h-1 $ в ЖНФ.
3. $ \dots $
...
h. Если в ходе предшествующих стадий заселения еще имеются свободные квартиры на $ 1_{} $-м этаже ($ k_1>k_2 $), то в них заселяются корневые векторы высоты $ 1_{} $, т.е. собственные векторы оператора $ \mathcal A_{} $. Лишь бы только эти векторы, обозначенные нами $ Y_{_{k_2+1}},\dots, Y_{_{k_1}} $, оказались линейно независимыми с уже заселившимися, т.е. чтобы все жильцы первого этажа образовывали бы базис $ \mathbb Q_1 $. Эти векторы соответствуют клеткам Жордана порядка $ 1_{} $, т.е., фактически, просто последовательности из $ k_2-k_1 $ чисел $ \lambda_j,\dots,\lambda_j $, стоящих на главной диагонали ЖНФ.
Объяснение необходимости перестановки векторов канонического базиса — почему они нумеруются по правилу «сверху вниз», а не поэтажно — дается в следующем ПУНКТЕ.
Пример 3 (окончание). Построить ЖНФ и канонический базис пространства для оператора из примера 3.
Решение. В этом примере корневое пространство единственно, поскольку единственно собственное число $ \lambda_1=2 $. Далее, максимальная высота корневого вектора $ \mathfrak h_1 = 4 $, а соответствующие подпространства $ \{\mathbb Q_j\}_{j=1}^4 $ имеют вид: $$ \begin{array}{lcl} \mathbb Q_1 &=& \mathcal L (X_1,X_2,X_3,X_4), \\ \mathbb Q_2 &=& \mathcal L (X_1,X_2,X_3,X_4,X_5,X_6),\\ \mathbb Q_3 &=& \mathcal L (X_1,X_2,X_3,X_4,X_5,X_6,X_7), \\ \mathbb Q_4 &=& \mathcal L (X_1,X_2,X_3,X_4,X_5,X_6,X_7,X_8) \ ; \end{array} $$ в обозначениях алгоритма имеем: $$ k_1=4, k_2=2, k_3=1, k_4=1 \ . $$ Начинаем строить канонический базис согласно алгоритму. Первым делом, выбираем векторы относительного базиса $ \mathbb Q_4 $ над $ \mathbb Q_3 $. Такой вектор единствен — это $$ X_8 = [1,0,0,0,0,0,0,0]^{\top} \ .$$ Далее, согласно пункту 2 , вектор $$ \mathbf B X_8 =[1,0,2,-3,-1,-1,-1,0]^{\top} $$ принадлежит $ \mathbb Q_3 $ и линейно независим относительно $ \mathbb Q_2 $. Поскольку $ k_3=1 $, то больше векторов в относительный базис $ \mathbb Q_3 $ над $ \mathbb Q_2 $ добавлять не нужно. Переходим к пункту 3 алгоритма: вычисляем $$ \mathbf B^2 X_8 =[0,1,2,-2,-1,0,0,0]^{\top} \ . $$ Этот вектор принадлежит $ \mathbb Q_2 $ и линейно независим относительно $ \mathbb Q_1 $. Поскольку $ k_2=2 $, то можно подобрать еще один вектор из относительного базиса $ \mathbb Q_2 $ над $ \mathbb Q_1 $. Какой из векторов $$ X_5 = [-1, 2, 1, 0, 0, 0, 0, 0]^{\top} \quad \mbox{ или } \quad X_6 = [-1, 1, 0, 1, 0, 0, 0, 0]^{\top} \ , $$ полученных в ходе построения базиса $ \mathbb Q_2 $, следует взять? — В данном конкретном примере это не имеет значения, поскольку проверка условия базисности $$ \operatorname{rank} \{ \mathbf B^2 X_8, X_5, X_1,X_2,X_3,X_4 \} = \operatorname{rank} \{ \mathbf B^2 X_8, X_6, X_1,X_2,X_3,X_4 \}= 6 $$ выполняется для обоих векторов.
Если ввести в базис вектор $ X_5 $, то в следующем, 4 -м, шаге алгоритма получим систему векторов $$ \mathbf B^3 X_8 = [0,0,1,-1,-1,0,0,0]^{\top}, \ \mathbf B X_5 =[0,0,2,-2,-1,-1,-1,-1,0]^{\top} \ . $$ Если все вычисления проделаны правильно, то полученные векторы должны быть собственными для матрицы $ \mathbf A_{} $, т.е. линейно выражаться через векторы $$ X_1=[0,0,-1,1,1,0,0,0]^{\top},\ X_2=[-1,0,-2,2,0,1,0,0]^{\top}, $$ $$ \ X_3=[1,0,1,-1,0,0,1,0]^{\top},\ X_4=[0,0,-1,1,0,0,0,1]^{\top} \ . $$ В самом деле, $ \mathbf B^3 X_8=-X_1 $, $ \mathbf B X_5=-X_1-X_2-X_3 $. Следовательно, в дополнение к векторам $ \mathbf B^3 X_8 $ и $ \mathbf B X_5 $ в базис пространства $ \mathbb Q_1 $ можно выбрать, например, векторы $ X_2, X_4 $.
Канонический базис пространства состоит, например, из векторов $$ X_8, \mathbf B X_8, \mathbf B^2 X_8, X_5, \mathbf B^3 X_8, \mathbf B X_5,X_2, X_4 \ ; $$ однако эти векторы требуется определенным образом переставить местами. Сначала определяем структуру ЖНФ оператора. В соответствии с алгоритмом имеем ее в виде $$ \mathbf A_{_{\mathfrak J}} = \left(\begin{array}{cccc|cc|c|c} 2 & & & & & & & \\ 1 & 2 & & & & & & \\ & 1 & 2 & & & & & \\ & & 1 & 2 & & & & \\ \hline & & & & 2 & & &\\ & & & & 1 & 2 & & \\ \hline & & & & & & 2 & \\ \hline & & & & & & & 2 \end{array} \right) $$ (все неуказанные элементы равны $ 0_{} $).
В соответствии с этой формой найденные выше корневые векторы следует переставить следующим образом: $$ X_8, \mathbf B X_8, \mathbf B^2 X_8, \mathbf B^3 X_8, X_5, \mathbf B X_5,X_2, X_4 \ . $$ Матрица $$ C=\left(\begin{array}{rrrrrrrr} 1 & 1 & 0 & 0 & -1 & 0 & -1 & 0\\ 0 & 0 & 1 & 0 & 2 & 0 & 0 & 0\\ 0 & 2 & 2 & 1 & 1 & 2 & -2 & -1\\ 0 & -3 & -2 & -1 & 0 & -2 & 2 & 1\\ 0 & -1 & -1 & -1 & 0 & -1 & 0 & 0\\ 0 & -1 & 0 & 0 & 0 & -1 & 1 & 0\\ 0 &-1 & 0 & 0 & 0 & -1 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 \end{array} \right) $$ приводит матрицу $ \mathbf A_{} $ к указанной форме Жордана: $ C^{-1} \mathbf A C = \mathbf A_{_{\mathfrak J}} $. ♦
Для завершения исследования нам осталось только выяснить причину, по которой в алгоритме построения канонического базиса из предыдущего пункта, начиная с определенного места, был изменен принцип нумерации получившейся системы корневых векторов. А для этого следует выяснить, каким образом преобразуются векторы построенного базиса под действием оператора $ \mathcal A_{} $.
Пусть в пространстве $ \mathbb V_{} $ действует оператор $ \mathcal B $. Для любого $ X\in\mathbb V $ построим минимально возможное инвариантное подпространство оператора $ \mathcal B $, содержащее $ X_{} $. Рассмотрим последовательность $$ X, \mathcal B (X),\mathcal B(\mathcal B(X))=\mathcal B^2(X), \dots, $$ и продолжим ее до тех пор, пока не возникнет линейная зависимость.
Теорема 12. Пусть система
$$ \{ X, \mathcal B(X), \ldots, \mathcal B^{k-1}(X) \} $$ еще линейно независима, в то время как система $$ \{X, \mathcal B(X), \ldots, \mathcal B^{k-1}(X),\mathcal B^k(X) \} $$ уже линейно зависима. Тогда линейная оболочка системы векторов $ \{X, \mathcal B(X),\ldots,\mathcal B^{k-1}(X) \} $ $$ \widetilde{\mathbb V}= {\mathcal L}(X,\mathcal B(X),\ldots,\mathcal B^{k-1}(X)) $$ является инвариантным подпространством оператора $ \mathcal B $. При этом $ \widetilde{\mathbb V} $ будет минимальным инвариантным подпространством, содержащим $ X_{} $, т.е. если $ \widetilde{\widetilde{\mathbb V}} $ — произвольное инвариантное подпространство, содержащее $ X_{} $, то $ \widetilde{\widetilde{\mathbb V}}\supset \widetilde{\mathbb V} $.
Доказательство. Рассмотрим произвольный вектор из $ \widetilde{\mathbb V} $: $$ Y=c_1X+c_2\mathcal B(X)+\ldots+c_k\mathcal B^{k-1}(X) $$ применим к нему оператор $ \mathcal B $: $$ \mathcal B(Y)=c_1\mathcal B(X)+c_2\mathcal B^2(X)+\ldots+c_k\mathcal B^k(X) \ . $$ По условию теоремы вектор $ \mathcal B^k(X) $ линейно выражается через векторы системы $ \{ X, \mathcal B(X), \ldots, \mathcal B^{k-1}(X) \} $: $$ \mathcal B^k(X)=-\alpha_1X-\alpha_{2}\mathcal B(X)-\ldots-\alpha_{k}\mathcal B^{k-1}(X) \ . $$ Тогда $$ \mathcal B(Y)-\alpha_1 c_k X+(c_1-\alpha_2 c_k)\mathcal B(X)+ \dots+(c_{k-1}-\alpha_k c_k)\mathcal B^{k-1}(X) \ \in \widetilde{\mathbb V} $$ т.к. все слагаемые принадлежат $ \widetilde{\mathbb V} $. По определению подпространство $ \widetilde{\mathbb V} $ является инвариантным для оператора $ \mathcal B $.
Если $ \widetilde{\widetilde{\mathbb V}} $ — еще какое-то инвариантное подпространство, содержащее $ X_{} $, то оно должно содержать и $ \mathcal B(X) $, но тогда — и $ \mathcal B(\mathcal B(X))=\mathcal B^2(X) $ и т.д., а, значит, и $ \widetilde{\mathbb V} $. ♦
При числе $ k_{} $ из условия теоремы, подпространство $$ \widetilde{\mathbb V}= {\mathcal L}(X,\mathcal B(X),\ldots,\mathcal B^{k-1}(X)) $$ называется циклическим подпространством, порожденным вектором $ X_{} $.
Вернемся теперь к задаче построения канонического базиса оператора $ \mathcal A_{} $.
Теорема 13. Пусть $ X_{} $ — произвольный корневой вектор оператора $ \mathcal A_{} $, принадлежащий собственному числу $ \lambda^{}_{j} $; пусть высота этого вектора равна $ h_{} $. Рассмотрим оператор $ \mathcal B=\mathcal A-\lambda_{j} {\mathcal E} $ и его циклическое подпространство, порожденное вектором $ X_{} $. Векторы
$$Y_1=X,\, Y_2=\mathcal B(Y_1)=\mathcal B(X),\, Y_3=\mathcal B(Y_2)=\mathcal B^2(X), \ldots , Y_h=\mathcal B(Y_{h-1})= \mathcal B^{\,h-1}(X) $$ образуют базис этого подпространства. В базисе пространства $ \mathbb V_{} $, составленном дополнением этих векторов, матрица оператора $ \mathcal A_{} $ имеет вид: $$ \left(\begin{array}{cccccccc} \lambda_{j}&0&0 &\ldots&0&\star & \star & \star\\ 1&\lambda_{j}&0 & \ldots&0&\star & \star & \star\\ 0&1&\lambda_{j} & &0&\star & \star & \star\\ \vdots && \ddots &\ddots & &&& \vdots \\ 0&0 &\dots& 1 &\lambda_{j}&\star & \star & \star \\ &&&& & \star & \star & \star\\ &&\mathbb O&& & &\dots & \\ &&&& & \star & \star & \star \end{array}\right) \ . $$
Доказательство. Действительно, $ \mathcal A_{} = \mathcal B_{} +\lambda_{j} \mathcal E_{} $ и тогда $$ \begin{array}{rcl} \mathcal A(Y_1)&=&\mathcal B(Y_1)+\lambda_{j} {\mathcal E}(Y_1)=\lambda_{j} Y_1 + Y_2, \\ \mathcal A(Y_2)&=&\mathcal B(Y_2)+\lambda_{j} {\mathcal E}(Y_2)=\lambda_{j} Y_2 + Y_3, \\ \dots & & \dots \\ \mathcal A(Y_h)&=&\mathcal B(Y_h)+\lambda_{j} {\mathcal E}(Y_h)=\lambda_{j} Y_h, \end{array} $$ ($ \mathcal B(Y_h)=\mathcal B^h(X)=\mathbb O $ поскольку по условию $ X_{} $ — корневой высоты $ h_{} $). ♦
Циклическое подпространство, порожденное корневым вектором оператора $ \mathcal A_{} $, является инвариантным подпространством этого оператора.
Построить ЖНФ и канонический базис для оператора из примера 2.
В настоящем пункте пространство $ \mathbb V_{} $ размерности $ \dim \mathbb V_{} = n $ предполагается вещественным.
☞ ЗДЕСЬ
☞ ЗДЕСЬ
[1]. Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. М.ГИФМЛ. 1960.
[2]. Проскуряков И.В. Сборник задач по линейной алгебре. М.Наука. 1974