Содержание

Жорданова нормальная форма
Источники

Жорданова нормальная форма

Для понимания материалов настоящего раздела рекомендуется ознакомиться с разделом ЛИНЕЙНЫЙ ОПЕРАТОР. Материал настоящего раздела традиционно считается сложным для понимания.

Задача. Найти базис пространства $ \mathbb V_{} $, в котором матрица линейного оператора $ \mathcal A_{} $ имеет наиболее простой вид.

В дальнейшем под выражением оператор понимается исключительно линейный оператор (и линейное пространство $ \mathbb V_{} $ предполагается конечномерным!).

Жорданова нормальная форма над полем комплексных чисел

В настоящем пункте пространство $ \mathbb V_{} $ размерности $ \dim \mathbb V_{} = n $ предполагается комплексным.

Общая схема

В пункте ДИАГОНАЛИЗУЕМОСТЬ МАТРИЦЫ ОПЕРАТОРА было установлено, что если возможно найти базис пространства $ \mathbb V_{} $, состоящий из собственных векторов оператора, то в этом базисе матрица оператора будет диагональной. В частности, существование такого базиса всегда гарантировано в случае, когда характеристический полином оператора $ \mathcal A_{} $ имеет только простые корни: в этом случае система из собственных векторов оператора, принадлежащих различным собственным числам, гарантировано линейно независима. Случай наличия кратных корней $$ f(\lambda)= \det (\mathcal A - \lambda \mathcal E) \equiv (-1)^n(\lambda - \lambda_1)^{{\mathfrak m}_1} \times \dots \times (\lambda - \lambda_{{\mathfrak r}})^{ {\mathfrak m}_{{\mathfrak r}}} \quad ; $$ $$ {\mathfrak m}_1+\dots+{\mathfrak m}_{{\mathfrak r}}=n, \ \lambda_k \ne \lambda_{\ell} \ npu \ k \ne \ell, $$ при хотя бы одном $ {\mathfrak m}_j>1 $ оказывается «пограничным»: оператор может оказаться как диагонализуемым, так и недиагонализуемым.

Стратегия действий: пространство $ \mathbb V_{} $ удается разбить в прямую сумму подпространств $$ \mathbb V_{} =\mathbb V_1 \oplus \dots \oplus \mathbb V_{\mathfrak r}\ , \quad \dim \mathbb V_j={\mathfrak m}_j $$ инвариантных относительно $ \mathcal A_{} $: $ \mathcal A(\mathbb V_j) \subset \mathbb V_j $. При этом $ \mathbb V_j $ обязательно будет включать собственные векторы, принадлежащие $ \lambda_{j} $, но, помимо них — в случае когда алгебраическая кратность собственного числа превосходит его геометрическую кратность: $$ {\mathfrak m}_j > \ell_j = \operatorname{dfc} (\mathcal A - \lambda_j {\mathcal E}) $$ — и другие: так называемые, корневые. На основании теоремы из ☞ ПУНКТА в базисе $ \mathbb V_{} $, составленном объединением базисов $ \mathbb V_j $, матрица оператора будет иметь блочно-диагональный вид $$ \left( \begin{array}{cccc} \mathbf A_1 & \mathbb O & \dots & \mathbb O \\ \mathbb O & \mathbf A_2 & \dots & \mathbb O \\ & & \ddots & \\ \mathbb O & \mathbb O & \dots & \mathbf A_{{\mathfrak r}} \end{array} \right) \quad , \quad \mbox{ здесь } \ \mathbf A_j - \mbox{ матрица порядка }\ {\mathfrak m}_j\times {\mathfrak m}_j \ . $$

Каждый из базисов составляющих $ \mathbb V_{} $ подпространств $ \mathbb V_j $ удается подобрать так, чтобы матрица $ \mathbf A_j $ имела снова блочно-диагональный вид $$ \mathbf A_j= \left( \begin{array}{cccc} {\mathbf A}_{j1} & \mathbb O & \dots & \mathbb O \\ \mathbb O & {\mathbf A}_{j2} & \dots & \mathbb O \\ & & \ddots & \\ \mathbb O & \mathbb O & \dots & {\mathbf A}_{j \ell_j} \end{array} \right) $$ где на диагонали стоят матрицы вида $$ {\mathfrak J}_k (\lambda_j) = \left( \begin{array}{cccccc} \lambda_j & 0 & 0 & \dots & 0 & 0 \\ 1 & \lambda_j & 0 & \dots & 0 & 0 \\ 0 & 1 & \lambda_j & \dots & 0 & 0 \\ \vdots & & \ddots & \ddots& & \vdots \\ 0 & 0 & 0 & \dots & 1 & \lambda_j \end{array} \right)_{k \times k} $$ называемые (нижними) клетками Жордана¹⁾.

Указанный вид матрицы оператора $ \mathcal A $ называется канонической формой Жордана²⁾ или жордановой нормальной формой (ЖНФ), а соответствующий базис пространства — каноническим базисом. Жорданову нормальную форму оператора $ \mathcal A $ будем обозначать $ \mathbf A_{_{\mathfrak J}} $.

§

Частным видом ЖНФ является диагональный:

$$ \mathbf A_{_{\mathfrak J}} = A_{diag}= \left( \begin{array}{cccc} \lambda_1 & 0 & \dots & 0 \\ 0 & \lambda_2 & \dots & 0 \\ & & \ddots & \\ 0 & 0 & \dots & \lambda_n \end{array} \right) \ ; $$ в этом случае все клетки Жордана — первого порядка.

На языке матричного формализма задача построения ЖНФ и канонического базиса может быть переформулирована следующим образом: пусть имеется некоторый исходный базис $ \{X_1,\dots,X_n\} $ пространства $ \mathbb V_{} $, в котором матрица оператора равна $ \mathbf A_{} $. Требуется найти матрицу перехода $ C_{} $ от этого базиса к некоторому новому, обеспечивающую выполнение равенства $$ C^{-1} \mathbf A C = \mathbf A_{_{\mathfrak J}} \ . $$ Про матрицу $ \mathbf A_{_{\mathfrak J}} $ заранее известна лишь та информация, что все ее элементы — нулевые, за исключением разве лишь элементов двух ее диагоналей — главной и следующей за ней вниз.

Очень часто в приложениях ставится задача нахождения формы Жордана $ \mathbf A_{_{\mathfrak J}} $ и матрицы $ C_{} $, связанных с заданной матрицей $ \mathbf A_{} $ последним равенством; при этом напрямую не ассоциируют исходную матрицу $ \mathbf A_{} $ с каким-либо оператором — и вообще с каким-то пространством. С формальной точки зрения, нужно было бы формулировать задачу о каноническом базисе оператора $ X \mapsto \mathbf A \cdot X $ при $ X\in \mathbb C^n $ и исходном базисе пространства, состоящем из векторов $$ \{{\mathfrak e}_j = \big[\underbrace{0,\dots,0,1}_{j},0,\dots,0\big]^{\top} \}_{j=1}^n \ . $$ Однако в примерах, рассмотренных ниже, я буду просто говорить на языке подобных матриц, ставя задачу о приведении матрицы $ \mathbf A_{} $ к ЖНФ.

Даже при формальном совпадении характеристических полиномов двух операторов $ \mathcal A_1 $ и $ \mathcal A_2 $ их жордановы нормальные формы могут быть различными. Однако для каждого оператора ЖНФ определяется единственным образом — с точностью до перестановки клеток Жордана на диагонали.

Аннулирующий полином

Пусть $ g(\lambda),g_1(\lambda),g_2(\lambda) $ — произвольные полиномы над $ \mathbb C_{} $.

Говорят, что операторный полином $ g(\mathcal A) $ — аннулирующий для вектора $ X\in \mathbb V_{} $ если $ g(\mathcal A)(X)=\mathbb O $.

Т

Теорема 1. Множество векторов $ X_{}\in \mathbb V $, аннулируемых $ g(\mathcal A) $, образует линейное подпространство пространства $ \mathbb V_{} $.

Доказательство. Действительно, это множество является ядром оператора $ g(\mathcal A) $ и по теореме 1 из ☞ ПУНКТА, оно является линейным подпространством. ♦

Т

Теорема 2. Если полиномы $ g_1(\lambda) $ и $ g_2(\lambda) $ взаимно просты: $ \operatorname{HOD} (g_1,g_2)=1 $, то подпространства векторов, аннулируемых $ g_1(\mathcal A) $ и $ g_2(\mathcal A) $, имеют тривиальное пересечение.

Доказательство. Если $ \operatorname{HOD} (g_1,g_2)=1 $, то существуют полиномы $ \{ p_1(\lambda),p_2(\lambda)\} \subset \mathbb C[\lambda] $, обеспечивающие выполнение тождества Безу: $$p_1(\lambda)g_1(\lambda)+p_2(\lambda)g_2(\lambda) \equiv 1 \ . $$ Тогда при подстановке в это тождество оператора получим: $$ p_1(\mathcal A)g_1(\mathcal A)+p_2(\mathcal A)g_2(\mathcal A) = \mathcal E \ , $$ где $ \mathcal E $ — тождественный оператор.

Если существует $ X \in \mathbb V_{} $ такой, что $ g_1(\mathcal A)(X)=\mathbb O $ и $ g_2(\mathcal A)(X)=\mathbb O $, то из последнего тождества следует, что $$p_1(\mathcal A)g_1(\mathcal A)(X)+p_2(\mathcal A)g_2(\mathcal A)(X) = \mathcal E(X) \quad \Longrightarrow \mathbb O=X \ . $$ ♦

Т

Теорема 3. Если полиномы $ g_1(\lambda) $ и $ g_2(\lambda) $ взаимно просты и вектор $ X\ne \mathbb O $ аннулируется произведением $ g_1(\mathcal A)g_2(\mathcal A) $, то этот вектор можно представить в виде суммы $ X=X_1+X_2 $, где $ X_{j} $ аннулируется $ g_j(\mathcal A) $.

Доказательство. Воспользуемся равенством из последней теоремы: $$\underbrace{p_1(\mathcal A)g_1(\mathcal A)(X)}_{= X_2}+ \underbrace{p_2(\mathcal A)g_2(\mathcal A)(X)}_{= X_1} = \mathcal E (X)=X \ .$$ Тогда $ g_2(\mathcal A)(X_2)=p_1(\mathcal A)g_1(\mathcal A)g_2(\mathcal A)(X)=p_1(\mathcal A)(\mathbb O)=\mathbb O $, т.е. $ X_2 $ аннулируется $ g_2(\mathcal A) $. Аналогично доказывается, что $ g_1(\mathcal A)(X_1)=\mathbb O $. ♦

=>

Если вектор $ X_{} $ аннулируется произведением

$$ g(\mathcal A)=g_1(\mathcal A)\times \dots \times g_{{\mathfrak r}}(\mathcal A) , $$ где полиномы $ g_1(\lambda),\dots, g_{{\mathfrak r}}(\lambda) $ попарно взаимно просты, то его можно представить в виде суммы $$ X=X_1+\dots+X_{{\mathfrak r}} \ \mbox{ где } X_j \ \mbox{ аннулируется } \ g_j(\mathcal A) . $$

Полином $ g(\lambda) \not\equiv 0 $ называется аннулирующим полиномом оператора $ \mathcal A_{} $, если $ g(\mathcal A)= \mathcal O $.

П

Пример. В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степеней $ \le 3 $ оператор $ \mathcal A_{} $ действует по правилу:

$$ \mathcal A (F(x)) = F(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ т.е. полином $ F_{}(x) $ отображается в остаток от деления произведения $ F(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Найти аннулирующий полином оператора.

Решение. Поскольку про аннулирующий полином $ g(\lambda) $ нам заранее не известна даже его степень, будем искать подбором как его степени (идя по возрастанию), так и его коэффициентов. Пусть $$ g(\lambda) = A_0 + A_1 \lambda+ A_2 \lambda^2+ \dots . $$ Условие $ g(\mathcal A)= \mathcal O $ перепишем в виде $$ A_0 \mathcal E + A_1 \mathcal A+ A_2 \mathcal A^2+ \dots = \mathcal O \ . $$ В примере ☞ ПУНКТА степень оператора $ \mathcal A^K $ вычислялась формулой $$ \mathcal A^k(F(x))=(x^2-2)^K F(x) \pmod{x^4-x^3-x^2+x} \ . $$ Исходя из этого, аннулирующий полином должен обеспечивать выполнение условия $$ ( A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2+ \dots) F(x) \equiv 0 \ \pmod{x^4-x^3-x^2+x} ; $$ причем это тождество должно быть выполнено для любого полинома $ F_{}(x) $. Отсюда следует, что полином $ ( A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2+ \dots) $ должен делиться нацело на $ x^4-x^3-x^2+x $. Для удовлетворения этого требования делаем теперь гипотезу о степени этого полинома и пробуем подобрать коэффициенты. Предположим, что $ \deg g \le 1 $, но такой полином может делиться на полином степени $ 4_{} $ только при условии выполнения равенств $ A_0=0,A_1=0 $; что нас совершенно не интересует. Пусть $ \deg g=2 $, тогда если полином $ A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2 $ делится на полином степени $ 4_{} $, то должен отличаться от делителя только постоянным множителем: $$ A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2 \equiv C (x^4-x^3-x^2+x) \quad npu \quad C \in \mathbb C \ . $$ Легко проверить, что это возможно только в тривиальном случае: $ A_0=0,A_1=0,A_2=0 $. Случай $ \deg g=3 $ требует уже более сложных расчетов: произведем деление с остатком $$ A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2+ A_3 (x^2-2)^3 \equiv $$ $$ \equiv (A_2-4\,A_3)\,x^3+(A_1-3\,A_2+7\,A_3)\,x^2+ $$ $$ +(-A_2+4\,A_3)\,x+A_0-2\,A_1+4\,A_2-8\,A_3 \pmod{x^4-x^3-x^2+x} \ . $$ Остаток будет тождественно равен нулю тогда и только тогда, когда $$ A_2=4\,A_3,\ A_1=5\, A_3,\ A_0=2\, A_3 \ . $$ Эти условия — с точностью, до постоянного сомножителя — определяют аннулирующий полином .

Ответ. Аннулирующим полиномом минимально возможной степени является $ \lambda^3+4\, \lambda^2+ 5\, \lambda+2 $.

Аннулирующий полином оператора $ \mathcal A_{} $ минимально возможной степени называется минимальным аннулирующим полиномом.

Существование хотя бы одного аннулирующего полинома оператора гарантируется теоремой Гамильтона-Кэли: если $ f(\lambda) $ — характеристический полином оператора $ \mathcal A_{} $, то $ f(\mathcal A)={\mathcal O} $. Таким образом, можно утверждать, что для минимального аннулирующего полинома выполняется условие $ \deg g \le \dim \mathbb V $. Предыдущий пример показывает, что это неравенство может оказаться и строгим. Обратим внимание, что для оператора из этого примера характеристический полином равен $ (\lambda+2)(\lambda+1)^3 $ и полученный аннулирующий полином является его делителем: он равен $ (\lambda+2)(\lambda+1)^2 $.

Т

Теорема 4. Аннулирующий полином $ g(\lambda_{}) $ оператора $ \mathcal A_{} $ имеет те же корни, что и характеристический полином этого оператора.

Доказательство от противного. Пусть $ \lambda_{\ast} \in \mathbb C $ — корень характеристического полинома оператора $ \mathcal A_{} $, но $ g(\lambda_{}) $ не имеет $ \lambda_{\ast} $ корнем. Числу $ \lambda_{\ast} $ принадлежит корневой вектор $ \mathfrak X_{\ast} $ высоты $ 1_{} $ (собственный вектор) оператора $ \mathcal A_{} $: $ (\mathcal A- \lambda_{\ast} \mathcal E)(\mathfrak X_{\ast})=\mathbb O $. С другой стороны, поскольку $ \operatorname{HOD}( g(\lambda_{}), \lambda- \lambda_{\ast})=1 $, то, по теореме 2, вектор $ \mathfrak X_{\ast} $ не должен аннулироваться оператором $ g(\mathcal A) $. Однако это противоречит предположению о том, что $ g(\mathcal A) $ — аннулирующий полином оператора. ♦

Т

Теорема 5. Минимальный аннулирующий полином оператора является делителем его характеристического полинома. Два минимальных аннулирующих полинома оператора различаются, разве лишь, постоянным множителем.

Доказательство. Предположим противное: пусть минимальный аннулирующий полином $ g(\lambda) $ не является делителем $ f(\lambda) $. Тогда при делении $ f(\lambda) $ на $ g(\lambda) $ возникает нетривиальный остаток: $$ f(\lambda)\equiv g(\lambda) q(\lambda) + r(\lambda) \quad npu \quad \deg r < \deg g \ . $$ Поскольку $ f(\lambda) $ и $ g(\lambda) $ — аннулирующие для $ \mathcal A $, то и $ r(\lambda)= f(\lambda) - g(\lambda) q(\lambda) $ является аннулирующим. Но это противоречит тому, что, по предположению, $ g(\lambda) $ — минимальный аннулирующий полином.

Если $ \tilde g(\lambda) $ — еще один минимальный аннулирующий полином оператора, то обязательно $ \deg \tilde g = \deg g $. Если предположить, что у полиномов $ g(\lambda) $ и $ \tilde g(\lambda) $ имеются различные сомножители, то полином $ \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) $ будет иметь степень меньшую $ \deg \tilde g = \deg g $. Для $ \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) $ имеет место линейное представление: $$ \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) \equiv p_1(\lambda) g(\lambda) + p_2(\lambda) \tilde g(\lambda) \ \ npu \quad \{p_1(\lambda),p_2(\lambda) \} \subset \mathbb C[\lambda] . $$ Тогда $ \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) $ является аннулирующим полиномом оператора. Но тогда $ g(\lambda) $ и $ \tilde g(\lambda) $ не могут быть минимальными аннулирующими. ♦

Следствиями теорем 4 и 5 является следующий результат.

=>

Минимальный аннулирующий полином оператора $ \mathcal A_{} $ совпадает (с точностью до постоянного сомножителя) с характеристическим полиномом этого оператора при условии отсутствия у этого полинома кратных корней. В общем случае, пусть разложение характеристического полинома оператора имеет вид

$$ f(\lambda)= \det (\mathcal A - \lambda \mathcal E) \equiv (-1)^n(\lambda - \lambda_1)^{{\mathfrak m}_1} \times \dots \times (\lambda - \lambda_{{\mathfrak r}})^{ {\mathfrak m}_{{\mathfrak r}}} \quad ; \quad {\mathfrak m}_1+\dots+{\mathfrak m}_{{\mathfrak r}}=n, \ \lambda_k \ne \lambda_{\ell} \ npu \ k \ne \ell. $$ Минимальный аннулирующий полином имеет вид $$ g(\lambda)=(\lambda-\lambda_1)^{\mathfrak n_1}\times \dots \times (\lambda-\lambda_{\mathfrak r})^{\mathfrak n_{\mathfrak r}} , $$ где показатели $ \{\mathfrak n_j \}_{j=1}^{\mathfrak r} $ могут принимать значения из множеств $ \{\{1,\dots,\mathfrak m_j \}\}_{j=1}^{\mathfrak r} $.

Конструктивное построение минимального аннулирующего полинома произвольного оператора довольно громоздко; структура его линейных множителей напрямую связана со структурой Жордановой нормальной формы. В литературе излагается [2] метод построения ЖНФ на основе информации о минимальном аннулирующем полиноме, но я в дальнейшем не использую эту конструкцию.

Теорема Гамильтона-Кэли эквивалентна равенству $$ (\mathcal A- \lambda_1 \mathcal E)^{{\mathfrak m}_1} \times \dots \times (\mathcal A - \lambda_{{\mathfrak r}}\mathcal E)^{ {\mathfrak m}_{{\mathfrak r}}} = \mathcal O \ . $$ Из следствия к теореме $ 3 $ тогда вытекает, что произвольный вектор $ X_{} \in \mathbb V $ может быть представлен в виде суммы $$X=X_1+\dots+X_{{\mathfrak r}} \ , \qquad \mbox{ где } \ X_j \quad \mbox{ аннулируется } \ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j} \ . $$ и такое представление единственно, т.е. $ \mathbb V_{} $ раскладывается в прямую сумму $$ \mathbb V= \mathbb V_1\oplus \dots \oplus \mathbb V_{{\mathfrak r}} \ , \qquad \mbox{ где } \ \mathbb V_{j} \mbox{ аннулируется } \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j } \ . $$

Т

Теорема 6. Линейное подпространство векторов, аннулируемых $ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j} $, инвариантно относительно $ \mathcal A_{} $.

Доказательство. Действительно, если $$ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j}(X)=\mathbb O \, ,$$ то и $$ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j}(\mathcal A(X))=\mathcal A(\left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j}(X))= \mathbb O \, . $$ ♦

=>

На основании теоремы из ☞ ПУНКТА в базисе $ \mathbb V_{} $, составленном объединением базисов $ \mathbb V_j $, матрица оператора будет иметь блочно-диагональный вид

$$ \left( \begin{array}{cccc} \mathbf A_1 & \mathbb O & \dots & \mathbb O \\ \mathbb O & \mathbf A_2 & \dots & \mathbb O \\ & & \ddots & \\ \mathbb O & \mathbb O & \dots & \mathbf A_{{\mathfrak r}} \end{array} \right) \ . $$ Итак, мы следуем изложенной в начале раздела схеме; остается только подобрать хорошие базисы для самих подпространств $ \mathbb V_j $.

Корневое подпространство

Задача. Построить такой базис подпространства $ \mathbb V_j $, в котором соответствующий блок $ {\mathbf A}_j $ матрицы оператора $ \mathcal A_{} $ будет состоять из клеток Жордана.

Ненулевой вектор $ X_{}\in \mathbb V $ называется корневым вектором оператора $ \mathcal A_{} $, принадлежащим собственному числу $ \lambda_{j}^{} $ если он аннулируется оператором $ (\mathcal A - \lambda_{j} \mathcal E)^k $ при некотором $ k_{}\in \mathbb N $: $ (\mathcal A - \lambda_{j} \mathcal E)^k(X)=\mathbb O $. Наименьший из показателей $ k_{} $ с таким свойством называется высотой корневого вектора $ X_{} $: $$ . \mbox{ Высота }\ (X) = h \iff (\mathcal A - \lambda_{j} \mathcal E)^h(X)=\mathbb O,\ (\mathcal A - \lambda_{j} \mathcal E)^{h-1}(X)\ne \mathbb O \ .$$

П

Пример 1. Любой собственный вектор оператора $ \mathcal A_{} $ будет его корневым высоты $ 1 $.

Рассмотрим теперь пример, разобранный в ☞ ПУНКТЕ.

П

Пример 2. В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степеней $ \le 3 $ оператор $ \mathcal A_{} $ действует по правилу

$$ \mathcal A (f(x)) = F(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ т.е. полином $ F_{}(x) $ отображается в остаток от деления произведения $ F(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Найти корневые векторы этого оператора.

Решение. Оператор имеет два собственных числа $ \lambda_1=-2 $ и $ \lambda_2=-1 $, причем последнее — кратности $ 3_{} $. Корневыми векторами высоты $ 1_{} $ являются собственные векторы, принадлежащие этим собственным числам, т.е. $$ \{ t(x+1)(x-1)^2 \ \mid \ t\ne 0 \} \quad \mbox{ и } \quad \{ (t_1x+t_2)x(x-1) \ \mid \ (t_1,t_2) \ne (0,0) \} \ $$ соответственно.

Далее, ищем корневые векторы высоты $ 2_{} $, принадлежащие собственному числу $ \lambda_1=-2 $. $$ (\mathcal A +2 \, \mathcal E)^2 (F(x))=x^4 F(x) \pmod{x^4-x^3-x^2+x} $$ и наша задача состоит в нахождении полинома $ F_{}(x) $, для которого последнее выражение равно тождественно нулевому полиному. Очевидно, что множество всех таких полиномов $$ \{ t(x^3-x^2-x+1) \ \mid \ t\ne 0 \} $$ совпадает с уже полученным выше множеством собственных векторов (полиномов). Понятно также, что дальнейшее увеличение степени оператора $ (\mathcal A +2 \, \mathcal E) $ иных полиномов не даст. Следовательно, рассматриваемому собственному числу принадлежат только корневые векторы (полиномы) высоты $ 1_{} $.

Для собственного числа $ \lambda_1=-1 $ сценарий оказывается несколько менее тривиальным: $$ (\mathcal A +\mathcal E)^2 (F(x))=(x^2-1)^2 F(x) \pmod{x^4-x^3-x^2+x} \ . $$ Полином $ (x^2-1)^2 F(x) $ делится нацело на $ x(x+1)(x-1)^2 $ при полиноме $$ F_{}(x) \in \{ (u_1x^2+u_2x+u_3)x \mid \ (u_1,u_2,u_3) \in \mathbb R^3 \} \ . $$ Некоторое подмножество этого множества составляют собственные векторы (полиномы): $$ \{ (t_1x+t_2)(x-1)x \ \mid \ (t_1,t_2) \in \mathbb R^2 \} \ \subset \{ (u_1x^2+u_2x+u_3)x \mid \ (u_1,u_2,u_3) \in \mathbb R^3 \} , $$ но появляются и корневые векторы (полиномы) высоты $ 2_{} $. Чтобы понять какие это векторы обратим внимание, что полиномы из левого множества все делятся на $ (x-1) $, т.е. имеют корнем $ 1_{} $. Следовательно высоту $ 2_{} $ будут иметь полиномы $ (u_1x^2+u_2x+u_3)x $, для которых $ 1_{} $ не является корнем, т.е. удовлетворяющие условию $ u_1+u_2+u_3 \ne 0 $.

Если мы попытаемся найти полиномы высоты $ 3_{} $, то нас ожидает неудача — множество решений $ (\mathcal A +\mathcal E)^3 (F(x)) $ совпадает с предыдущим. ♦

П

Пример 3. Найти корневые векторы матрицы

$$ \mathbf A=\left( \begin{array}{rrrrrrrr} 3 & 0 & 1 & 1 & 0 & 1 & -1 & 0 \\ 0 & 3 & -2 & -1 & -1 & -2 & 1 & -1 \\ 2& 3 & 0 & 0 & -2 & -2 & 0 & -2 \\ -3 & -3 & 1 & 1 & 2 & 1 & 1 & 2 \\ -1 & -1 & 0 & 0 & 2 & -1 & 1 & 0 \\ -1 & -1 & 0 & -1 & 1 & 3 & 0 & 1 \\ -1 & -1 & 0 & -1 & 1 & 1 & 2 & 1 \\ 0& 0& 0 & 0 & 0 & 0 & 0 & 2 \end{array} \right) \ . $$

Решение. $ \det (\mathbf A- \lambda E) \equiv ( \lambda -2)^8 $. У матрицы имеется единственное собственное число $ \lambda_1=2 $ алгебраической кратности $ 8_{} $. Составим матрицу $$ \mathbf B=\mathbf A- 2\, E= \left( \begin{array}{rrrrrrrr} 1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\ 0 & 1 & -2 & -1 & -1 & -2 & 1 & -1\\ 2 & 3 & -2 & 0 & -2 & -2 & 0 & -2\\ -3 & -3 & 1 & -1 & 2 & 1 & 1 & 2\\ -1 & -1 & 0 & 0 & 0 & -1 & 1 & 0\\ -1 & -1 & 0 & -1 & 1 & 1 & 0 & 1\\ -1 & -1 & 0 & -1 & 1 & 1 & 0 & 1\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{array} \right) $$ и найдем корневые векторы высоты $ 1_{} $ как решения системы однородных уравнений $ \mathbf B X = \mathbb O $. Методом Гаусса сводим эту систему к $$ \left( \begin{array}{rrrrrrrr} 1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\ 0& 1 & -2 & -1 & -1 & -2 & 1 & -1 \\ 0 & 0 & 2 & 1 & 1 & 2 & -1 & 1\\ 0& 0 & 0 & 1 & -1 & -2 & 1 & -1 \end{array} \right) X = \mathbb O \iff $$ $$ \iff \quad \left\{ \begin{array}{rrrrrrrrr} x_1 & & -x_3 & +x_4 & +x_5 & & & & =0,\\ & x_2 & & & & & & & =0, \\ & & x_3 & +x_4 & & & & & =0,\\ & & & x_4 & -x_5 & -2\,x_6 & +x_7 & -x_8 & = 0. \end{array} \right. $$ Геометрическая кратность собственного числа равна $ 4_{} $. Строим фундаментальную систему решений (ФСР) для этой системы; переменные $ x_5,x_6,x_7,x_8 $ можно взять в качестве основных: $$ \begin{array}{rrrr|rrrr} x_1 & x_2 & x_3 & x_4 & x_5 & x_6 & x_7 & x_8 \\ \hline 0 & 0 & -1 & 1 & 1 & 0 & 0 & 0 \\ -1 & 0 & -2 & 2 & 0 & 1 & 0 & 0 \\ 1 & 0 & 1 & -1 & 0 & 0 & 1 & 0 \\ 0 & 0 & -1 & 1 & 0 & 0 & 0 & 1 \end{array} $$ Таким образом, ФСР состоит из векторов $$ X_1=[0,0,-1,1,1,0,0,0]^{\top},\ X_2=[-1,0,-2,2,0,1,0,0]^{\top},\ $$ $$ X_3=[1,0,1,-1,0,0,1,0]^{\top},\ X_4=[0,0,-1,1,0,0,0,1]^{\top} \ . $$ Любая нетривиальная линейная комбинация $ \alpha_1X_1+\alpha_2X_2+\alpha_3X_3+\alpha_4X_4 $ будет корневым вектором высоты $ 1_{} $.

Теперь отыщем корневые векторы высоты $ 2_{} $. Для этого вычислим матрицу $ \mathbf B^2 $ и решим систему уравнений $ \mathbf B^2 X=\mathbb O $: $$ \left( \begin{array}{rrrrrrrr} 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\ 2 & 1 & 0 & 1 & -1 & 0 & -1 & -1\\ -2 & -1 & 0 & -1 & 1 & 0 & 1 & 1\\ -1 & -1 & 1 & 0 & 1 & 1 & 0 & 1\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{array} \right) X = \mathbb O \quad \iff $$ $$ \iff \quad \left\{ \begin{array}{rrrrrrrrr} x_1 & & +x_3 & +x_4 & & +x_6 & -x_7 & & =0,\\ & x_2 & -2\,x_3 & -x_4 & -x_5 & -2\,x_6 & +x_7 & -x_8 & =0. \end{array} \right. $$ Для этой системы ФСР состоит из $ 6_{} $ векторов и ее можно строить разными способами. Например, ее можно строить дополнением системы корневых векторов высоты $ 1_{} $ — это позволит выделить корневые векторы высоты большей $ 1_{} $. Для того, чтобы организовать такую процедуру пополнения, достаточно перебросить часть переменных, которые были зависимыми при нахождении ФСР в предыдущей системе $ \mathbf B X= \mathbb O $, к основным переменным. Такими переменными можно взять $ x_{3} $ и $ x_{4} $: $$ \begin{array}{rr|rrrrrr} x_1 & x_2 & x_3 & x_4 & x_5 & x_6 & x_7 & x_8 \\ \hline -1 & 2 & 1 & 0 & 0 & 0 & 0 & 0 \\ -1 & 1 & 0 & 1 & 0 & 0 & 0 & 0 \\ \hline 0 & 0 & -1 & 1 & 1 & 0 & 0 & 0 \\ -1 & 0 & -2 & 2 & 0 & 1 & 0 & 0 \\ 1 & 0 & 1 & -1 & 0 & 0 & 1 & 0 \\ 0 & 0 & -1 & 1 & 0 & 0 & 0 & 1 \end{array} $$ Векторы $$ X_5 = [-1, 2, 1, 0, 0, 0, 0, 0]^{\top} \quad u \quad X_6 = [-1, 1, 0, 1, 0, 0, 0, 0]^{\top} $$ являются корневыми векторами высоты $ 2_{} $, и такая же высота будет у любого вектора $$ \alpha_1X_1+\alpha_2X_2+\alpha_3X_3+\alpha_4X_4 + \beta_1 X_5 + \beta_2 X_6 \quad npu \quad \{\alpha_1,\dots,\alpha_4, \beta_1, \beta_2\} \subset \mathbb C, |\beta_1|+ |\beta_2| \ne 0 \ . $$ Далее, для нахождения корневых векторов высоты $ 3_{} $ решим систему $ \mathbf B^3 X=\mathbb O $: $$ \left( \begin{array}{rrrrrrrr} 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\ -1 & 0 & -1 & -1 & 0 & -1 & 1 &0\\ -1 & 0 & -1 & -1 & 0 & -1 & 1 &0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 &0 \end{array} \right) X = \mathbb O \quad \iff $$ $$ \iff \quad x_1+x_3 +x_4+x_6 -x_7 =0 \ . $$ Снова строим ФСР дополнением ранее полученных векторов $ X_1,\dots,X_6 $. В разряд основных переменных переходит $ x_{2} $ и вектором высоты $ 3_{} $ будет $$ X_7=[0,1,0,0,0,0,0,0]^{\top} \ . $$ Очередное возведение в степень матрицы $ \mathbf B $ приводит к нулевой матрице: $ \mathbf B^4=\mathbb O $. Любой вектор $ \mathbb C^8 $ является решением системы $ \mathbf B^4X=\mathbb O $. Вектором высоты $ 4_{} $ возьмем вектор $$ X_8=[1,0,0,0,0,0,0,0]^{\top} \ . $$ Векторов высоты большей $ 4_{} $ у матрицы нет. ♦

Т

Теорема 7. Высота корневого вектора, принадлежащего $ \lambda_{j}^{} $, не превосходит кратности этого числа в характеристическом полиноме (т.е. его алгебраической кратности).

§

В дальнейшем максимально возможную высоту корневого вектора для числа $ \lambda_{j}^{} $ будем обозначать $ \mathfrak h_j $.

Доказательство. Пусть существует вектор $ X_{}\in \mathbb V $ такой, что $$ (\mathcal A - \lambda_j {\mathcal E})^{\mathfrak h_j}(X)=\mathbb O,\quad (\mathcal A - \lambda_j {\mathcal E})^{\mathfrak h_j-1}(X) \ne \mathbb O $$ при $ \mathfrak h_j>{\mathfrak m}_j $. Обозначим $$ \widetilde X = (\mathcal A - \lambda_j {\mathcal E})^{{\mathfrak m}_j}(X),\quad g(\lambda) = f(\lambda)/(\lambda-\lambda_j)^{{\mathfrak m}_j} \ .$$ По определению, вектор $ \widetilde X $ — корневой, принадлежащий $ \lambda_{j}^{} $, высоты $ \mathfrak h_j-{\mathfrak m}_j $. Поскольку $ g(\lambda) $ не имеет корнем $ \lambda_{j}^{} $, то $ \operatorname{HOD} (g(\lambda),(\lambda-\lambda_j)^{\mathfrak h_j-{\mathfrak m}_j})=1 $. По теореме 2: $ g(\mathcal A)(\widetilde X)\ne \mathbb O $. Но тогда $$g(\mathcal A)(\mathcal A - \lambda_j {\mathcal E})^{{\mathfrak m}_j}(X)\ne \mathbb O \Longrightarrow f(\mathcal A)(X)\ne \mathbb O \ ,$$ что противоречит тому, что $ f(\mathcal A)={\mathcal O} $. ♦

Т

Теорема 8. Множество корневых векторов, принадлежащих $ \lambda_{j}^{} $, дополненное нулевым вектором, образует линейное подпространство.

Это подпространство, которое мы выше обозначали $ \mathbb V_{j} $, называется корневым подпространством оператора $ \mathcal A_{} $, принадлежащим данному собственному числу $ \lambda_{j}^{} $.

Т

Теорема 9. Корневые подпространства, принадлежащие различным собственным числам оператора $ \mathcal A_{} $, имеют тривиальное пересечение: $$ \mathbb V_j \bigcap \mathbb V_k = \{ \mathbb O \} \qquad npu \quad \lambda_j \ne \lambda_k \ . $$

Доказательство. Следствие теоремы 2. ♦

Т

Теорема 10. Пространство $ \mathbb V_{} $ раскладывается в прямую сумму корневых подпространств оператора $ \mathcal A $: $$\mathbb V=\mathbb V_1 \oplus \dots \oplus \mathbb V_{{\mathfrak r}}\ . $$

Для построения базиса корневого подпространства $ \mathbb V_{j} $ выделим в нем подпространства корневых векторов высот $ \le s $: $$ \mathbb Q_s = \mathcal{K}er (\mathcal A-\lambda_{j} \, {\mathcal E})^s \ , \ \mathbb Q_0 = \{\mathbb O\} \ .$$ Понятно, что имеет место вложенность $$\mathbb Q_0 \subset \mathbb Q_1 \subset \dots \subset \mathbb Q_{\mathfrak h_j} = \mathbb V_j \ .$$

Т

Теорема 11. Если векторы $ X_1,\dots,X_k $ принадлежат $ \mathbb Q_s $ и линейно независимы относительно $ \mathbb Q_{s-1} $, то векторы $ (\mathcal A - \lambda_j {\mathcal E})(X_1),\dots, (\mathcal A - \lambda_j {\mathcal E})(X_k) $ принадлежат $ \mathbb Q_{s-1} $ и линейно независимы относительно $ \mathbb Q_{s-2} $.

Доказательство. Если $ X\in \mathbb Q_s $ то $ (\mathcal A - \lambda_j {\mathcal E})^s(X)=\mathbb O $, т.е. $$(\mathcal A - \lambda_j {\mathcal E})^{s-1}\left( (\mathcal A - \lambda_j {\mathcal E})(X) \right)=\mathbb O \ ,$$ но это и означает, что $ (\mathcal A - \lambda_j {\mathcal E})(X) \in \mathbb Q_{s-1} $.

Предположим теперь, что существуют скаляры $ c_1,\dots,c_k $ такие, что $$ \begin{array}{ccc} &c_1 (\mathcal A - \lambda_j {\mathcal E})(X_1)+\dots+c_k (\mathcal A - \lambda_j {\mathcal E})(X_k) \in \mathbb Q_{s-2}& \iff \\ \iff (\mathcal A - \lambda_j {\mathcal E})^{s-2} &\left(c_1 (\mathcal A - \lambda_j {\mathcal E})(X_1)+\dots +c_k (\mathcal A - \lambda_j {\mathcal E})(X_k) \right)=\mathbb O \quad \ & \iff \\ \iff (\mathcal A - \lambda_j {\mathcal E})^{s-1}& \left(c_1X_1+\dots +c_k X_k \right) = \mathbb O \ \qquad \Rightarrow \quad c_1X_1+\dots +c_k X_k \in \mathbb Q_{s-1} \ . & \end{array} $$ По условию теоремы последнее соотношение возможно только при $ c_1=0,\dots, c_k=0 $. ♦

Алгоритм построения базиса корневого подпространства

§

Чтобы не усложнять индексы, всюду в алгоритме полагаем $ \mathfrak h = \mathfrak h_j $.

0. Считаем, что на этом этапе построены базисы всех подпространств $ \mathbb Q_1, \mathbb Q_2,\dots, \mathbb Q_{\mathfrak h} $. При этом базис каждого подпространства $ \mathbb Q_s $ при $ s\in \{2,\dots,\mathfrak h\} $ получен дополнением базиса подпространства $ \mathbb Q_{s-1} $. Обозначим $$ \mathcal B = \mathcal A - \lambda_j {\mathcal E} \quad, k_1 = \dim \mathbb Q_1,\ k_{s} = \dim \mathbb Q_s- \dim \mathbb Q_{s-1} \quad npu \quad s\in \{2,\dots,\mathfrak h\} ; $$ таким образом, $ k_{s} $ — число векторов относительного базиса $ \mathbb Q_s $ над $ \mathbb Q_{s-1} $. Число $ k_1+k_2+\dots+k_{_{\mathfrak h_j}} $ равно алгебраической кратности, а число $ k_{1} $ равно геометрической кратности собственного числа $ \lambda_{j} $: $$ k_1+k_2+\dots+k_{_{\mathfrak h_j}}= \mathfrak m_j= \dim \mathbb V_j,\ k_1= \ell_j= \operatorname{dfc} \left( \mathcal A - \lambda_j {\mathcal E} \right) \ . $$

Для визуализации последующего алгоритма построения канонического базиса удобно представить результаты этого этапа в виде схемы:

Мы наблюдаем разноэтажное здание, число квартир на каждом этаже которого не превосходит числа квартир на предыдущем. В ходе дальнейшего алгоритма, часть «жильцов» останется на месте, а часть может быть замещена другими.

1. Выберем $ Y_{1},\dots,Y_{k_{_{\mathfrak h}}} $ — относительный базис³⁾ $ \mathbb Q_{\mathfrak h}=\mathbb V_j $ над $ \mathbb Q_{\mathfrak h-1} $.

2. По теореме 11 векторы $ \mathcal B(Y_{1}),\dots,\mathcal B(Y_{k_{_{\mathfrak h}}}) $ принадлежат $ \mathbb Q_{\mathfrak h-1} $ и л.н.з. относительно $ \mathbb Q_{\mathfrak h-2} $. Если $ k_{\mathfrak h}=k_{\mathfrak h-1} $ то переходим к шагу 3 , в противном случае дополним полученные векторы до относительного базиса $ \mathbb Q_{\mathfrak h-1} $ над $ \mathbb Q_{\mathfrak h-2} $: пусть система $$\mathcal B(Y_{1}), \dots,\mathcal B(Y_{k_{\mathfrak h}}),Y_{k_{\mathfrak h}+1},\dots, Y_{k_{(\mathfrak h-1)}}$$ является этим базисом.

3. По теореме 11 векторы $$\mathcal B^2(Y_{1}), \dots,\mathcal B^2(Y_{k_{\mathfrak h}}),\mathcal B(Y_{k_{\mathfrak h}+1}),\dots, \mathcal B(Y_{k_{_{(\mathfrak h-1)}}})$$ принадлежат $ \mathbb Q_{\mathfrak h-2} $ и л.н.з. относительно $ \mathbb Q_{\mathfrak h-3} $. Если $ k_{\mathfrak h-1}=k_{\mathfrak h-2} $ то переходим к шагу 4 , в противном случае дополним эти векторы до относительного базиса $ \mathbb Q_{\mathfrak h-2} $ над $ \mathbb Q_{\mathfrak h-3} $.

4. Продолжаем процесс…

...

h - 1. $ \dots $

h. Действуем оператором $ \mathcal B $ на векторы, полученные на предыдущем шаге: $$ \mathcal B^{\,\mathfrak h-1}(Y_{1}), \dots,\mathcal B^{\,\mathfrak h-1}(Y_{k_{\mathfrak h}}),\mathcal B^{\,\mathfrak h-2}(Y_{k_{\mathfrak h}+1}),\dots,\mathcal B^{\,\mathfrak h-2}(Y_{k_{_{(\mathfrak h-1)}}}),\dots, \mathcal B(Y_{k_{_3}+1}),\dots,\mathcal B(Y_{k_{_2}}) . $$ Получившиеся векторы принадлежат $ \mathbb Q_1 $ и л.н.з. относительно $ \mathbb Q_{0} $, т.е. линейно независимы в обычном понимании. Если $ k_{2}=k_{1} $, то процесс заканчивается. В противном случае дополним эти векторы до базиса $ \mathbb Q_1 $: пусть $$ \begin{array}{ccc} & \mathcal B^{\,\mathfrak h-1}(Y_{1}), \dots,\mathcal B^{\,\mathfrak h-1}(Y_{k_{\mathfrak h}}),\mathcal B^{\,\mathfrak h-2}(Y_{k_{\mathfrak h}+1}),\dots,\mathcal B^{\,\mathfrak h-2}(Y_{k_{_{(\mathfrak h-1)}}}),\dots, & \\ & \qquad \dots, \quad \mathcal B(Y_{k_{_3}+1}),\dots,\mathcal B(Y_{k_{_2}}), Y_{k_{_2}+1},\dots, Y_{k_{1}} & \end{array} $$ этот базис.

Базис $ \mathbb V_{j} $ получается объединением всех векторов, полученных в алгоритме. Действительно, $$ .\mbox{ базис } \ \mathbb Q_2 = \big\{ \mbox{ базис } \ \mathbb Q_1 \big\} \bigcup \big\{ \mbox{ относит. базис } \ \mathbb Q_2 \ \mbox{ над } \ \mathbb Q_1 \big\} \ , $$ $$ .\mbox{ базис } \mathbb Q_3 = \big\{ \mbox{ базис } \ \mathbb Q_2 \big\} \bigcup \big\{ \mbox{ относит. базис } \ \mathbb Q_3 \ \mbox{ над } \ \mathbb Q_2 \big\} \ , $$ $$ \dots \qquad \dots $$ $$ .\mbox{ базис } \underbrace{\mathbb Q_{_{\mathfrak h}}}_{=\mathbb V_j} = \big\{ \mbox{ базис } \ \mathbb Q_{\mathfrak h-1} \big\} \bigcup \big\{ \mbox{ относит. базис } \ \mathbb Q_{\mathfrak h} \ \mbox{ над } \ \mathbb Q_{\mathfrak h-1} \big\} \ . $$

Структура жордановой нормальной формы оператора $ \mathcal A_{} $

В ЖНФ оператора $ \mathcal A_{} $ собственному числу $ \lambda_{j} $ соответствует $ k_{1} $ клеток Жордана. Они имеют следующую структуру:

$ k_{\mathfrak h} $ клеток порядка $ \mathfrak h $;
$ k_{\mathfrak h-1}-k_{\mathfrak h} $ клеток порядка $ \mathfrak h-1 $;
$ k_{\mathfrak h-2}-k_{\mathfrak h-1} $ клеток порядка $ \mathfrak h-2 $;
$ \dots $;
$ k_1- k_2 $ клеток порядка $ 1_{} $.

Пусть эти клетки расположены на диагонали ЖНФ по убыванию их порядков: $$ \underbrace{{\mathfrak J}_{\mathfrak h} (\lambda_j), \dots, {\mathfrak J}_{\mathfrak h} (\lambda_j)}_{k_{\mathfrak h}}, \underbrace{{\mathfrak J}_{\mathfrak h-1} (\lambda_j),\dots, {\mathfrak J}_{\mathfrak h-1} (\lambda_j)}_{k_{\mathfrak h-1}-k_{\mathfrak h}},\dots, \underbrace{{\mathfrak J}_{2} (\lambda_j),\dots, {\mathfrak J}_{2} (\lambda_j)}_{k_2- k_3}, \underbrace{{\mathfrak J}_{1} (\lambda_j),\dots, {\mathfrak J}_{1} (\lambda_j)}_{k_1- k_2} \ . $$

Структура соответствующего канонического базиса

В каноническом базисе корневые векторы, соответствующие указанной последовательности клеток, следует упорядочить по следующему правилу:

1. Векторы канонического базиса, соответствующие подпоследовательности клеток Жордана максимального порядка $ \mathfrak h $ в ЖНФ, берутся в следующей последовательности: $$ Y_1, \mathcal B(Y_1), \dots, \mathcal B^{\mathfrak h -1}(Y_1), \dots, Y_{k_{\mathfrak h}}, \mathcal B (Y_{k_{\mathfrak h}}), \dots, \mathcal B^{\mathfrak h -1}(Y_{k_{\mathfrak h}}) . $$ Если обратиться к схеме построения относительных базисов подпространств, то предложенный алгоритм упорядочивания векторов канонического базиса иллюстрируется следующим образом: сначала мы «выселяем из квартир» всех жильцов, которые жили в них в пункте алгоритма за номером 0 (см. схему выше), кроме тех, кто живет на самом верхнем — $ \mathfrak h $-м — этаже. Начинаем заселение квартир, идя по стоякам сверху вниз. Квартиранты верхней квартиры «размножаются» с заселением нижних квартир, но строго в том же стояке. Как только заселяем весь стояк вплоть до первого этажа, переходим к соседнему стояку и снова начинаем «заселение» с самой верхней квартиры.

2. Когда все $ k_{\mathfrak h} $ стояков (их еще называют «башнями») максимальной высоты $ \mathfrak h $ заселены, ищем стояки высоты $ \mathfrak h-1 $. Их может вовсе не оказаться (если $ k_{\mathfrak h-1}= k_{\mathfrak h} $). Но если хотя бы один имеется, то мы позволяем заселиться во все оставшиеся квартиры $ (\mathfrak h-1) $-го этажа тем жильцам, которые жили на этом этаже до выселения — корневым векторам высоты $ \mathfrak h-1 $, т.е. жильцов выбираем среди $ X_{\mathfrak h-1,1},\dots, X_{\mathfrak h-1,k_{_{(\mathfrak h-1)}}} $. При одном дополнительном ограничении: «заселяются» только такие «старые» корневые векторы, которые вместе с «новосёлами» на этом этаже — векторами $ \mathcal B(Y_1), \dots, B (Y_{k_{\mathfrak h}}) $ — образуют относительный базис $ \mathbb Q_{\mathfrak h-1} $ над $ \mathbb Q_{\mathfrak h-2} $. Количество таких векторов равно $ k_{\mathfrak h-1} - k_{\mathfrak h} $, и мы их обозначаем $ Y_{k_{\mathfrak h}+1},\dots, Y_{k_{(\mathfrak h-1)}} $. Каждый из них порождает заселение целого стояка — по образу и подобию сценария предыдущего пункта. Векторы, взятые в порядке $$ Y_{k_{\mathfrak h}+1}, \mathcal B(Y_{k_{\mathfrak h}+1}),\dots, \mathcal B^{\mathfrak h-2}(Y_{k_{\mathfrak h}+1}), \dots, Y_{k_{(\mathfrak h-1)}}, \mathcal B(Y_{k_{(\mathfrak h-1)}}),\dots, \mathcal B^{\mathfrak h-2}(Y_{k_{(\mathfrak h-1)}}) $$ — это следующие векторы канонического базиса, соответствующие подпоследовательности клеток порядка $ \mathfrak h-1 $ в ЖНФ.

3. $ \dots $

...

h. Если в ходе предшествующих стадий заселения еще имеются свободные квартиры на $ 1_{} $-м этаже ($ k_1>k_2 $), то в них заселяются корневые векторы высоты $ 1_{} $, т.е. собственные векторы оператора $ \mathcal A_{} $. Лишь бы только эти векторы, обозначенные нами $ Y_{_{k_2+1}},\dots, Y_{_{k_1}} $, оказались линейно независимыми с уже заселившимися, т.е. чтобы все жильцы первого этажа образовывали бы базис $ \mathbb Q_1 $. Эти векторы соответствуют клеткам Жордана порядка $ 1_{} $, т.е., фактически, просто последовательности из $ k_2-k_1 $ чисел $ \lambda_j,\dots,\lambda_j $, стоящих на главной диагонали ЖНФ.

§

Объяснение необходимости перестановки векторов канонического базиса — почему они нумеруются по правилу «сверху вниз», а не поэтажно — дается в следующем ПУНКТЕ.

П

Пример 3 (окончание). Построить ЖНФ и канонический базис пространства для оператора из примера 3.

Решение. В этом примере корневое пространство единственно, поскольку единственно собственное число $ \lambda_1=2 $. Далее, максимальная высота корневого вектора $ \mathfrak h_1 = 4 $, а соответствующие подпространства $ \{\mathbb Q_j\}_{j=1}^4 $ имеют вид: $$ \begin{array}{lcl} \mathbb Q_1 &=& \mathcal L (X_1,X_2,X_3,X_4), \\ \mathbb Q_2 &=& \mathcal L (X_1,X_2,X_3,X_4,X_5,X_6),\\ \mathbb Q_3 &=& \mathcal L (X_1,X_2,X_3,X_4,X_5,X_6,X_7), \\ \mathbb Q_4 &=& \mathcal L (X_1,X_2,X_3,X_4,X_5,X_6,X_7,X_8) \ ; \end{array} $$ в обозначениях алгоритма имеем: $$ k_1=4, k_2=2, k_3=1, k_4=1 \ . $$ Начинаем строить канонический базис согласно алгоритму. Первым делом, выбираем векторы относительного базиса $ \mathbb Q_4 $ над $ \mathbb Q_3 $. Такой вектор единствен — это $$ X_8 = [1,0,0,0,0,0,0,0]^{\top} \ .$$ Далее, согласно пункту 2 , вектор $$ \mathbf B X_8 =[1,0,2,-3,-1,-1,-1,0]^{\top} $$ принадлежит $ \mathbb Q_3 $ и линейно независим относительно $ \mathbb Q_2 $. Поскольку $ k_3=1 $, то больше векторов в относительный базис $ \mathbb Q_3 $ над $ \mathbb Q_2 $ добавлять не нужно. Переходим к пункту 3 алгоритма: вычисляем $$ \mathbf B^2 X_8 =[0,1,2,-2,-1,0,0,0]^{\top} \ . $$ Этот вектор принадлежит $ \mathbb Q_2 $ и линейно независим относительно $ \mathbb Q_1 $. Поскольку $ k_2=2 $, то можно подобрать еще один вектор из относительного базиса $ \mathbb Q_2 $ над $ \mathbb Q_1 $. Какой из векторов $$ X_5 = [-1, 2, 1, 0, 0, 0, 0, 0]^{\top} \quad \mbox{ или } \quad X_6 = [-1, 1, 0, 1, 0, 0, 0, 0]^{\top} \ , $$ полученных в ходе построения базиса $ \mathbb Q_2 $, следует взять? — В данном конкретном примере это не имеет значения, поскольку проверка условия базисности $$ \operatorname{rank} \{ \mathbf B^2 X_8, X_5, X_1,X_2,X_3,X_4 \} = \operatorname{rank} \{ \mathbf B^2 X_8, X_6, X_1,X_2,X_3,X_4 \}= 6 $$ выполняется для обоих векторов.

Если ввести в базис вектор $ X_5 $, то в следующем, 4 -м, шаге алгоритма получим систему векторов $$ \mathbf B^3 X_8 = [0,0,1,-1,-1,0,0,0]^{\top}, \ \mathbf B X_5 =[0,0,2,-2,-1,-1,-1,-1,0]^{\top} \ . $$ Если все вычисления проделаны правильно, то полученные векторы должны быть собственными для матрицы $ \mathbf A_{} $, т.е. линейно выражаться через векторы $$ X_1=[0,0,-1,1,1,0,0,0]^{\top},\ X_2=[-1,0,-2,2,0,1,0,0]^{\top}, $$ $$ \ X_3=[1,0,1,-1,0,0,1,0]^{\top},\ X_4=[0,0,-1,1,0,0,0,1]^{\top} \ . $$ В самом деле, $ \mathbf B^3 X_8=-X_1 $, $ \mathbf B X_5=-X_1-X_2-X_3 $. Следовательно, в дополнение к векторам $ \mathbf B^3 X_8 $ и $ \mathbf B X_5 $ в базис пространства $ \mathbb Q_1 $ можно выбрать, например, векторы $ X_2, X_4 $.

Канонический базис пространства состоит, например, из векторов $$ X_8, \mathbf B X_8, \mathbf B^2 X_8, X_5, \mathbf B^3 X_8, \mathbf B X_5,X_2, X_4 \ ; $$ однако эти векторы требуется определенным образом переставить местами. Сначала определяем структуру ЖНФ оператора. В соответствии с алгоритмом имеем ее в виде $$ \mathbf A_{_{\mathfrak J}} = \left(\begin{array}{cccc|cc|c|c} 2 & & & & & & & \\ 1 & 2 & & & & & & \\ & 1 & 2 & & & & & \\ & & 1 & 2 & & & & \\ \hline & & & & 2 & & &\\ & & & & 1 & 2 & & \\ \hline & & & & & & 2 & \\ \hline & & & & & & & 2 \end{array} \right) $$ (все неуказанные элементы равны $ 0_{} $).

В соответствии с этой формой найденные выше корневые векторы следует переставить следующим образом: $$ X_8, \mathbf B X_8, \mathbf B^2 X_8, \mathbf B^3 X_8, X_5, \mathbf B X_5,X_2, X_4 \ . $$ Матрица $$ C=\left(\begin{array}{rrrrrrrr} 1 & 1 & 0 & 0 & -1 & 0 & -1 & 0\\ 0 & 0 & 1 & 0 & 2 & 0 & 0 & 0\\ 0 & 2 & 2 & 1 & 1 & 2 & -2 & -1\\ 0 & -3 & -2 & -1 & 0 & -2 & 2 & 1\\ 0 & -1 & -1 & -1 & 0 & -1 & 0 & 0\\ 0 & -1 & 0 & 0 & 0 & -1 & 1 & 0\\ 0 &-1 & 0 & 0 & 0 & -1 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 \end{array} \right) $$ приводит матрицу $ \mathbf A_{} $ к указанной форме Жордана: $ C^{-1} \mathbf A C = \mathbf A_{_{\mathfrak J}} $. ♦

Циклическое подпространство

Для завершения исследования нам осталось только выяснить причину, по которой в алгоритме построения канонического базиса из предыдущего пункта, начиная с определенного места, был изменен принцип нумерации получившейся системы корневых векторов. А для этого следует выяснить, каким образом преобразуются векторы построенного базиса под действием оператора $ \mathcal A_{} $.

Пусть в пространстве $ \mathbb V_{} $ действует оператор $ \mathcal B $. Для любого $ X\in\mathbb V $ построим минимально возможное инвариантное подпространство оператора $ \mathcal B $, содержащее $ X_{} $. Рассмотрим последовательность $$ X, \mathcal B (X),\mathcal B(\mathcal B(X))=\mathcal B^2(X), \dots, $$ и продолжим ее до тех пор, пока не возникнет линейная зависимость.

Т

Теорема 12. Пусть система

$$ \{ X, \mathcal B(X), \ldots, \mathcal B^{k-1}(X) \} $$ еще линейно независима, в то время как система $$ \{X, \mathcal B(X), \ldots, \mathcal B^{k-1}(X),\mathcal B^k(X) \} $$ уже линейно зависима. Тогда линейная оболочка системы векторов $ \{X, \mathcal B(X),\ldots,\mathcal B^{k-1}(X) \} $ $$ \widetilde{\mathbb V}= {\mathcal L}(X,\mathcal B(X),\ldots,\mathcal B^{k-1}(X)) $$ является инвариантным подпространством оператора $ \mathcal B $. При этом $ \widetilde{\mathbb V} $ будет минимальным инвариантным подпространством, содержащим $ X_{} $, т.е. если $ \widetilde{\widetilde{\mathbb V}} $ — произвольное инвариантное подпространство, содержащее $ X_{} $, то $ \widetilde{\widetilde{\mathbb V}}\supset \widetilde{\mathbb V} $.

Доказательство. Рассмотрим произвольный вектор из $ \widetilde{\mathbb V} $: $$ Y=c_1X+c_2\mathcal B(X)+\ldots+c_k\mathcal B^{k-1}(X) $$ применим к нему оператор $ \mathcal B $: $$ \mathcal B(Y)=c_1\mathcal B(X)+c_2\mathcal B^2(X)+\ldots+c_k\mathcal B^k(X) \ . $$ По условию теоремы вектор $ \mathcal B^k(X) $ линейно выражается через векторы системы $ \{ X, \mathcal B(X), \ldots, \mathcal B^{k-1}(X) \} $: $$ \mathcal B^k(X)=-\alpha_1X-\alpha_{2}\mathcal B(X)-\ldots-\alpha_{k}\mathcal B^{k-1}(X) \ . $$ Тогда $$ \mathcal B(Y)-\alpha_1 c_k X+(c_1-\alpha_2 c_k)\mathcal B(X)+ \dots+(c_{k-1}-\alpha_k c_k)\mathcal B^{k-1}(X) \ \in \widetilde{\mathbb V} $$ т.к. все слагаемые принадлежат $ \widetilde{\mathbb V} $. По определению подпространство $ \widetilde{\mathbb V} $ является инвариантным для оператора $ \mathcal B $.

Если $ \widetilde{\widetilde{\mathbb V}} $ — еще какое-то инвариантное подпространство, содержащее $ X_{} $, то оно должно содержать и $ \mathcal B(X) $, но тогда — и $ \mathcal B(\mathcal B(X))=\mathcal B^2(X) $ и т.д., а, значит, и $ \widetilde{\mathbb V} $. ♦

При числе $ k_{} $ из условия теоремы, подпространство $$ \widetilde{\mathbb V}= {\mathcal L}(X,\mathcal B(X),\ldots,\mathcal B^{k-1}(X)) $$ называется циклическим подпространством, порожденным вектором $ X_{} $.

Вернемся теперь к задаче построения канонического базиса оператора $ \mathcal A_{} $.

Т

Теорема 13. Пусть $ X_{} $ — произвольный корневой вектор оператора $ \mathcal A_{} $, принадлежащий собственному числу $ \lambda^{}_{j} $; пусть высота этого вектора равна $ h_{} $. Рассмотрим оператор $ \mathcal B=\mathcal A-\lambda_{j} {\mathcal E} $ и его циклическое подпространство, порожденное вектором $ X_{} $. Векторы

$$Y_1=X,\, Y_2=\mathcal B(Y_1)=\mathcal B(X),\, Y_3=\mathcal B(Y_2)=\mathcal B^2(X), \ldots , Y_h=\mathcal B(Y_{h-1})= \mathcal B^{\,h-1}(X) $$ образуют базис этого подпространства. В базисе пространства $ \mathbb V_{} $, составленном дополнением этих векторов, матрица оператора $ \mathcal A_{} $ имеет вид: $$ \left(\begin{array}{cccccccc} \lambda_{j}&0&0 &\ldots&0&\star & \star & \star\\ 1&\lambda_{j}&0 & \ldots&0&\star & \star & \star\\ 0&1&\lambda_{j} & &0&\star & \star & \star\\ \vdots && \ddots &\ddots & &&& \vdots \\ 0&0 &\dots& 1 &\lambda_{j}&\star & \star & \star \\ &&&& & \star & \star & \star\\ &&\mathbb O&& & &\dots & \\ &&&& & \star & \star & \star \end{array}\right) \ . $$

Доказательство. Действительно, $ \mathcal A_{} = \mathcal B_{} +\lambda_{j} \mathcal E_{} $ и тогда $$ \begin{array}{rcl} \mathcal A(Y_1)&=&\mathcal B(Y_1)+\lambda_{j} {\mathcal E}(Y_1)=\lambda_{j} Y_1 + Y_2, \\ \mathcal A(Y_2)&=&\mathcal B(Y_2)+\lambda_{j} {\mathcal E}(Y_2)=\lambda_{j} Y_2 + Y_3, \\ \dots & & \dots \\ \mathcal A(Y_h)&=&\mathcal B(Y_h)+\lambda_{j} {\mathcal E}(Y_h)=\lambda_{j} Y_h, \end{array} $$ ($ \mathcal B(Y_h)=\mathcal B^h(X)=\mathbb O $ поскольку по условию $ X_{} $ — корневой высоты $ h_{} $). ♦

=>

Циклическое подпространство, порожденное корневым вектором оператора $ \mathcal A_{} $, является инвариантным подпространством этого оператора.

Канонический базис и, следовательно, матрица перехода $ C_{} $ определяются не единственным способом. Поэтому актуальна проверка правильности вычислений. Такая проверка может быть проведена — для матричного случая — посредством проверки более простого условия: $$ {\mathbf A}C=C{\mathbf A}_{_{\mathfrak J}} \ . $$ Следует, тем не менее, иметь в виду, что последнее условие является необходимым, но не достаточным. Так, справедливо равенство $$ \underbrace{\left( \begin{array}{rrr} 0 & -1 & 1 \\ 2 & -5 & 3 \\ 6 & -13 & 7 \end{array} \right)}_{{\mathbf A}} \underbrace{\left( \begin{array}{rrr} 1 & 1 & 1 \\ 1 & 1 & 2 \\ 1 & 1 & 4 \end{array} \right)}_{C_1}=\underbrace{\left( \begin{array}{rrr} 1 & 1 & 1 \\ 1 & 1 & 2 \\ 1 & 1 & 4 \end{array} \right)}_{C_1} \left( \begin{array}{rrr} 0 & & \\ & 0 & \\ & & 2 \end{array} \right) $$ тем не менее истинная ЖНФ матрицы $ {\mathbf A} $ недиагональна: $$ {\mathbf A}_{_{\mathfrak J}}= \left( \begin{array}{rrr} 0 & & \\ 1 & 0 & \\ & & 2 \end{array} \right) \quad npu \quad C_2=\left( \begin{array}{rrr} 0 & 1 & 1 \\ 1 & 1 & 2 \\ 2 & 1 & 4 \end{array} \right) \ . $$ Объяснение этой кажущейся неоднозначности заключается в том, что матрица $ C_1 $ является вырожденной: $ \det C_1=0 $, и $ C_1^{-1} $ не существует.

?

Построить ЖНФ и канонический базис для оператора из примера 2.

Жорданова нормальная форма над полем вещественных чисел

В настоящем пункте пространство $ \mathbb V_{} $ размерности $ \dim \mathbb V_{} = n $ предполагается вещественным.

Примеры

☞ ЗДЕСЬ

Задачи

☞ ЗДЕСЬ

Источники

[1]. Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. М.ГИФМЛ. 1960.

[2]. Проскуряков И.В. Сборник задач по линейной алгебре. М.Наука. 1974

¹⁾

(англ.) Jordan block.

²⁾

Жордан Камилл (Jordan Marie Ennemond Camille, 1838–1922) — французский математик. Биография ☞ ЗДЕСЬ. Не следует путать его с немецким геодезистом Вильгельмом Йорданом (Jordan Wilhelm,1842-1899), известному по методу Гаусса-Йордана решения систем линейных уравнений и обращения матрицы.

³⁾

В предыдущей схеме векторы были обозначены $ X_{\mathfrak h,1},\dots, X_{\mathfrak h, k_{_{\mathfrak h}}} $, но мне не хочется в дальнейшем возиться с двойными индексами.

VMath

Основное

Навигация

Информация

Действия

Содержание

Жорданова нормальная форма

Жорданова нормальная форма над полем комплексных чисел

Общая схема

Аннулирующий полином

Корневое подпространство

Алгоритм построения базиса корневого подпространства

Циклическое подпространство

Жорданова нормальная форма над полем вещественных чисел

Примеры

Задачи

Источники

VMath

Инструменты сайта

Основное

Навигация

Информация

Действия

Содержание

Жорданова нормальная форма

Жорданова нормальная форма над полем комплексных чисел

Общая схема

Аннулирующий полином

Корневое подпространство

Алгоритм построения базиса корневого подпространства

Циклическое подпространство

Жорданова нормальная форма над полем вещественных чисел

Примеры

Задачи

Источники