==Жорданова нормальная форма==
Для понимания материалов настоящего раздела рекомендуется ознакомиться с разделом
((:mapping:operator ЛИНЕЙНЫЙ ОПЕРАТОР)). Материал настоящего раздела традиционно считается сложным для понимания.
**Задача.** Найти базис пространства $ \mathbb V_{} $, в котором матрица линейного оператора
$ \mathcal A_{} $ имеет наиболее простой вид.
В дальнейшем под выражением //оператор// понимается исключительно линейный оператор (и линейное пространство $ \mathbb V_{} $ предполагается конечномерным!).
===Жорданова нормальная форма над полем комплексных чисел==
В настоящем пункте пространство $ \mathbb V_{} $ размерности $ \dim \mathbb V_{} = n $ предполагается комплексным.
====Общая схема==
В пункте ((:mapping:operator#диагонализуемость_матрицы_оператора ДИАГОНАЛИЗУЕМОСТЬ МАТРИЦЫ ОПЕРАТОРА)) было установлено, что если возможно найти базис пространства $ \mathbb V_{} $,
состоящий из собственных векторов оператора, то в этом базисе матрица оператора будет диагональной. В частности, существование такого базиса всегда гарантировано в случае, когда ((:mapping:operator#собственное_число_и_собственный_вектор характеристический полином оператора)) $ \mathcal A_{} $ имеет только простые корни: в этом случае система из собственных векторов оператора, принадлежащих различным собственным числам, гарантировано линейно независима. Случай наличия кратных корней
$$
f(\lambda)= \det (\mathcal A - \lambda \mathcal E) \equiv (-1)^n(\lambda - \lambda_1)^{{\mathfrak m}_1} \times
\dots \times (\lambda - \lambda_{{\mathfrak r}})^{ {\mathfrak m}_{{\mathfrak r}}} \quad ;
$$
$$
{\mathfrak m}_1+\dots+{\mathfrak m}_{{\mathfrak r}}=n, \ \lambda_k \ne
\lambda_{\ell} \ npu \ k \ne \ell,
$$
при хотя бы одном $ {\mathfrak m}_j>1 $ оказывается "пограничным": оператор может оказаться как диагонализуемым, так и недиагонализуемым.
Стратегия действий: пространство $ \mathbb V_{} $ удается разбить в прямую сумму подпространств
$$
\mathbb V_{} =\mathbb V_1 \oplus \dots \oplus \mathbb V_{\mathfrak r}\ , \quad \dim \mathbb V_j={\mathfrak m}_j
$$
((:mapping:operator#инвариантное_подпространство инвариантных относительно)) $ \mathcal A_{} $: $ \mathcal A(\mathbb V_j) \subset
\mathbb V_j $. При этом $ \mathbb V_j $ обязательно будет включать собственные векторы,
принадлежащие $ \lambda_{j} $, но, помимо них --- в случае когда алгебраическая кратность собственного числа превосходит его геометрическую кратность:
$$ {\mathfrak m}_j > \ell_j = \operatorname{dfc} (\mathcal A - \lambda_j {\mathcal E}) $$
--- и другие: так называемые, //корневые//. На основании теоремы
из
☞
((:mapping:operator#инвариантное_подпространство ПУНКТА)) в базисе $ \mathbb V_{} $, составленном объединением базисов $ \mathbb V_j $, матрица оператора будет иметь блочно-диагональный вид
$$
\left(
\begin{array}{cccc}
\mathbf A_1 & \mathbb O & \dots & \mathbb O \\
\mathbb O & \mathbf A_2 & \dots & \mathbb O \\
& & \ddots & \\
\mathbb O & \mathbb O & \dots & \mathbf A_{{\mathfrak r}}
\end{array}
\right) \quad , \quad \mbox{ здесь } \ \mathbf A_j - \mbox{ матрица порядка }\
{\mathfrak m}_j\times {\mathfrak m}_j \ .
$$
Каждый из базисов составляющих $ \mathbb V_{} $ подпространств $ \mathbb V_j $ удается подобрать
так, чтобы матрица $ \mathbf A_j $ имела снова блочно-диагональный вид
$$
\mathbf A_j=
\left(
\begin{array}{cccc}
{\mathbf A}_{j1} & \mathbb O & \dots & \mathbb O \\
\mathbb O & {\mathbf A}_{j2} & \dots & \mathbb O \\
& & \ddots & \\
\mathbb O & \mathbb O & \dots & {\mathbf A}_{j \ell_j}
\end{array}
\right)
$$
где на диагонали стоят матрицы вида
$$
{\mathfrak J}_k (\lambda_j) =
\left(
\begin{array}{cccccc}
\lambda_j & 0 & 0 & \dots & 0 & 0 \\
1 & \lambda_j & 0 & \dots & 0 & 0 \\
0 & 1 & \lambda_j & \dots & 0 & 0 \\
\vdots & & \ddots & \ddots& & \vdots \\
0 & 0 & 0 & \dots & 1 & \lambda_j
\end{array}
\right)_{k \times k}
$$
называемые (**нижними**) **клетками Жордана**[[(//англ.//) Jordan block.]].
Указанный вид матрицы оператора $ \mathcal A $ называется **канонической формой Жордана**[[**Жордан Камилл** (Jordan Marie Ennemond Camille, 1838--1922) --- французский математик. Биография
☞
((http://www-history.mcs.st-andrews.ac.uk/history/Biographies/Jordan.html ЗДЕСЬ)). Не следует путать его с немецким геодезистом ((https://ru.wikipedia.org/wiki/%D0%99%D0%BE%D1%80%D0%B4%D0%B0%D0%BD,_%D0%92%D0%B8%D0%BB%D1%8C%D0%B3%D0%B5%D0%BB%D1%8C%D0%BC_%28%D0%B3%D0%B5%D0%BE%D0%B4%D0%B5%D0%B7%D0%B8%D1%81%D1%82%29 Вильгельмом Йорданом)) (Jordan Wilhelm,1842-1899), известному по методу Гаусса-Йордана решения систем линейных уравнений и обращения матрицы.]] или **жордановой нормальной формой** (**ЖНФ**), а соответствующий базис пространства --- **каноническим базисом**. Жорданову нормальную форму оператора $ \mathcal A $ будем обозначать $ \mathbf A_{_{\mathfrak J}} $.
!!§!! Частным видом **ЖНФ** является ((:mapping:operator#диагонализуемость_матрицы_оператора диагональный)):
$$ \mathbf A_{_{\mathfrak J}} =
A_{diag}=
\left(
\begin{array}{cccc}
\lambda_1 & 0 & \dots & 0 \\
0 & \lambda_2 & \dots & 0 \\
& & \ddots & \\
0 & 0 & \dots & \lambda_n
\end{array}
\right) \ ;
$$
в этом случае все клетки Жордана --- первого порядка.
На языке матричного формализма задача построения **ЖНФ** и канонического базиса может быть переформулирована следующим образом: пусть имеется некоторый исходный базис $ \{X_1,\dots,X_n\} $ пространства $ \mathbb V_{} $, в котором матрица оператора равна $ \mathbf A_{} $. Требуется найти
матрицу перехода $ C_{} $ от этого базиса к некоторому новому, обеспечивающую выполнение равенства
$$ C^{-1} \mathbf A C = \mathbf A_{_{\mathfrak J}} \ . $$
Про матрицу $ \mathbf A_{_{\mathfrak J}} $ заранее известна лишь та информация, что все ее элементы --- нулевые, за исключением разве лишь элементов двух ее диагоналей --- главной и следующей за ней вниз.
Очень часто в приложениях ставится задача нахождения формы Жордана $ \mathbf A_{_{\mathfrak J}} $ и матрицы $ C_{} $, связанных с заданной матрицей $ \mathbf A_{} $ последним равенством; при этом напрямую не ассоциируют исходную матрицу $ \mathbf A_{} $ с каким-либо оператором --- и вообще с каким-то пространством. С формальной точки зрения, нужно было бы формулировать задачу о //каноническом базисе оператора// $ X \mapsto \mathbf A \cdot X $ //при// $ X\in \mathbb C^n $ и исходном базисе пространства, состоящем из векторов
$$
\{{\mathfrak e}_j = \big[\underbrace{0,\dots,0,1}_{j},0,\dots,0\big]^{\top} \}_{j=1}^n \ .
$$
Однако в примерах, рассмотренных ниже, я буду просто говорить на языке ((:mapping:operator#матрица_оператора подобных матриц)), ставя задачу
**о приведении матрицы** $ \mathbf A_{} $ **к ЖНФ**.
Даже при формальном совпадении характеристических полиномов двух операторов $ \mathcal A_1 $ и $ \mathcal A_2 $ их жордановы нормальные формы могут быть различными. Однако для каждого оператора **ЖНФ** определяется единственным образом --- с точностью до перестановки клеток Жордана на диагонали.
====Аннулирующий полином==
Пусть $ g(\lambda),g_1(\lambda),g_2(\lambda) $ --- произвольные полиномы над $ \mathbb C_{} $.
Говорят, что операторный полином $ g(\mathcal A) $ --- **аннулирующий для вектора** $ X\in \mathbb V_{} $ если $ g(\mathcal A)(X)=\mathbb O $.
!!Т!! **Теорема 1.** //Множество векторов// $ X_{}\in \mathbb V $, //аннулируемых// $ g(\mathcal A) $, //образует линейное подпространство пространства// $ \mathbb V_{} $.
**Доказательство.** Действительно, это множество является ядром оператора $ g(\mathcal A) $ и по теореме 1 из
☞
((:mapping:operator#основные_определения ПУНКТА)), оно является линейным подпространством.
♦
!!Т!! **Теорема 2.** //Если полиномы// $ g_1(\lambda) $ и $ g_2(\lambda) $ //взаимно просты:// $ \operatorname{HOD} (g_1,g_2)=1 $, //то подпространства векторов, аннулируемых// $ g_1(\mathcal A) $ //и// $ g_2(\mathcal A) $, //имеют тривиальное пересечение.//
**Доказательство.** Если $ \operatorname{HOD} (g_1,g_2)=1 $, то существуют полиномы $ \{ p_1(\lambda),p_2(\lambda)\} \subset \mathbb C[\lambda] $, обеспечивающие выполнение ((:polynomial:relat_prime#тождество_безу тождества Безу)):
$$p_1(\lambda)g_1(\lambda)+p_2(\lambda)g_2(\lambda) \equiv 1 \ . $$
Тогда при подстановке в это тождество оператора получим:
$$
p_1(\mathcal A)g_1(\mathcal A)+p_2(\mathcal A)g_2(\mathcal A) = \mathcal E \ ,
$$
где $ \mathcal E $ --- тождественный оператор.
Если существует $ X \in \mathbb V_{} $ такой, что $ g_1(\mathcal A)(X)=\mathbb O $
и $ g_2(\mathcal A)(X)=\mathbb O $, то из последнего тождества следует, что
$$p_1(\mathcal A)g_1(\mathcal A)(X)+p_2(\mathcal A)g_2(\mathcal A)(X) = \mathcal E(X) \quad \Longrightarrow
\mathbb O=X \ . $$
♦
!!Т!! **Теорема 3.** //Если полиномы// $ g_1(\lambda) $// и// $ g_2(\lambda) $ //взаимно просты и вектор// $ X\ne \mathbb O $ // аннулируется произведением//
$ g_1(\mathcal A)g_2(\mathcal A) $, //то этот вектор можно представить в виде суммы// $ X=X_1+X_2 $,
//где// $ X_{j} $ //аннулируется// $ g_j(\mathcal A) $.
**Доказательство.** Воспользуемся равенством из последней теоремы:
$$\underbrace{p_1(\mathcal A)g_1(\mathcal A)(X)}_{= X_2}+
\underbrace{p_2(\mathcal A)g_2(\mathcal A)(X)}_{= X_1} = \mathcal E (X)=X \ .$$
Тогда $ g_2(\mathcal A)(X_2)=p_1(\mathcal A)g_1(\mathcal A)g_2(\mathcal A)(X)=p_1(\mathcal A)(\mathbb O)=\mathbb O $, т.е.
$ X_2 $ аннулируется $ g_2(\mathcal A) $. Аналогично доказывается, что
$ g_1(\mathcal A)(X_1)=\mathbb O $.
♦
!!=>!! Если вектор $ X_{} $ аннулируется произведением
$$ g(\mathcal A)=g_1(\mathcal A)\times \dots \times g_{{\mathfrak r}}(\mathcal A) , $$
где полиномы $ g_1(\lambda),\dots, g_{{\mathfrak r}}(\lambda) $ попарно взаимно просты, то его можно представить
в виде суммы
$$ X=X_1+\dots+X_{{\mathfrak r}} \ \mbox{ где } X_j \ \mbox{ аннулируется } \ g_j(\mathcal A) . $$
----
Полином $ g(\lambda) \not\equiv 0 $ называется **аннулирующим полиномом оператора** $ \mathcal A_{} $, если $ g(\mathcal A)= \mathcal O $.
----
!!П!! **Пример.** В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степеней $ \le 3 $ оператор $ \mathcal A_{} $ действует по правилу:
$$ \mathcal A (F(x)) = F(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$
т.е. полином $ F_{}(x) $ отображается в ((:polynomial#делимость_полиномов остаток от деления)) произведения $ F(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Найти аннулирующий полином оператора.
**Решение.** Поскольку про аннулирующий полином $ g(\lambda) $ нам заранее
не известна даже его степень, будем искать подбором как его степени (идя по возрастанию), так и его коэффициентов. Пусть
$$ g(\lambda) = A_0 + A_1 \lambda+ A_2 \lambda^2+ \dots . $$
Условие $ g(\mathcal A)= \mathcal O $ перепишем в виде
$$ A_0 \mathcal E + A_1 \mathcal A+ A_2 \mathcal A^2+ \dots = \mathcal O \ . $$
В примере
☞
((:mapping:operator#основные_определения ПУНКТА)) степень оператора $ \mathcal A^K $ вычислялась формулой
$$ \mathcal A^k(F(x))=(x^2-2)^K F(x) \pmod{x^4-x^3-x^2+x} \ . $$
Исходя из этого, аннулирующий полином должен обеспечивать выполнение условия
$$ ( A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2+ \dots) F(x) \equiv 0 \ \pmod{x^4-x^3-x^2+x} ; $$
причем это тождество должно быть выполнено для любого полинома $ F_{}(x) $. Отсюда следует, что полином $ ( A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2+ \dots) $ должен делиться нацело на $ x^4-x^3-x^2+x $. Для удовлетворения этого требования делаем теперь гипотезу о степени этого полинома и пробуем подобрать коэффициенты. Предположим, что $ \deg g \le 1 $, но такой полином может делиться на полином степени $ 4_{} $ только при условии выполнения равенств $ A_0=0,A_1=0 $; что нас совершенно не интересует. Пусть $ \deg g=2 $, тогда если полином $ A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2 $ делится на полином степени $ 4_{} $, то должен отличаться от делителя только постоянным множителем:
$$ A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2 \equiv C (x^4-x^3-x^2+x) \quad npu \quad C \in \mathbb C \ . $$
Легко проверить, что это возможно только в тривиальном случае: $ A_0=0,A_1=0,A_2=0 $. Случай $ \deg g=3 $ требует уже более сложных расчетов: произведем деление с остатком
$$ A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2+ A_3 (x^2-2)^3 \equiv $$
$$ \equiv (A_2-4\,A_3)\,x^3+(A_1-3\,A_2+7\,A_3)\,x^2+ $$
$$
+(-A_2+4\,A_3)\,x+A_0-2\,A_1+4\,A_2-8\,A_3 \pmod{x^4-x^3-x^2+x} \ . $$
Остаток будет тождественно равен нулю тогда и только тогда, когда
$$ A_2=4\,A_3,\ A_1=5\, A_3,\ A_0=2\, A_3 \ . $$
Эти условия --- с точностью, до постоянного сомножителя --- определяют аннулирующий полином .
**Ответ.** Аннулирующим полиномом минимально возможной степени является $ \lambda^3+4\, \lambda^2+ 5\, \lambda+2 $.
----
Аннулирующий полином оператора $ \mathcal A_{} $ минимально возможной степени называется **минимальным аннулирующим полиномом**.
----
Существование хотя бы одного аннулирующего полинома оператора гарантируется ((:mapping:operator#собственное_число_и_собственный_вектор теоремой Гамильтона-Кэли)):
если $ f(\lambda) $ --- характеристический полином оператора $ \mathcal A_{} $, то $ f(\mathcal A)={\mathcal O} $. Таким образом, можно утверждать, что для минимального аннулирующего полинома выполняется условие $ \deg g \le \dim \mathbb V $. Предыдущий пример показывает, что это неравенство может оказаться и строгим. Обратим внимание, что
для оператора из этого примера характеристический полином ((:mapping:operator#собственное_число_и_собственный_вектор равен)) $ (\lambda+2)(\lambda+1)^3 $ и полученный аннулирующий полином является его делителем: он равен $ (\lambda+2)(\lambda+1)^2 $.
!!Т!! **Теорема 4.** //Аннулирующий полином// $ g(\lambda_{}) $ //оператора// $ \mathcal A_{} $ //имеет те же корни, что и характеристический полином этого оператора.//
**Доказательство** от противного. Пусть $ \lambda_{\ast} \in \mathbb C $ --- корень характеристического полинома оператора $ \mathcal A_{} $, но $ g(\lambda_{}) $ не имеет
$ \lambda_{\ast} $ корнем. Числу $ \lambda_{\ast} $ принадлежит корневой вектор $ \mathfrak X_{\ast} $ высоты $ 1_{} $ (собственный вектор) оператора $ \mathcal A_{} $:
$ (\mathcal A- \lambda_{\ast} \mathcal E)(\mathfrak X_{\ast})=\mathbb O $. С другой стороны, поскольку $ \operatorname{HOD}( g(\lambda_{}), \lambda- \lambda_{\ast})=1 $, то, по теореме 2, вектор $ \mathfrak X_{\ast} $ не должен аннулироваться оператором $ g(\mathcal A) $. Однако это противоречит предположению о том, что $ g(\mathcal A) $ --- аннулирующий полином оператора.
♦
!!Т!! **Теорема 5.** //Минимальный аннулирующий полином оператора является делителем его характеристического полинома. Два минимальных аннулирующих полинома оператора различаются, разве лишь, постоянным множителем.//
**Доказательство.** Предположим противное: пусть минимальный аннулирующий полином $ g(\lambda) $ не является делителем $ f(\lambda) $. Тогда при делении $ f(\lambda) $ на
$ g(\lambda) $ возникает нетривиальный остаток:
$$ f(\lambda)\equiv g(\lambda) q(\lambda) + r(\lambda) \quad npu \quad \deg r < \deg g \ . $$
Поскольку $ f(\lambda) $ и $ g(\lambda) $ --- аннулирующие для $ \mathcal A $, то и $ r(\lambda)= f(\lambda) - g(\lambda) q(\lambda) $ является аннулирующим.
Но это противоречит тому, что, по предположению, $ g(\lambda) $ --- //минимальный// аннулирующий полином.
Если $ \tilde g(\lambda) $ --- еще один минимальный аннулирующий полином оператора, то обязательно $ \deg \tilde g = \deg g $. Если предположить, что у полиномов $ g(\lambda) $ и $ \tilde g(\lambda) $ имеются различные сомножители, то полином $ \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) $ будет иметь степень меньшую $ \deg \tilde g = \deg g $. Для
$ \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) $ имеет место ((:polynomial#наибольший_общий_делитель линейное представление)):
$$ \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) \equiv p_1(\lambda) g(\lambda) + p_2(\lambda) \tilde g(\lambda) \ \ npu \quad \{p_1(\lambda),p_2(\lambda) \} \subset \mathbb C[\lambda] . $$
Тогда $ \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) $ является аннулирующим полиномом оператора. Но тогда $ g(\lambda) $ и $ \tilde g(\lambda) $ не могут быть //минимальными// аннулирующими.
♦
Следствиями теорем 4 и 5 является следующий результат.
!!=>!! Минимальный аннулирующий полином оператора $ \mathcal A_{} $ совпадает (с точностью до постоянного сомножителя) с характеристическим полиномом этого оператора при условии отсутствия у этого полинома кратных корней. В общем случае, пусть разложение характеристического полинома оператора имеет вид
$$ f(\lambda)= \det (\mathcal A - \lambda \mathcal E) \equiv (-1)^n(\lambda - \lambda_1)^{{\mathfrak m}_1} \times
\dots \times (\lambda - \lambda_{{\mathfrak r}})^{ {\mathfrak m}_{{\mathfrak r}}} \quad ; \quad
{\mathfrak m}_1+\dots+{\mathfrak m}_{{\mathfrak r}}=n, \ \lambda_k \ne
\lambda_{\ell} \ npu \ k \ne \ell.
$$
Минимальный аннулирующий полином имеет вид
$$ g(\lambda)=(\lambda-\lambda_1)^{\mathfrak n_1}\times \dots \times (\lambda-\lambda_{\mathfrak r})^{\mathfrak n_{\mathfrak r}} , $$
где показатели
$ \{\mathfrak n_j \}_{j=1}^{\mathfrak r} $ могут принимать значения из множеств $ \{\{1,\dots,\mathfrak m_j \}\}_{j=1}^{\mathfrak r} $.
Конструктивное построение минимального аннулирующего полинома произвольного оператора довольно громоздко; структура его линейных множителей
напрямую связана со структурой Жордановой нормальной формы. В литературе излагается ((#источники [2])) метод построения **ЖНФ** на основе информации о минимальном аннулирующем полиноме,
но я в дальнейшем не использую эту конструкцию.
Теорема Гамильтона-Кэли эквивалентна равенству
$$ (\mathcal A- \lambda_1 \mathcal E)^{{\mathfrak m}_1} \times
\dots \times (\mathcal A - \lambda_{{\mathfrak r}}\mathcal E)^{ {\mathfrak m}_{{\mathfrak r}}} = \mathcal O \ .
$$
Из следствия к теореме $ 3 $ тогда вытекает, что произвольный вектор $ X_{} \in \mathbb V $
может быть представлен в виде суммы
$$X=X_1+\dots+X_{{\mathfrak r}} \ , \qquad \mbox{ где } \ X_j \quad
\mbox{ аннулируется } \ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j} \ .
$$
и такое представление единственно, т.е. $ \mathbb V_{} $ раскладывается в прямую сумму
$$ \mathbb V= \mathbb V_1\oplus \dots \oplus \mathbb V_{{\mathfrak r}} \ , \qquad \mbox{ где } \
\mathbb V_{j}
\mbox{ аннулируется } \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j } \ . $$
!!Т!! **Теорема 6.** //Линейное подпространство векторов, аннулируемых//
$ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j} $, //инвариантно относительно// $ \mathcal A_{} $.
**Доказательство.** Действительно, если
$$ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j}(X)=\mathbb O \, ,$$
то и
$$ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j}(\mathcal A(X))=\mathcal A(\left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j}(X))= \mathbb O \, .
$$
♦
!!=>!! На основании теоремы
из
☞
((:mapping:operator#инвариантное_подпространство ПУНКТА)) в базисе $ \mathbb V_{} $, составленном объединением базисов $ \mathbb V_j $, матрица оператора будет иметь блочно-диагональный вид
$$
\left(
\begin{array}{cccc}
\mathbf A_1 & \mathbb O & \dots & \mathbb O \\
\mathbb O & \mathbf A_2 & \dots & \mathbb O \\
& & \ddots & \\
\mathbb O & \mathbb O & \dots & \mathbf A_{{\mathfrak r}}
\end{array}
\right) \ .
$$
Итак, мы следуем изложенной в начале раздела ((#общая_схема схеме)); остается только подобрать хорошие базисы для самих подпространств $ \mathbb V_j $.
====Корневое подпространство==
**Задача.** Построить такой базис подпространства $ \mathbb V_j $, в котором соответствующий блок $ {\mathbf A}_j $ матрицы оператора $ \mathcal A_{} $ будет состоять из клеток Жордана.
Ненулевой вектор $ X_{}\in \mathbb V $ называется **корневым вектором оператора** $ \mathcal A_{} $, **принадлежащим собственному числу** $ \lambda_{j}^{} $ если он аннулируется оператором $ (\mathcal A - \lambda_{j} \mathcal E)^k $
при некотором $ k_{}\in \mathbb N $:
$ (\mathcal A - \lambda_{j} \mathcal E)^k(X)=\mathbb O $. Наименьший из показателей $ k_{} $ с
таким свойством называется **высотой корневого вектора** $ X_{} $:
$$ . \mbox{ Высота }\ (X) = h \iff (\mathcal A - \lambda_{j} \mathcal E)^h(X)=\mathbb O,\
(\mathcal A - \lambda_{j} \mathcal E)^{h-1}(X)\ne \mathbb O \ .$$
!!П!! **Пример 1.** Любой собственный вектор оператора $ \mathcal A_{} $ будет его корневым
высоты $ 1 $.
Рассмотрим теперь пример, разобранный в
☞
((:mapping:operator#собственное_число_и_собственный_вектор ПУНКТЕ)).
!!П!! **Пример 2.** В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степеней $ \le 3 $ оператор $ \mathcal A_{} $ действует по правилу
$$ \mathcal A (f(x)) = F(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$
т.е. полином $ F_{}(x) $ отображается в ((:polynomial#делимость_полиномов остаток от деления)) произведения $ F(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Найти корневые векторы этого оператора.
**Решение.** Оператор имеет два собственных числа $ \lambda_1=-2 $ и $ \lambda_2=-1 $, причем последнее --- кратности $ 3_{} $. Корневыми векторами высоты $ 1_{} $ являются собственные векторы, принадлежащие этим собственным числам, т.е.
$$ \{ t(x+1)(x-1)^2 \ \mid \ t\ne 0 \} \quad \mbox{ и } \quad \{ (t_1x+t_2)x(x-1) \ \mid \ (t_1,t_2) \ne (0,0) \} \ $$
соответственно.
Далее, ищем корневые векторы высоты $ 2_{} $, принадлежащие собственному числу $ \lambda_1=-2 $.
$$ (\mathcal A +2 \, \mathcal E)^2 (F(x))=x^4 F(x) \pmod{x^4-x^3-x^2+x} $$
и наша задача состоит в нахождении полинома $ F_{}(x) $, для которого последнее выражение равно тождественно нулевому полиному. Очевидно, что множество всех таких полиномов
$$ \{ t(x^3-x^2-x+1) \ \mid \ t\ne 0 \} $$
совпадает с уже полученным выше множеством собственных векторов (полиномов). Понятно также, что дальнейшее увеличение степени оператора $ (\mathcal A +2 \, \mathcal E) $ иных полиномов не даст. Следовательно, рассматриваемому собственному числу принадлежат только корневые векторы (полиномы) высоты $ 1_{} $.
Для собственного числа $ \lambda_1=-1 $ сценарий оказывается несколько менее тривиальным:
$$ (\mathcal A +\mathcal E)^2 (F(x))=(x^2-1)^2 F(x) \pmod{x^4-x^3-x^2+x} \ . $$
Полином $ (x^2-1)^2 F(x) $ делится нацело на $ x(x+1)(x-1)^2 $ при полиноме
$$ F_{}(x) \in \{ (u_1x^2+u_2x+u_3)x \mid \ (u_1,u_2,u_3) \in \mathbb R^3 \} \ . $$
Некоторое подмножество этого множества составляют собственные векторы (полиномы):
$$ \{ (t_1x+t_2)(x-1)x \ \mid \ (t_1,t_2)
\in \mathbb R^2 \} \ \subset \{ (u_1x^2+u_2x+u_3)x \mid \ (u_1,u_2,u_3) \in \mathbb R^3 \} , $$
но появляются и корневые векторы (полиномы) высоты $ 2_{} $. Чтобы понять какие это векторы обратим внимание, что полиномы из левого множества все делятся на $ (x-1) $, т.е. имеют корнем $ 1_{} $. Следовательно высоту $ 2_{} $ будут иметь полиномы $ (u_1x^2+u_2x+u_3)x $, для которых $ 1_{} $ не является корнем, т.е. удовлетворяющие условию $ u_1+u_2+u_3 \ne 0 $.
Если мы попытаемся найти полиномы высоты $ 3_{} $, то нас ожидает неудача --- множество решений
$ (\mathcal A +\mathcal E)^3 (F(x)) $ совпадает с предыдущим.
♦
!!П!! **Пример 3.** Найти корневые векторы матрицы
$$
\mathbf A=\left(
\begin{array}{rrrrrrrr}
3 & 0 & 1 & 1 & 0 & 1 & -1 & 0 \\
0 & 3 & -2 & -1 & -1 & -2 & 1 & -1 \\
2& 3 & 0 & 0 & -2 & -2 & 0 & -2 \\
-3 & -3 & 1 & 1 & 2 & 1 & 1 & 2 \\
-1 & -1 & 0 & 0 & 2 & -1 & 1 & 0 \\
-1 & -1 & 0 & -1 & 1 & 3 & 0 & 1 \\
-1 & -1 & 0 & -1 & 1 & 1 & 2 & 1 \\
0& 0& 0 & 0 & 0 & 0 & 0 & 2
\end{array}
\right) \ .
$$
**Решение.** $ \det (\mathbf A- \lambda E) \equiv ( \lambda -2)^8 $. У матрицы имеется единственное собственное число $ \lambda_1=2 $ алгебраической кратности $ 8_{} $.
Составим матрицу
$$
\mathbf B=\mathbf A- 2\, E=
\left(
\begin{array}{rrrrrrrr}
1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\
0 & 1 & -2 & -1 & -1 & -2 & 1 & -1\\
2 & 3 & -2 & 0 & -2 & -2 & 0 & -2\\
-3 & -3 & 1 & -1 & 2 & 1 & 1 & 2\\
-1 & -1 & 0 & 0 & 0 & -1 & 1 & 0\\
-1 & -1 & 0 & -1 & 1 & 1 & 0 & 1\\
-1 & -1 & 0 & -1 & 1 & 1 & 0 & 1\\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0
\end{array}
\right)
$$
и найдем корневые векторы высоты $ 1_{} $ как решения системы однородных уравнений $ \mathbf B X = \mathbb O $. Методом Гаусса сводим эту систему к
$$
\left(
\begin{array}{rrrrrrrr}
1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\
0& 1 & -2 & -1 & -1 & -2 & 1 & -1 \\
0 & 0 & 2 & 1 & 1 & 2 & -1 & 1\\
0& 0 & 0 & 1 & -1 & -2 & 1 & -1
\end{array}
\right) X = \mathbb O \iff
$$
$$
\iff \quad
\left\{
\begin{array}{rrrrrrrrr}
x_1 & & -x_3 & +x_4 & +x_5 & & & & =0,\\
& x_2 & & & & & & & =0, \\
& & x_3 & +x_4 & & & & & =0,\\
& & & x_4 & -x_5 & -2\,x_6 & +x_7 & -x_8 & = 0.
\end{array}
\right.
$$
Геометрическая кратность собственного числа равна $ 4_{} $.
Строим ((:algebra2:linearsystems#система_однородных_уравнений фундаментальную систему решений)) (**ФСР**) для этой системы; переменные $ x_5,x_6,x_7,x_8 $ можно взять в качестве основных:
$$
\begin{array}{rrrr|rrrr}
x_1 & x_2 & x_3 & x_4 & x_5 & x_6 & x_7 & x_8 \\
\hline
0 & 0 & -1 & 1 & 1 & 0 & 0 & 0 \\
-1 & 0 & -2 & 2 & 0 & 1 & 0 & 0 \\
1 & 0 & 1 & -1 & 0 & 0 & 1 & 0 \\
0 & 0 & -1 & 1 & 0 & 0 & 0 & 1
\end{array}
$$
Таким образом, **ФСР** состоит из векторов
$$
X_1=[0,0,-1,1,1,0,0,0]^{\top},\ X_2=[-1,0,-2,2,0,1,0,0]^{\top},\
$$
$$
X_3=[1,0,1,-1,0,0,1,0]^{\top},\ X_4=[0,0,-1,1,0,0,0,1]^{\top} \ .
$$
Любая нетривиальная линейная комбинация $ \alpha_1X_1+\alpha_2X_2+\alpha_3X_3+\alpha_4X_4 $ будет корневым вектором высоты $ 1_{} $.
Теперь отыщем корневые векторы высоты $ 2_{} $. Для этого вычислим матрицу $ \mathbf B^2 $ и решим систему уравнений $ \mathbf B^2 X=\mathbb O $:
$$
\left(
\begin{array}{rrrrrrrr}
0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\
1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\
2 & 1 & 0 & 1 & -1 & 0 & -1 & -1\\
-2 & -1 & 0 & -1 & 1 & 0 & 1 & 1\\
-1 & -1 & 1 & 0 & 1 & 1 & 0 & 1\\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 0
\end{array}
\right) X = \mathbb O \quad \iff
$$
$$
\iff \quad
\left\{
\begin{array}{rrrrrrrrr}
x_1 & & +x_3 & +x_4 & & +x_6 & -x_7 & & =0,\\
& x_2 & -2\,x_3 & -x_4 & -x_5 & -2\,x_6 & +x_7 & -x_8 & =0.
\end{array}
\right.
$$
Для этой системы **ФСР** состоит из $ 6_{} $ векторов и ее можно строить разными способами. Например, ее можно строить дополнением системы корневых
векторов высоты $ 1_{} $ --- это позволит выделить корневые векторы высоты большей $ 1_{} $. Для того, чтобы организовать такую процедуру пополнения, достаточно перебросить часть переменных, которые были зависимыми при нахождении **ФСР** в предыдущей системе $ \mathbf B X= \mathbb O $, к основным переменным. Такими переменными можно взять $ x_{3} $ и $ x_{4} $:
$$
\begin{array}{rr|rrrrrr}
x_1 & x_2 & x_3 & x_4 & x_5 & x_6 & x_7 & x_8 \\
\hline
-1 & 2 & 1 & 0 & 0 & 0 & 0 & 0 \\
-1 & 1 & 0 & 1 & 0 & 0 & 0 & 0 \\
\hline
0 & 0 & -1 & 1 & 1 & 0 & 0 & 0 \\
-1 & 0 & -2 & 2 & 0 & 1 & 0 & 0 \\
1 & 0 & 1 & -1 & 0 & 0 & 1 & 0 \\
0 & 0 & -1 & 1 & 0 & 0 & 0 & 1
\end{array}
$$
Векторы
$$ X_5 = [-1, 2, 1, 0, 0, 0, 0, 0]^{\top} \quad u \quad X_6 = [-1, 1, 0, 1, 0, 0, 0, 0]^{\top} $$
являются корневыми векторами высоты $ 2_{} $, и такая же высота будет у любого вектора
$$
\alpha_1X_1+\alpha_2X_2+\alpha_3X_3+\alpha_4X_4 + \beta_1 X_5 + \beta_2 X_6 \quad npu \quad \{\alpha_1,\dots,\alpha_4, \beta_1, \beta_2\} \subset \mathbb C,
|\beta_1|+ |\beta_2| \ne 0 \ .
$$
Далее, для нахождения корневых векторов высоты $ 3_{} $ решим систему $ \mathbf B^3 X=\mathbb O $:
$$
\left(
\begin{array}{rrrrrrrr}
0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\
0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\
1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\
-1 & 0 & -1 & -1 & 0 & -1 & 1 &0\\
-1 & 0 & -1 & -1 & 0 & -1 & 1 &0\\
0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\
0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\
0 & 0 & 0 & 0 & 0 & 0 & 0 &0
\end{array}
\right) X = \mathbb O \quad \iff
$$
$$
\iff \quad
x_1+x_3 +x_4+x_6 -x_7 =0 \ .
$$
Снова строим **ФСР** дополнением ранее полученных векторов $ X_1,\dots,X_6 $. В разряд основных переменных переходит $ x_{2} $ и вектором высоты $ 3_{} $ будет
$$ X_7=[0,1,0,0,0,0,0,0]^{\top} \ . $$
Очередное возведение в степень матрицы $ \mathbf B $ приводит к нулевой матрице: $ \mathbf B^4=\mathbb O $. Любой вектор $ \mathbb C^8 $ является решением системы
$ \mathbf B^4X=\mathbb O $. Вектором высоты $ 4_{} $ возьмем вектор
$$ X_8=[1,0,0,0,0,0,0,0]^{\top} \ . $$
Векторов высоты большей $ 4_{} $ у матрицы нет.
♦
!!Т!! **Теорема 7.** //Высота корневого вектора, принадлежащего// $ \lambda_{j}^{} $, //не превосходит кратности этого числа в характеристическом полиноме (т.е. его ((:mapping:operator#диагонализуемость_матрицы_оператора алгебраической кратности)))//.
!!§!! В дальнейшем максимально возможную высоту корневого вектора для числа $ \lambda_{j}^{} $ будем обозначать $ \mathfrak h_j $.
**Доказательство.** Пусть существует вектор $ X_{}\in \mathbb V $ такой, что
$$
(\mathcal A - \lambda_j {\mathcal E})^{\mathfrak h_j}(X)=\mathbb O,\quad (\mathcal A - \lambda_j {\mathcal E})^{\mathfrak h_j-1}(X) \ne \mathbb O
$$
при $ \mathfrak h_j>{\mathfrak m}_j $. Обозначим
$$ \widetilde X = (\mathcal A - \lambda_j {\mathcal E})^{{\mathfrak m}_j}(X),\quad
g(\lambda) = f(\lambda)/(\lambda-\lambda_j)^{{\mathfrak m}_j} \ .$$
По определению, вектор $ \widetilde X $ --- корневой, принадлежащий $ \lambda_{j}^{} $, высоты $ \mathfrak h_j-{\mathfrak m}_j $.
Поскольку $ g(\lambda) $ не имеет корнем $ \lambda_{j}^{} $, то
$ \operatorname{HOD} (g(\lambda),(\lambda-\lambda_j)^{\mathfrak h_j-{\mathfrak m}_j})=1 $. По теореме 2:
$ g(\mathcal A)(\widetilde X)\ne \mathbb O $. Но тогда
$$g(\mathcal A)(\mathcal A - \lambda_j {\mathcal E})^{{\mathfrak m}_j}(X)\ne \mathbb O \Longrightarrow f(\mathcal A)(X)\ne \mathbb O \ ,$$
что противоречит тому, что $ f(\mathcal A)={\mathcal O} $.
♦
!!Т!! **Теорема 8.** //Множество корневых векторов, принадлежащих// $ \lambda_{j}^{} $,// дополненное нулевым вектором, образует линейное подпространство//.
Это подпространство, которое мы выше обозначали $ \mathbb V_{j} $, называется **корневым подпространством оператора** $ \mathcal A_{} $, **принадлежащим** данному **собственному числу** $ \lambda_{j}^{} $.
!!Т!! **Теорема 9.** //Корневые подпространства, принадлежащие различным собственным числам оператора// $ \mathcal A_{} $, //имеют тривиальное пересечение//:
$$ \mathbb V_j \bigcap \mathbb V_k = \{ \mathbb O \} \qquad npu \quad \lambda_j \ne \lambda_k \ . $$
**Доказательство.** Следствие теоремы 2.
♦
!!Т!! **Теорема 10.** //Пространство// $ \mathbb V_{} $ //раскладывается в ((:linear_space#прямая_сумма_линейных_подпространств прямую сумму)) корневых подпространств оператора// $ \mathcal A $:
$$\mathbb V=\mathbb V_1 \oplus \dots \oplus \mathbb V_{{\mathfrak r}}\ . $$
Для построения базиса корневого подпространства $ \mathbb V_{j} $ выделим в нем подпространства корневых векторов высот $ \le s $:
$$ \mathbb Q_s = \mathcal{K}er (\mathcal A-\lambda_{j} \, {\mathcal E})^s \ , \ \mathbb Q_0 = \{\mathbb O\} \ .$$
Понятно, что имеет место вложенность
$$\mathbb Q_0 \subset \mathbb Q_1 \subset \dots \subset \mathbb Q_{\mathfrak h_j} = \mathbb V_j \ .$$
!!Т!! **Теорема 11.** //Если векторы// $ X_1,\dots,X_k $ //принадлежат// $ \mathbb Q_s $ //и ((:linear_space#относительный_базис линейно независимы относительно))// $ \mathbb Q_{s-1} $, //то векторы//
$ (\mathcal A - \lambda_j {\mathcal E})(X_1),\dots, (\mathcal A - \lambda_j {\mathcal E})(X_k) $
//принадлежат// $ \mathbb Q_{s-1} $ //и линейно независимы относительно// $ \mathbb Q_{s-2} $.
**Доказательство.** Если $ X\in \mathbb Q_s $ то $ (\mathcal A - \lambda_j {\mathcal E})^s(X)=\mathbb O $, т.е.
$$(\mathcal A - \lambda_j {\mathcal E})^{s-1}\left( (\mathcal A - \lambda_j {\mathcal E})(X) \right)=\mathbb O
\ ,$$
но это и означает, что $ (\mathcal A - \lambda_j {\mathcal E})(X) \in \mathbb Q_{s-1} $.
Предположим теперь, что существуют скаляры $ c_1,\dots,c_k $ такие, что
$$
\begin{array}{ccc}
&c_1 (\mathcal A - \lambda_j {\mathcal E})(X_1)+\dots+c_k (\mathcal A - \lambda_j {\mathcal E})(X_k) \in
\mathbb Q_{s-2}& \iff \\
\iff (\mathcal A - \lambda_j {\mathcal E})^{s-2} &\left(c_1 (\mathcal A - \lambda_j {\mathcal E})(X_1)+\dots
+c_k (\mathcal A - \lambda_j {\mathcal E})(X_k) \right)=\mathbb O \quad \ & \iff \\
\iff (\mathcal A - \lambda_j {\mathcal E})^{s-1}&
\left(c_1X_1+\dots +c_k X_k \right) = \mathbb O \ \qquad \Rightarrow \quad c_1X_1+\dots +c_k X_k \in \mathbb Q_{s-1} \ .
&
\end{array}
$$
По условию теоремы последнее соотношение возможно только при $ c_1=0,\dots, c_k=0 $.
♦
==== Алгоритм построения базиса корневого подпространства==
!!§!! Чтобы не усложнять индексы, всюду в алгоритме полагаем $ \mathfrak h = \mathfrak h_j $.
0.
Считаем, что на этом этапе построены базисы всех подпространств $ \mathbb Q_1, \mathbb Q_2,\dots, \mathbb Q_{\mathfrak h} $. При этом базис каждого
подпространства $ \mathbb Q_s $ при $ s\in \{2,\dots,\mathfrak h\} $ получен дополнением базиса подпространства $ \mathbb Q_{s-1} $. Обозначим
$$ \mathcal B = \mathcal A - \lambda_j {\mathcal E} \quad, k_1 = \dim \mathbb Q_1,\ k_{s} = \dim \mathbb Q_s- \dim \mathbb Q_{s-1} \quad npu \quad s\in \{2,\dots,\mathfrak h\} ; $$
таким образом, $ k_{s} $ --- число векторов ((:linear_space#относительный_базис относительного базиса)) $ \mathbb Q_s $ над $ \mathbb Q_{s-1} $. Число $ k_1+k_2+\dots+k_{_{\mathfrak h_j}} $ равно ((:mapping:operator#диагонализуемость_матрицы_оператора алгебраической кратности)), а число $ k_{1} $ равно ((:mapping:operator#диагонализуемость_матрицы_оператора геометрической кратности)) собственного числа $ \lambda_{j} $:
$$ k_1+k_2+\dots+k_{_{\mathfrak h_j}}= \mathfrak m_j= \dim \mathbb V_j,\ k_1= \ell_j= \operatorname{dfc} \left( \mathcal A - \lambda_j {\mathcal E} \right) \ . $$
Для визуализации последующего алгоритма построения канонического базиса удобно представить результаты этого этапа в виде схемы:
{{ mapping:operator:jordan_sch12.jpg |}}
Мы наблюдаем разноэтажное здание, число квартир на каждом этаже которого не превосходит числа квартир на предыдущем. В ходе дальнейшего алгоритма, часть "жильцов" останется на месте, а часть может быть замещена другими.
1.
Выберем $ Y_{1},\dots,Y_{k_{_{\mathfrak h}}} $ --- относительный базис[[В предыдущей схеме векторы были обозначены $ X_{\mathfrak h,1},\dots, X_{\mathfrak h, k_{_{\mathfrak h}}} $, но мне не хочется в дальнейшем возиться с двойными индексами.]] $ \mathbb Q_{\mathfrak h}=\mathbb V_j $ над
$ \mathbb Q_{\mathfrak h-1} $.
2.
По теореме 11 векторы $ \mathcal B(Y_{1}),\dots,\mathcal B(Y_{k_{_{\mathfrak h}}}) $
принадлежат $ \mathbb Q_{\mathfrak h-1} $ и **л.н.з.** относительно $ \mathbb Q_{\mathfrak h-2} $.
Если $ k_{\mathfrak h}=k_{\mathfrak h-1} $ то переходим к шагу
3
, в противном случае дополним полученные векторы до ((:linear_space#относительный_базис относительного базиса)) $ \mathbb Q_{\mathfrak h-1} $ над $ \mathbb Q_{\mathfrak h-2} $: пусть система
$$\mathcal B(Y_{1}), \dots,\mathcal B(Y_{k_{\mathfrak h}}),Y_{k_{\mathfrak h}+1},\dots, Y_{k_{(\mathfrak h-1)}}$$
является этим базисом.
3.
По теореме 11 векторы
$$\mathcal B^2(Y_{1}), \dots,\mathcal B^2(Y_{k_{\mathfrak h}}),\mathcal B(Y_{k_{\mathfrak h}+1}),\dots, \mathcal B(Y_{k_{_{(\mathfrak h-1)}}})$$
принадлежат $ \mathbb Q_{\mathfrak h-2} $ и **л.н.з.** относительно $ \mathbb Q_{\mathfrak h-3} $. Если $ k_{\mathfrak h-1}=k_{\mathfrak h-2} $ то переходим к шагу
4
, в противном случае дополним эти векторы до относительного базиса $ \mathbb Q_{\mathfrak h-2} $ над $ \mathbb Q_{\mathfrak h-3} $.
4.
Продолжаем процесс...
...
h - 1.
$ \dots $
h.
Действуем оператором $ \mathcal B $ на векторы, полученные на предыдущем шаге:
$$
\mathcal B^{\,\mathfrak h-1}(Y_{1}), \dots,\mathcal B^{\,\mathfrak h-1}(Y_{k_{\mathfrak h}}),\mathcal B^{\,\mathfrak h-2}(Y_{k_{\mathfrak h}+1}),\dots,\mathcal B^{\,\mathfrak h-2}(Y_{k_{_{(\mathfrak h-1)}}}),\dots, \mathcal B(Y_{k_{_3}+1}),\dots,\mathcal B(Y_{k_{_2}}) .
$$
Получившиеся векторы принадлежат $ \mathbb Q_1 $ и **л.н.з.** относительно $ \mathbb Q_{0} $, т.е. линейно независимы в обычном понимании. Если $ k_{2}=k_{1} $, то процесс заканчивается. В противном случае дополним эти векторы до базиса $ \mathbb Q_1 $: пусть
$$
\begin{array}{ccc}
& \mathcal B^{\,\mathfrak h-1}(Y_{1}), \dots,\mathcal B^{\,\mathfrak h-1}(Y_{k_{\mathfrak h}}),\mathcal B^{\,\mathfrak h-2}(Y_{k_{\mathfrak h}+1}),\dots,\mathcal B^{\,\mathfrak h-2}(Y_{k_{_{(\mathfrak h-1)}}}),\dots, & \\
& \qquad \dots, \quad \mathcal B(Y_{k_{_3}+1}),\dots,\mathcal B(Y_{k_{_2}}), Y_{k_{_2}+1},\dots, Y_{k_{1}} &
\end{array}
$$
этот базис.
Базис $ \mathbb V_{j} $ получается объединением всех векторов, полученных в алгоритме. Действительно,
$$ .\mbox{ базис }
\ \mathbb Q_2 = \big\{ \mbox{ базис } \ \mathbb Q_1 \big\} \bigcup
\big\{ \mbox{ относит. базис } \ \mathbb Q_2 \ \mbox{ над } \ \mathbb Q_1 \big\} \ ,
$$
$$
.\mbox{ базис } \mathbb Q_3 = \big\{ \mbox{ базис } \ \mathbb Q_2 \big\} \bigcup
\big\{ \mbox{ относит. базис } \ \mathbb Q_3 \ \mbox{ над } \ \mathbb Q_2 \big\} \ ,
$$
$$
\dots \qquad \dots
$$
$$
.\mbox{ базис } \underbrace{\mathbb Q_{_{\mathfrak h}}}_{=\mathbb V_j} = \big\{ \mbox{ базис }
\ \mathbb Q_{\mathfrak h-1} \big\} \bigcup
\big\{ \mbox{ относит. базис } \ \mathbb Q_{\mathfrak h} \ \mbox{ над } \ \mathbb Q_{\mathfrak h-1} \big\} \ .
$$
Структура жордановой нормальной формы оператора
$ \mathcal A_{} $
В **ЖНФ** оператора $ \mathcal A_{} $ собственному числу $ \lambda_{j} $ соответствует $ k_{1} $ клеток Жордана. Они имеют следующую структуру:
* $ k_{\mathfrak h} $ клеток порядка $ \mathfrak h $;
* $ k_{\mathfrak h-1}-k_{\mathfrak h} $ клеток порядка $ \mathfrak h-1 $;
* $ k_{\mathfrak h-2}-k_{\mathfrak h-1} $ клеток порядка $ \mathfrak h-2 $;
* $ \dots $;
* $ k_1- k_2 $ клеток порядка $ 1_{} $.
Пусть эти клетки расположены на диагонали **ЖНФ** по убыванию их порядков:
$$ \underbrace{{\mathfrak J}_{\mathfrak h} (\lambda_j), \dots, {\mathfrak J}_{\mathfrak h} (\lambda_j)}_{k_{\mathfrak h}}, \underbrace{{\mathfrak J}_{\mathfrak h-1} (\lambda_j),\dots, {\mathfrak J}_{\mathfrak h-1} (\lambda_j)}_{k_{\mathfrak h-1}-k_{\mathfrak h}},\dots, \underbrace{{\mathfrak J}_{2} (\lambda_j),\dots, {\mathfrak J}_{2} (\lambda_j)}_{k_2- k_3}, \underbrace{{\mathfrak J}_{1} (\lambda_j),\dots, {\mathfrak J}_{1} (\lambda_j)}_{k_1- k_2} \ .
$$
Структура соответствующего канонического базиса
В каноническом базисе корневые векторы, соответствующие указанной последовательности клеток, следует упорядочить по следующему правилу:
1.
Векторы канонического базиса, соответствующие подпоследовательности клеток Жордана максимального порядка $ \mathfrak h $ в **ЖНФ**, берутся в следующей последовательности:
$$
Y_1, \mathcal B(Y_1), \dots, \mathcal B^{\mathfrak h -1}(Y_1), \dots,
Y_{k_{\mathfrak h}}, \mathcal B (Y_{k_{\mathfrak h}}), \dots, \mathcal B^{\mathfrak h -1}(Y_{k_{\mathfrak h}}) .
$$
Если обратиться к схеме построения относительных базисов подпространств, то предложенный алгоритм упорядочивания векторов канонического базиса иллюстрируется следующим образом: сначала мы "выселяем из квартир" всех жильцов, которые жили в них в пункте алгоритма за номером
0
(см. схему выше), кроме тех, кто живет на самом верхнем --- $ \mathfrak h $-м --- этаже. Начинаем заселение квартир, идя по стоякам сверху вниз. Квартиранты верхней квартиры "размножаются" с заселением нижних квартир, но строго в том же стояке. Как только заселяем весь стояк вплоть до первого
этажа, переходим к соседнему стояку и снова начинаем "заселение" с самой верхней квартиры.
{{ mapping:operator:jordan_sch2.jpg |}}
2.
Когда все $ k_{\mathfrak h} $ стояков (их еще называют "башнями") максимальной высоты $ \mathfrak h $ заселены, ищем стояки высоты $ \mathfrak h-1 $. Их может вовсе не оказаться (если $ k_{\mathfrak h-1}= k_{\mathfrak h} $). Но если хотя бы один имеется, то мы позволяем заселиться во все оставшиеся квартиры $ (\mathfrak h-1) $-го этажа тем жильцам, которые жили на этом этаже до выселения --- корневым векторам высоты $ \mathfrak h-1 $, т.е. жильцов выбираем среди $ X_{\mathfrak h-1,1},\dots, X_{\mathfrak h-1,k_{_{(\mathfrak h-1)}}} $. При одном дополнительном ограничении: "заселяются" только такие "старые" корневые векторы, которые вместе с "новосёлами" на этом этаже --- векторами $ \mathcal B(Y_1), \dots, B (Y_{k_{\mathfrak h}}) $ --- образуют относительный базис $ \mathbb Q_{\mathfrak h-1} $ над $ \mathbb Q_{\mathfrak h-2} $. Количество таких векторов равно $ k_{\mathfrak h-1} - k_{\mathfrak h} $, и мы их обозначаем $ Y_{k_{\mathfrak h}+1},\dots, Y_{k_{(\mathfrak h-1)}} $. Каждый из них порождает заселение целого стояка --- по образу и подобию сценария предыдущего пункта. Векторы, взятые в порядке
$$ Y_{k_{\mathfrak h}+1}, \mathcal B(Y_{k_{\mathfrak h}+1}),\dots, \mathcal B^{\mathfrak h-2}(Y_{k_{\mathfrak h}+1}), \dots, Y_{k_{(\mathfrak h-1)}},
\mathcal B(Y_{k_{(\mathfrak h-1)}}),\dots, \mathcal B^{\mathfrak h-2}(Y_{k_{(\mathfrak h-1)}}) $$
--- это следующие векторы канонического базиса, соответствующие подпоследовательности клеток порядка $ \mathfrak h-1 $ в **ЖНФ**.
3.
$ \dots $
...
h.
Если в ходе предшествующих стадий заселения еще имеются свободные квартиры на $ 1_{} $-м этаже ($ k_1>k_2 $), то в них заселяются корневые векторы высоты $ 1_{} $, т.е. собственные векторы оператора $ \mathcal A_{} $. Лишь бы только эти векторы, обозначенные нами $ Y_{_{k_2+1}},\dots, Y_{_{k_1}} $, оказались линейно независимыми с уже заселившимися, т.е. чтобы все жильцы первого этажа образовывали бы базис $ \mathbb Q_1 $. Эти векторы соответствуют клеткам Жордана порядка $ 1_{} $, т.е., фактически, просто последовательности из $ k_2-k_1 $ чисел $ \lambda_j,\dots,\lambda_j $, стоящих на главной диагонали **ЖНФ**.
----
!!§!! Объяснение необходимости перестановки векторов канонического базиса --- почему они нумеруются по правилу "сверху вниз", а не поэтажно --- дается в следующем ((#циклическое_подпространство ПУНКТЕ)).
!!П!! **Пример 3 (окончание).** Построить **ЖНФ** и канонический базис пространства для оператора из примера 3.
**Решение.** В этом примере корневое пространство единственно, поскольку единственно собственное число $ \lambda_1=2 $. Далее, максимальная высота корневого вектора $ \mathfrak h_1 = 4 $, а соответствующие подпространства $ \{\mathbb Q_j\}_{j=1}^4 $ имеют вид:
$$
\begin{array}{lcl}
\mathbb Q_1 &=& \mathcal L (X_1,X_2,X_3,X_4), \\
\mathbb Q_2 &=& \mathcal L (X_1,X_2,X_3,X_4,X_5,X_6),\\
\mathbb Q_3 &=& \mathcal L (X_1,X_2,X_3,X_4,X_5,X_6,X_7), \\
\mathbb Q_4 &=& \mathcal L (X_1,X_2,X_3,X_4,X_5,X_6,X_7,X_8) \ ;
\end{array}
$$
в обозначениях алгоритма имеем:
$$ k_1=4, k_2=2, k_3=1, k_4=1 \ . $$
Начинаем строить канонический базис согласно алгоритму. Первым делом, выбираем векторы относительного базиса $ \mathbb Q_4 $ над $ \mathbb Q_3 $. Такой вектор единствен --- это
$$ X_8 = [1,0,0,0,0,0,0,0]^{\top} \ .$$
Далее, согласно пункту
2
, вектор
$$ \mathbf B X_8 =[1,0,2,-3,-1,-1,-1,0]^{\top} $$
принадлежит $ \mathbb Q_3 $ и линейно независим относительно $ \mathbb Q_2 $. Поскольку $ k_3=1 $, то больше векторов в относительный базис $ \mathbb Q_3 $ над $ \mathbb Q_2 $ добавлять не нужно. Переходим к пункту
3
алгоритма: вычисляем
$$ \mathbf B^2 X_8 =[0,1,2,-2,-1,0,0,0]^{\top} \ . $$
Этот вектор принадлежит $ \mathbb Q_2 $ и линейно независим относительно $ \mathbb Q_1 $. Поскольку $ k_2=2 $, то можно подобрать еще один вектор из относительного базиса
$ \mathbb Q_2 $ над $ \mathbb Q_1 $.
{{mapping:operator:tower3.jpg |}}
Какой из векторов
$$ X_5 = [-1, 2, 1, 0, 0, 0, 0, 0]^{\top} \quad \mbox{ или } \quad X_6 = [-1, 1, 0, 1, 0, 0, 0, 0]^{\top} \ , $$
полученных в ходе построения базиса $ \mathbb Q_2 $, следует взять? --- В данном конкретном примере это не имеет значения, поскольку проверка ((:linear_space#относительный_базис условия базисности))
$$
\operatorname{rank} \{ \mathbf B^2 X_8, X_5, X_1,X_2,X_3,X_4 \} = \operatorname{rank} \{ \mathbf B^2 X_8, X_6, X_1,X_2,X_3,X_4 \}= 6
$$
выполняется для обоих векторов.
Если ввести в базис вектор $ X_5 $, то в следующем,
4
-м, шаге алгоритма получим систему векторов
$$ \mathbf B^3 X_8 = [0,0,1,-1,-1,0,0,0]^{\top}, \ \mathbf B X_5 =[0,0,2,-2,-1,-1,-1,-1,0]^{\top} \ . $$
Если все вычисления проделаны правильно, то полученные векторы должны быть собственными для матрицы $ \mathbf A_{} $, т.е. линейно выражаться через векторы
$$
X_1=[0,0,-1,1,1,0,0,0]^{\top},\ X_2=[-1,0,-2,2,0,1,0,0]^{\top},
$$
$$
\ X_3=[1,0,1,-1,0,0,1,0]^{\top},\ X_4=[0,0,-1,1,0,0,0,1]^{\top} \ .
$$
В самом деле, $ \mathbf B^3 X_8=-X_1 $, $ \mathbf B X_5=-X_1-X_2-X_3 $. Следовательно, в дополнение к векторам $ \mathbf B^3 X_8 $ и $ \mathbf B X_5 $ в базис пространства $ \mathbb Q_1 $ можно выбрать, например, векторы $ X_2, X_4 $.
Канонический базис пространства состоит, например, из векторов
$$ X_8, \mathbf B X_8, \mathbf B^2 X_8, X_5, \mathbf B^3 X_8, \mathbf B X_5,X_2, X_4 \ ; $$
однако эти векторы требуется определенным образом переставить местами. Сначала определяем структуру **ЖНФ** оператора. В соответствии с алгоритмом имеем ее в виде
$$
\mathbf A_{_{\mathfrak J}}
=
\left(\begin{array}{cccc|cc|c|c}
2 & & & & & & & \\
1 & 2 & & & & & & \\
& 1 & 2 & & & & & \\
& & 1 & 2 & & & & \\
\hline
& & & & 2 & & &\\
& & & & 1 & 2 & & \\
\hline
& & & & & & 2 & \\
\hline
& & & & & & & 2
\end{array}
\right)
$$
(все неуказанные элементы равны $ 0_{} $).
В соответствии с этой формой найденные выше корневые векторы следует переставить следующим образом:
$$ X_8, \mathbf B X_8, \mathbf B^2 X_8, \mathbf B^3 X_8, X_5, \mathbf B X_5,X_2, X_4 \ . $$
Матрица
$$
C=\left(\begin{array}{rrrrrrrr}
1 & 1 & 0 & 0 & -1 & 0 & -1 & 0\\
0 & 0 & 1 & 0 & 2 & 0 & 0 & 0\\
0 & 2 & 2 & 1 & 1 & 2 & -2 & -1\\
0 & -3 & -2 & -1 & 0 & -2 & 2 & 1\\
0 & -1 & -1 & -1 & 0 & -1 & 0 & 0\\
0 & -1 & 0 & 0 & 0 & -1 & 1 & 0\\
0 &-1 & 0 & 0 & 0 & -1 & 0 & 0\\
0 & 0 & 0 & 0 & 0 & 0 & 0 & 1
\end{array}
\right)
$$
приводит матрицу $ \mathbf A_{} $ к указанной форме Жордана: $ C^{-1} \mathbf A C = \mathbf A_{_{\mathfrak J}} $.
♦
====Циклическое подпространство==
Для завершения исследования нам осталось только выяснить причину, по которой в алгоритме построения канонического базиса из предыдущего пункта, начиная с определенного места, был изменен принцип нумерации получившейся системы корневых векторов. А для этого следует
выяснить, каким образом преобразуются векторы построенного базиса под действием оператора $ \mathcal A_{} $.
Пусть в пространстве $ \mathbb V_{} $ действует оператор $ \mathcal B $. Для любого $ X\in\mathbb V $
построим минимально возможное ((:mapping:operator#инвариантное_подпространство инвариантное подпространство)) оператора $ \mathcal B $, содержащее $ X_{} $. Рассмотрим
последовательность
$$ X, \mathcal B (X),\mathcal B(\mathcal B(X))=\mathcal B^2(X), \dots, $$
и продолжим ее до тех пор, пока не возникнет линейная зависимость.
!!Т!! **Теорема 12.** //Пусть система//
$$ \{ X, \mathcal B(X), \ldots, \mathcal B^{k-1}(X) \} $$
//еще линейно независима, в то время как система//
$$ \{X, \mathcal B(X), \ldots, \mathcal B^{k-1}(X),\mathcal B^k(X) \} $$
//уже линейно зависима.//
// Тогда линейная оболочка системы векторов// $ \{X, \mathcal B(X),\ldots,\mathcal B^{k-1}(X) \} $
$$
\widetilde{\mathbb V}= {\mathcal L}(X,\mathcal B(X),\ldots,\mathcal B^{k-1}(X))
$$
//является инвариантным подпространством оператора// $ \mathcal B $. //При этом//
$ \widetilde{\mathbb V} $ //будет минимальным инвариантным подпространством, содержащим// $ X_{} $,
//т.е. если// $ \widetilde{\widetilde{\mathbb V}} $ --- //произвольное инвариантное
подпространство, содержащее// $ X_{} $, //то//
$ \widetilde{\widetilde{\mathbb V}}\supset \widetilde{\mathbb V} $.
**Доказательство.** Рассмотрим произвольный вектор из $ \widetilde{\mathbb V} $:
$$
Y=c_1X+c_2\mathcal B(X)+\ldots+c_k\mathcal B^{k-1}(X)
$$
применим к нему оператор $ \mathcal B $:
$$
\mathcal B(Y)=c_1\mathcal B(X)+c_2\mathcal B^2(X)+\ldots+c_k\mathcal B^k(X) \ .
$$
По условию теоремы вектор $ \mathcal B^k(X) $ линейно выражается через векторы системы $ \{ X, \mathcal B(X), \ldots, \mathcal B^{k-1}(X) \} $:
$$
\mathcal B^k(X)=-\alpha_1X-\alpha_{2}\mathcal B(X)-\ldots-\alpha_{k}\mathcal B^{k-1}(X) \ .
$$
Тогда
$$
\mathcal B(Y)-\alpha_1 c_k X+(c_1-\alpha_2 c_k)\mathcal B(X)+
\dots+(c_{k-1}-\alpha_k c_k)\mathcal B^{k-1}(X) \ \in \widetilde{\mathbb V}
$$
т.к. все слагаемые принадлежат $ \widetilde{\mathbb V} $. По ((:mapping:operator#инвариантное_подпространство определению)) подпространство
$ \widetilde{\mathbb V} $ является инвариантным для оператора $ \mathcal B $.
Если $ \widetilde{\widetilde{\mathbb V}} $ --- еще какое-то инвариантное
подпространство, содержащее $ X_{} $, то оно должно содержать и $ \mathcal B(X) $, но
тогда --- и $ \mathcal B(\mathcal B(X))=\mathcal B^2(X) $ и т.д., а, значит, и
$ \widetilde{\mathbb V} $.
♦
----
При числе $ k_{} $ из условия теоремы, подпространство
$$ \widetilde{\mathbb V}= {\mathcal L}(X,\mathcal B(X),\ldots,\mathcal B^{k-1}(X)) $$ называется **циклическим подпространством, порожденным вектором** $ X_{} $.
----
Вернемся теперь к задаче построения канонического базиса оператора $ \mathcal A_{} $.
!!Т!! **Теорема 13.** //Пусть// $ X_{} $ --- //произвольный корневой вектор оператора// $ \mathcal A_{} $,// принадлежащий собственному числу// $ \lambda^{}_{j} $; //пусть высота этого вектора равна// $ h_{} $. //Рассмотрим оператор// $ \mathcal B=\mathcal A-\lambda_{j} {\mathcal E} $ //и его циклическое подпространство, порожденное вектором// $ X_{} $. Векторы
$$Y_1=X,\, Y_2=\mathcal B(Y_1)=\mathcal B(X),\, Y_3=\mathcal B(Y_2)=\mathcal B^2(X), \ldots , Y_h=\mathcal B(Y_{h-1})= \mathcal B^{\,h-1}(X) $$
//образуют базис этого подпространства. В базисе пространства// $ \mathbb V_{} $, //составленном ((:linear_space#относительный_базис дополнением этих векторов)),
матрица оператора// $ \mathcal A_{} $ //имеет вид//:
$$
\left(\begin{array}{cccccccc}
\lambda_{j}&0&0 &\ldots&0&\star & \star & \star\\
1&\lambda_{j}&0 & \ldots&0&\star & \star & \star\\
0&1&\lambda_{j} & &0&\star & \star & \star\\
\vdots && \ddots &\ddots & &&& \vdots \\
0&0 &\dots& 1 &\lambda_{j}&\star & \star & \star \\
&&&& & \star & \star & \star\\
&&\mathbb O&& & &\dots & \\
&&&& & \star & \star & \star
\end{array}\right) \ .
$$
**Доказательство.** Действительно, $ \mathcal A_{} = \mathcal B_{} +\lambda_{j} \mathcal E_{} $ и тогда
$$
\begin{array}{rcl}
\mathcal A(Y_1)&=&\mathcal B(Y_1)+\lambda_{j} {\mathcal E}(Y_1)=\lambda_{j} Y_1 + Y_2, \\
\mathcal A(Y_2)&=&\mathcal B(Y_2)+\lambda_{j} {\mathcal E}(Y_2)=\lambda_{j} Y_2 + Y_3, \\
\dots & & \dots \\
\mathcal A(Y_h)&=&\mathcal B(Y_h)+\lambda_{j} {\mathcal E}(Y_h)=\lambda_{j} Y_h,
\end{array}
$$
($ \mathcal B(Y_h)=\mathcal B^h(X)=\mathbb O $ поскольку по условию $ X_{} $ --- корневой высоты $ h_{} $).
♦
!!=>!! Циклическое подпространство, порожденное корневым вектором оператора $ \mathcal A_{} $, является ((:mapping:operator#инвариантное_подпространство инвариантным подпространством)) этого оператора.
----
Канонический базис и, следовательно, матрица перехода $ C_{} $ определяются
не единственным способом. Поэтому актуальна проверка правильности вычислений.
Такая проверка может быть проведена --- для матричного случая --- посредством проверки более простого
условия:
$$
{\mathbf A}C=C{\mathbf A}_{_{\mathfrak J}} \ .
$$
Следует, тем не менее, иметь в виду, что последнее условие является необходимым, но не достаточным. Так, справедливо равенство
$$
\underbrace{\left(
\begin{array}{rrr}
0 & -1 & 1 \\
2 & -5 & 3 \\
6 & -13 & 7
\end{array}
\right)}_{{\mathbf A}}
\underbrace{\left(
\begin{array}{rrr}
1 & 1 & 1 \\
1 & 1 & 2 \\
1 & 1 & 4
\end{array}
\right)}_{C_1}=\underbrace{\left(
\begin{array}{rrr}
1 & 1 & 1 \\
1 & 1 & 2 \\
1 & 1 & 4
\end{array}
\right)}_{C_1}
\left(
\begin{array}{rrr}
0 & & \\
& 0 & \\
& & 2
\end{array}
\right)
$$
тем не менее истинная **ЖНФ** матрицы $ {\mathbf A} $ недиагональна:
$$
{\mathbf A}_{_{\mathfrak J}}=
\left(
\begin{array}{rrr}
0 & & \\
1 & 0 & \\
& & 2
\end{array}
\right)
\quad
npu
\quad
C_2=\left(
\begin{array}{rrr}
0 & 1 & 1 \\
1 & 1 & 2 \\
2 & 1 & 4
\end{array}
\right) \ .
$$
Объяснение этой кажущейся неоднозначности заключается в том, что матрица $ C_1 $ является вырожденной: $ \det C_1=0 $, и $ C_1^{-1} $ не существует.
!!?!! Построить **ЖНФ** и канонический базис для оператора из примера 2.
===Жорданова нормальная форма над полем вещественных чисел==
В настоящем пункте пространство $ \mathbb V_{} $ размерности $ \dim \mathbb V_{} = n $ предполагается вещественным.
===Примеры==
☞
((:mapping:operator:jordan:examples ЗДЕСЬ))
===Задачи==
☞
((:mapping:operator:jordan:problems ЗДЕСЬ))
==Источники==
[1]. **Фаддеев Д.К., Фаддеева В.Н.** //Вычислительные методы линейной алгебры//. М.ГИФМЛ. 1960.
[2]. **Проскуряков И.В.** //Сборник задач по линейной алгебре.// М.Наука. 1974