Линейное отображение линейного (векторного) пространства $ \mathbb V_{} $ в себя $$ \mathcal A : \mathbb V \longmapsto \mathbb V $$ называется линейным преобразованием $ \mathbb V_{} $ или линейным оператором1) на $ \mathbb V_{} $.
Напомню свойство линейности: $$ \mathcal A (X_1 +X_2)= \mathcal A(X_1) + \mathcal A(X_2),\quad \mathcal A (\alpha_1 X_1)= \alpha_1 \mathcal A (X_1), $$ или, в эквивалентном виде: $$ \mathcal A(\alpha_1 X_1 + \alpha_2 X_2)= \alpha_1 \mathcal A(X_1) + \alpha_2 \mathcal A(X_2) $$ для $ \forall \ \{X_1,X_2\} \subset \mathbb V,\ \forall \ \{\alpha_1,\alpha_2 \} \subset \mathbb R \ \mbox{ или } \ \mathbb C $ (здесь $ \alpha_1,\alpha_ 2 $ --- константы из $ \mathbb R_{} $ если $ \mathbb V_{} $ вещественное пространство, и из $ \mathbb C_{} $, если оно комплексное).
Бóльшую часть примеров пункта ☞ ПРИМЕРЫ ЛИНЕЙНЫХ ОТОБРАЖЕНИЙ представляют именно линейные операторы. Укажу еще несколько, к которым буду часто обращаться.
Пример 1. В пространстве $ \mathbb R^{3} $ рассмотрим следующие действия над вектором2) $ (x_{},y,z) $:
Все это — примеры линейных операторов. Но вот отображение сдвига $ (x,y,z) \mapsto (x+1,y,z+2) $ оператором не является поскольку $$ {\color{RubineRed} \alpha } (x,y,z) = ( {\color{RubineRed} \alpha } x, {\color{RubineRed} \alpha } y, {\color{RubineRed} \alpha } z) \mapsto ( {\color{RubineRed} \alpha } x+1, {\color{RubineRed} \alpha } y, {\color{RubineRed} \alpha } z+2) \ne {\color{RubineRed} \alpha } (x+1,y,z+2) \ . $$
Пример 2. В пространстве $ \mathbb R^{3} $ отображение ортогонального проецирования на плоскость $ x+y-7\, z=0 $ будет линейным оператором (а вот на плоскость $ x+y-7\, z=1 $ — не будет!). Вообще, в произвольном пространстве $ \mathbb V_{} $ разбитом в прямую сумму нетривиальных подпространств $ \mathbb V= \mathbb V_1 \oplus \mathbb V_2 $ отображение, сопоставляющее вектору $ X_{} $ его проекцию на подпространство $ \mathbb V_1 $ параллельно подпространству $ \mathbb V_2 $, будет оператором.
Пример 3. В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степеней $ \le 3 $ отображение $ \mathcal A_{} $ действует по правилу
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ т.е. полином $ f_{}(x) $ отображается в остаток от деления произведения $ f(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Это отображение будет оператором в $ \mathbb P_3 $. Действительно, если $$ \begin{array}{l} f_1(x)(x^2-2) \equiv q_1(x)(x^4-x^3-x^2+x)+ r_1(x)\, , \\ f_2(x)(x^2-2) \equiv q_2(x)(x^4-x^3-x^2+x)+ r_2(x) , \end{array} $$ при $ \{q_1(x),q_2(x),r_1(x),r_2(x)\} \subset \mathbb R[x], \deg r_1(x) \le 3, \deg r_2(x) \le 3 $, то $$ (\alpha_1 f_1(x)+\alpha_2 f_2(x)) (x^2-2) \equiv (\alpha_1 q_1(x)+\alpha_2 q_2(x))(x^4-x^3-x^2+x)+ (\alpha_1 r_1(x)+\alpha_2 r_2(x)) ; $$ очевидно, что $ \deg (\alpha_1 r_1(x)+\alpha_2 r_2(x)) \le 3 $. ♦
Пример 4. Задачу интерполяции можно интерпретировать как построение некоторого отображения. В интерполяционной таблице
$$ \begin{array}{c|ccccc} x & x_1 & x_2 & \dots & x_n \\ \hline y & y_1 & y_2 &\dots & y_n \end{array} \qquad npu \qquad \{ x_{1}, \dots, x_{n}, y_{1},\dots,y_{n} \} \subset \mathbb C $$ будем считать узлы $ \{ x_j\}_{j=1}^n $ фиксированными, а значения $ \{ y_j\}_{j=1}^n $ — переменными. Эта таблица однозначно определяет интерполяционный полином $ f(x)=A_{0}+A_1x+\dots+A_{n-1}x^{n-1} $ со свойством $ f(x_j)=y_j $ при $ j \in \{1,\dots,n\} $. При этом $ \{A_{j} \}_{j=0}^{n-1} \subset \mathbb C $. Будет ли получившееся отображение $$ (y_1,\dots,y_n) \mapsto (A_0,A_1,\dots,A_{n-1}) $$ оператором на $ \mathbb C^n $? Покажем, что отображение $$ \mathcal A(y_1,\dots,y_n) = f(x) \in \mathbb C[x] $$ является линейным отображением. Действительно, решением задачи интерполяции для таблицы $$ \begin{array}{c|ccccc} x & x_1 & x_2 & \dots & x_n \\ \hline y & \alpha y_1 & \alpha y_2 &\dots & \alpha y_n \end{array} \qquad npu \qquad \forall \alpha \in \mathbb C $$ является полином $ \alpha f(x) $. Если же, вдобавок, решением задачи интерполяции для таблицы $$ \begin{array}{c|ccccc} x & x_1 & x_2 & \dots & x_n \\ \hline y & z_1 & z_2 &\dots & z_n \end{array} \qquad npu \qquad \{ z_{1},\dots,z_{n} \} \subset \mathbb C $$ является полином $ g(x)\in \mathbb C[x], \deg g(x) \le n-1 $, то решением задачи интерполяции для таблицы $$ \begin{array}{c|ccccc} x & x_1 & x_2 & \dots & x_n \\ \hline y & y_1+z_1 & y_2+z_2 &\dots & y_n+z_n \end{array} \qquad $$ будет полином $ f(x)+g(x) $ и этот полином будет единственным решением среди полиномов степеней $ \le n-1 $. Таким образом, линейность отображения $ \mathcal A $ установлена. Далее, множество $ \mathbb P_{n-1} $ полиномов из $ \mathbb C[x] $ степеней $ \le n-1 $ изоморфно пространству $ \mathbb C^n $. Следовательно, «сложное» отображение $$ (y_1,\dots,y_n) \mapsto f(x)=A_{0}+A_1x+\dots+A_{n-1}x^{n-1} \mapsto (A_0,A_1,\dots,A_{n-1}) $$ является линейным отображением из $ \mathbb C^n $ в $ \mathbb C^n $, т.е. оператором на $ \mathbb C^n $.
По аналогии с задачей алгебраической интерполяции, можно поставить и задачу тригонометрической интерполяции. Имеем здесь «точку входа» в теорию дискретного преобразования Фурье. ♦
В пространстве $ \mathbb P_2 $ оператор действует следующим образом:
$$ \mathcal A (x^2+x+1) =2\,x+1,\ \mathcal A (x^2-x-1) =2\,x^2-1,\ \mathcal A (x+1) =-x^2+x+1 \ . $$ Вычислить $ \mathcal A (x^2) $ и $ \mathcal A (x^2+1) $.
Пример 5. В пространстве полиномов степени не выше $ n_{} $ с вещественными коэффициентами от $ m_{} $ переменных $ x_1,x_2,\dots,x_{m} $ отображение
$$ f(x_1,x_2,\dots,x_m) \mapsto \frac{\partial^2 f}{\partial x_1^2} +\frac{\partial^2 f}{\partial x_2^2}+ \dots+ \frac{\partial^2 f}{\partial x_m^2} $$ яыляется линейным оператором. Этот оператор известен как оператор Лапласа и для него используется символьное обозначение $$ \Delta = \frac{\partial^2 }{\partial x_1^2} +\frac{\partial^2 }{\partial x_2^2}+ \dots+ \frac{\partial^2 }{\partial x_m^2} \, . $$
Пример 6. В линейном пространстве квадратных матриц порядка $ n_{} $ с вещественными элементами рассмотрим коммутирующее отображение
$$ \mathcal K (X) = AX-XA \ , $$ а также отображение Ляпунова $$ \mathcal V (X) = A^{\top}X+XA $$ при произвольной фиксированной квадратной матрице $ A_{} $ и $ {}^{\top} $ означающем транспонирование. Легко проверить, что оба отображения $ \mathcal K $ и $ \mathcal V $ являются операторами. ♦
Все введенные для линейного отображения понятия переносятся на этот частный случай. Например, ядром оператора называется множество векторов, отображаемых оператором в нулевой вектор: $$\mathcal{K}er (\mathcal A)= \left\{X\in \mathbb V \big| \mathcal A(X)=\mathbb O \right\} \ ; $$ а образом оператора называется множество всех векторов из $ \mathbb V_{} $, для каждого из которых существует прообраз в том же пространстве: $$\mathcal{I}m (\mathcal A)= \left\{Y\in \mathbb V \mid \exists X \in \mathbb V, \ \mathcal A(X)= Y \right\} \ .$$
Теорема 1. Множества $ \mathcal{K}er (\mathcal A) $ и $ \mathcal{I}m (\mathcal A) $ являются подпространствами пространства $ \mathbb V_{} $.
Доказать, что для оператора в $ \mathbb R^4 $
$$ \mathcal A \left(\begin{array}{c} x_1 \\ x_2 \\ x_3 \\ x_4 \end{array} \right)= \left(\begin{array}{c} x_3 \\ x_4 \\ 0 \\ 0 \end{array} \right) $$ имеет место равенство $ \mathcal{K}er (\mathcal A) = \mathcal{I}m (\mathcal A) $.
Для оператора $ \mathcal A_{} $ его дефектом его называется размерность ядра, а его рангом — размерность образа: $$ \operatorname{dfc}(\mathcal A )=\dim (\mathcal{K}er (\mathcal A )) , \ \operatorname{rank}(\mathcal A )= \dim (\mathcal{I}m (\mathcal A )) \ . $$ Оператор называется невырожденным если $ \operatorname{dfc}(\mathcal A )=0 $.
Пример. В пространстве $ \mathbb R^{3} $ оператор проецирования на плоскость:
$$ \mathcal A \left(x, y, z\right) \longmapsto \left(x, y, 0 \right) $$ является вырожденным поскольку его ядро нетривиально: $ \mathcal{K}er (\mathcal A)=\{(0,0,z) | z \in \mathbb R \} $. ♦
Следующий результат является следствием теоремы $ 4 $ из ☞ ПУНКТА.
Теорема 2. Имеет место равенство:
$$ \dim \mathbb V=\dim \left( \mathcal{K}er (\mathcal A) \right) + \dim \left( \mathcal{I}m (\mathcal A) \right) = \operatorname{dfc}(\mathcal A )+ \operatorname{rank}(\mathcal A ) \ .$$
Отображение $ \mathcal P:\ \mathbb V \longmapsto \mathbb V $ называется произведением оператора $ \mathcal A $ на оператор $ \mathcal B $ если $ \mathcal P(X)=\mathcal A (\mathcal B(X)) $ для любого $ X\in \mathbb V_{} $. Записывать этот факт будем в виде $ \mathcal P=\mathcal A \, \mathcal B $.
Теорема 3. Произведение операторов является оператором на $ \mathbb V_{} $. Операция произведения ассоциативна.
Доказательство. Имеем на основании свойства линейности $$\mathcal P (\alpha_1X_1+\alpha_2X_2)= \mathcal A (\mathcal B(\alpha_1X_1+\alpha_2X_2))=\mathcal A (\alpha_1\mathcal B(X_1)+ \alpha_2\mathcal B(X_2))=$$ $$=\alpha_1\mathcal A (\mathcal B(X_1))+ \alpha_2\mathcal A (\mathcal B(X_2))=\alpha_1\mathcal P(X_1)+\alpha_2{\mathcal P}(X_2).$$
Далее, для любого вектора $ X_{} $: $$\mathcal A_1(\mathcal A_2\mathcal A_3(X))= \mathcal A_1(\mathcal A_2(\mathcal A_3(X)))=\mathcal A_1\mathcal A_2({\mathcal A}_3(X)) \ ,$$ откуда и следует ассоциативность. ♦
Говорят, что операторы $ \mathcal A $ и $ \mathcal B $ коммутируют если $ \mathcal A \, \mathcal B = \mathcal B \, \mathcal A $.
Пример. В плоскости $ \mathbb R^2 $ операторы поворота точек вокруг начала координат на углы $ \varphi $
$$ (x,y) \mapsto (x \cos \varphi -y \sin \varphi, \ x \sin \varphi + y \cos \varphi) $$ и $ \psi $ $$ (x,y) \mapsto (x \cos \psi - y \sin \psi, \ x \sin \psi + y \cos \psi) $$ против часовой стрелки коммутируют. Результатом их произведения является оператор $$ (x,y) \mapsto \left(x \cos (\varphi+\psi) -y \sin (\varphi+\psi), \ x \sin (\varphi+\psi) + y \cos (\varphi+\psi) \right) $$ поворота на угол $\varphi+\psi $.
Напротив, в пространстве $ \mathbb R^3 $ оператор поворота точек вокруг оси $ Oz $ на угол $ \pi/2 $ не коммутирует с оператором поворота точек вокруг оси $ Ox $ на угол $ \pi/2 $.
Пример. В пространстве полиномов $ \mathbb P_{n} $ рассмотрим дифференциальный оператор
$$\mathcal A = x\frac{d}{d\, x}\times \Box - 1\times \Box \ : \ \mathcal A(p(x)) = x p'(x) - p(x) \ .$$ Этот оператор не коммутирует с обычным оператором дифференцирования $ \displaystyle \mathcal B= \frac{d}{d\, x} $: $$\mathcal A (x^2)=x^2, \quad \mathcal B (\mathcal A(x^2))=2\,x, \quad \mathcal B (x^2)=2\,x, \quad \mathcal A (\mathcal B (x^2))=0 \ .$$ ♦
Оператор $ \mathcal E $, отображающий произвольный вектор $ X\in \mathbb V_{} $ в себя : $ \mathcal E(X)= X $, называется тождественным на $ \mathbb V_{} $. Оператор $ \mathcal B $ называется (левым) обратным оператору $ \mathcal A_{} $, если $ \mathcal B\mathcal A=\mathcal E $. В этом случае оператор $ \mathcal A_{} $ называют обратимым и записывают: $ \mathcal B=\mathcal A^{-1} $.
Не всякий оператор обратим.
Пример. В пространстве $ \mathbb R^{3} $ для оператора проецирования на плоскость:
$$ \mathcal A \left(x, y, z\right) \longmapsto \left(x, y, 0 \right) $$ обратного не существует, т.к. $ \mathcal A(0,0,1)=(0,0,0) $ и ни при каком выборе оператора $ \mathcal B $ нельзя добиться выполнения равенства $ \mathcal B(0,0,0)=(0,0,1) $. ♦
Показать, что обратным для оператора
$$\frac{1}{x}\int_0^x \ : p(x) \longmapsto \frac{1}{x}\int_{0}^{x} p(t) d\, t \ ,$$ на $ \mathbb P_{n} $ является оператор $$ \frac{d}{d\,x}\left(x\times \Box \right) \ : p(x) \longmapsto (xp(x))' \ .$$
Теорема 4. Оператор $ \mathcal A_{} $ обратим тогда и только тогда, когда когда он невырожден: $ \operatorname{dfc} (\mathcal A) =0 $. В этом случае $ \mathcal A^{-1} $ единствен и коммутирует с $ \mathcal A $.
При $ K\in \mathbb N $ и $ K>1 $, $ K_{} $-я степень оператора $ \mathcal A $ определяется рекурсивной формулой $$\mathcal A^{\, K}=\mathcal A (\mathcal A^{\, K-1})\ .$$ Если, вдобавок, $ \mathcal A $ невырожден, то отрицательная степень оператора определяется формулой $$\mathcal A^{-K}=\left(\mathcal A^{-1}\right)^K \ . $$ Полагают также $ \mathcal A^{\, 0}= {\mathcal E} $ для любого $ \mathcal A \ne {\mathcal O} $.
Теорема 5. Степени оператора $ \mathcal A $ коммутируют:
$$\mathcal A^{\, K} \mathcal A^{\, L}=\mathcal A^{\, L}\mathcal A^{\, K}=\mathcal A^{\, K+L} \ .$$
Пример. $ K_{} $-й степенью оператора дифференцирования в пространстве полиномов $ \mathbb P_{n} $ будет оператор нахождения $ K_{} $-й производной:
$$\left( \frac{d}{d\,x} \right)^K = \frac{d^K}{d\,x^K} \ .$$ Очевидно, что при $ K_{}>n $ этот оператор будет нулевым. ♦
Пример. В произвольном пространстве $ \mathbb V_{} $ разбитом в прямую сумму нетривиальных подпространств $ \mathbb V= \mathbb V_1 \oplus \mathbb V_2 $ оператор проецирования $ \mathcal P $ на подпространство $ \mathbb V_1 $ параллельно подпространству $ \mathbb V_2 $ обладает свойством $ \mathcal P^2 = \mathcal P $ (проецирование проекции оставляет ее на месте). ♦
Оператор $ \mathcal A $, обладающий свойством $ \mathcal A^2 = \mathcal A $, называется идемпотентным3). (Это же определение распространяется и на квадратную матрицу $ A $ со свойством $A^2=A $).
Пример. В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степени $ \le 3 $ отображение $ \mathcal A_{} $ действует по правилу
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ т.е. полином $ f_{}(x) $ отображается в остаток от деления произведения $ f(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Для этого оператора $ K_{} $-й его степенью является оператор $$ \mathcal B (f(x)) = f(x) (x^2-2)^K \pmod{x^4-x^3-x^2+x} \ . $$ Действительно, если $$ f(x)(x^2-2) \equiv q(x)(x^4-x^3-x^2+x)+ r(x) $$ при $ \{q(x),r(x)\} \subset \mathbb R[x] $ и $ \deg r(x) \le 3 $, то $$ f(x)(x^2-2)^2 \equiv q(x)(x^4-x^3-x^2+x)(x^2-2)+ r(x)(x^2-2) \ . $$ Но тогда $$ \mathcal A^2 (f(x))= \mathcal A (r(x)) = r(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \equiv $$ $$ \equiv f(x)(x^2-2)^2 \pmod{x^4-x^3-x^2+x} \ . $$ Завершает доказательство святая индукция по степени $ K_{} $… ♦
Пусть задан произвольный полином $ g(x)=b_{0}x^m+b_1x^{m-1}+\dots+b_m $ из $ \mathbb R[x] $ или $ \mathbb C[x] $. Выражение $$g(\mathcal A )= b_0\mathcal A^{m}+b_1\mathcal A^{m-1}+\dots+b_m{\mathcal E}$$ будем называть операторным полиномом.
Доказать, что операторные полиномы коммутируют: $ g_1(\mathcal A )g_2(\mathcal A )=g_2(\mathcal A )g_1(\mathcal A ) $.
Доказать, что для любого $ \mathcal A \in {\mathcal H}om(\mathbb V,\mathbb V) $ всегда найдется полином $ g_{}(x) $, $ \deg g \le n^2+1 $ такой, что $ g(\mathcal A)={\mathcal O} $.
Сформулируем еще один результат, являющийся частным случаем приведенного в пункте ☞ СВОЙСТВА ЛИНЕЙНЫХ ОТОБРАЖЕНИЙ.
Теорема 6. Пусть $ \{X_1,X_2,\dots,X_n\} $ — произвольный базис $ \mathbb V_{} $, а $ Y_1,Y_2,\dots,Y_n $ — произвольные векторы того же пространства. Существует единственный оператор $ \mathcal A: \mathbb V \longmapsto \mathbb V $ такой, что
$$ \mathcal A(X_1)=Y_1,\mathcal A(X_2)=Y_2, \dots,\mathcal A(X_n)=Y_n \ .$$
Доказательство. Искомый оператор строится следующим образом. Если $ X=x_1X_1+x_2X_2+\dots+x_nX_n $ — разложение произвольного вектора $ X \in \mathbb V $ по базису, то $$ \mathcal A(X)=x_1 Y_1+x_2Y_2+\dots+ x_nY_n \ . $$ Единственность этого оператора доказывается от противного. Любой другой оператор $ \mathcal B $, удовлетворяющий условиям $ \{\mathcal B(X_j)=Y_j\}_{j=1}^n $, будет действовать на тот же вектор $ X_{} $ с тем же результатом: $$ \mathcal B(X)=x_1 \mathcal B(X_1)+x_2\mathcal B(X_2) +\dots+ x_n\mathcal B(X_n)= x_1 Y_1+x_2Y_2+\dots+ x_nY_n= \mathcal A(X)\ . $$ ♦
Таким образом, оператор — как функция, действующая в $ n_{} $-мерном линейном пространстве, однозначно определяется заданием на $ n_{} $ линейно независимых векторах. В доказательстве теоремы дается и конструктивный способ представления оператора по этим значениям (т.е. строится его "интерполяционная формула" ).
Рассмотрим оператор $ \mathcal A $ на $ \mathbb V_{} $ и пусть $ \{X_1,\dots,X_n\} $ — базис $ \mathbb V_{} $. Являясь частным случаем линейного отображения, оператор должен обладать и соответствующей матрицей. Существенной особенностью, отличающей наш случай от рассмотренного в пункте ☞ МАТРИЦА ЛИНЕЙНОГО ОТОБРАЖЕНИЯ, является невозможность произвола при выборе базиса для $ \mathcal{I}m (\mathcal A) $. Поскольку $ \mathcal{I}m (\mathcal A) $ является подпространством $ \mathbb V_{} $, то было бы слишком большой роскошью иметь два разных базиса для одного и того же пространства.
Найдем координаты образов базисных векторов $ \mathcal A (X_1),\dots,\mathcal A (X_n) $ в том же базисе $ \{X_1,\dots,X_n\} $: $$ \left\{ \begin{array}{ccc} \mathcal A(X_1)&=&{{\color{RubineRed} \alpha }}_{11}X_1+{{\color{RubineRed} \alpha }}_{21}X_2+\dots+{{\color{RubineRed} \alpha }}_{n1}X_n, \\ \mathcal A(X_2)&=&{{\color{Green} \alpha }}_{12}X_1+{{\color{Green} \alpha }}_{22}X_2+\dots+{{\color{Green} \alpha }}_{n2}X_n, \\ \dots & & \qquad \dots , \\ \mathcal A(X_n)&=&\alpha_{1n}X_1+\alpha_{2n}X_2+\dots+\alpha_{nn}X_n. \end{array} \right. $$ Матрица $$ \mathbf A= \left(\begin{array}{cccc} {{\color{RubineRed} \alpha }}_{11} & {{\color{Green} \alpha }}_{12}& \dots & \alpha_{1n} \\ {{\color{RubineRed} \alpha }}_{21} & {{\color{Green} \alpha }}_{22}& \dots & \alpha_{2n} \\ \dots & & & \dots \\ {{\color{RubineRed} \alpha }}_{n1} & {{\color{Green} \alpha }}_{n2}& \dots & \alpha_{nn} \end{array} \right)_{n\times n}, $$ в столбцах которой стоят координаты образов базисных векторов, называется матрицей оператора $ \mathcal A_{} $ в базисе $ \{X_1,\dots,X_n\} $.
Пример. Известны образы базисных векторов $ \mathbb R^{3} $ под действием оператора $ \mathcal A_{} $:
$$\mathcal A \left( \begin{array}{r} 5 \\ 3 \\ 1 \end{array}\right)= \left( \begin{array}{r} -2 \\ 1 \\ 0 \end{array}\right) ,\ \mathcal A \left( \begin{array}{r} 1 \\ -3 \\ -2 \end{array}\right) = \left( \begin{array}{r} -1 \\ 3 \\ 0 \end{array}\right) ,\ \mathcal A \left( \begin{array}{r} 1\\ 2 \\ 1 \end{array}\right)= \left( \begin{array}{r} -2 \\ -3 \\ 0 \end{array}\right) \ . $$ Найти матрицу этого оператора в исходном базисе.
Решение. Элементы матрицы $ {\mathbf A} $ ищутся по формулам из определения, которые можно переписать в матричном виде: $$\left[ X_1,\dots,X_n \right] {\mathbf A}=\left[ \mathcal A (X_1),\dots,\mathcal A (X_n) \right] \ .$$ Откуда $${\mathbf A}= \left[ X_1,\dots,X_n \right]^{-1} \left[ \mathcal A (X_1),\dots,\mathcal A (X_n) \right] \ ,$$ и для нашего примера эта формула дает $$ {\mathbf A}= \left(\begin{array}{rrr} 5&1&1 \\ 3&-3&2 \\ 1&-2&1 \end{array}\right)^{-1} \left(\begin{array}{rrr} -2&-1&-2 \\ 1&3&-3 \\ 0&0&0 \end{array}\right) = $$ $$ =\left(\begin{array}{rrr} 1&-3&5\\ -1&4&-7\\ -3&11&-18 \end{array}\right) \left(\begin{array}{rrr} -2&-1&-2 \\ 1&3&-3 \\ 0&0&0 \end{array}\right) = \left(\begin{array}{rrr} -5&-10&7\\ 6&13&-10\\ 17&36&-27 \end{array} \right). $$ ♦
В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степени $ \le 3 $ оператор $ \mathcal A_{} $ действует по правилу
$$ \mathcal A (f(x)) = f(x) (x^3+2\,x^2+1) \pmod{x^4+4} \ , $$ т.е. полином $ f_{}(x) $ отображается в остаток от деления произведения $ f(x) (x^3+2\,x^2+1) $ на $ x^4+4 $. Найти матрицу оператора $ \mathcal A_{} $ в базисе $ \{1,x,x^2,x^3\} $.
Ответ. $$ \left(\begin{array}{rrrr} 1 & -4 & -8 & 0 \\ 0 & 1 & -4 & -8 \\ 2& 0 & 1 & -4 \\ 1 & 2 & 0 & 1 \end{array} \right) \ . $$
Теорема 7. Координаты произвольного вектора $ X=x_1X_1+\dots+x_nX_n $ и его образа $ Y=\mathcal A(X)=y_1X_1+\dots+y_nX_n $ связаны формулой
$$ \left(\begin{array}{c} y_1 \\ \vdots \\ y_n \end{array} \right) = {\mathbf A}\left(\begin{array}{c} x_1 \\ \vdots \\ x_n \end{array} \right) \ . $$
Как изменяется матрица оператора при переходе к новому базису?
Теорема 8. Если $ C_{} $ — матрица перехода от старого базиса к новому, то матрицы $ {\mathbf A} $ и $ {\mathbf B} $ оператора в старом и новом базисах связаны формулой: $$ {\mathbf B}=C^{-1}\cdot {\mathbf A} \cdot C \ . $$
Доказательство ☞ ЗДЕСЬ.
Пример. Оператор $ \mathcal A $ в базисе пространства $ \mathbb R^{3} $
$$ \underbrace{\left( \begin{array}{r} 8 \\ -6 \\ 7 \end{array}\right)}_{X_1},\ \underbrace{\left( \begin{array}{r} -16 \\ 7 \\ -13 \end{array}\right)}_{X_2} ,\ \underbrace{\left( \begin{array}{r} 9\\ -3 \\ 7 \end{array}\right)}_{X_3} \qquad \mbox{ имеет матрицу } \qquad \left( \begin{array}{rrr} 1&-18&15\\ -1&-22&20\\ 1&-25 &22 \end{array}\right). $$ Найти его матрицу в базисе $$ \underbrace{\left( \begin{array}{r} 1\\ -2 \\ 1 \end{array}\right)}_{\mathfrak X_1} , \ \underbrace{\left( \begin{array}{r} 3\\ -1 \\ 2 \end{array}\right)}_{\mathfrak X_2} , \ \underbrace{\left( \begin{array}{r} 2\\ 1 \\ 2 \end{array}\right)}_{\mathfrak X_3}. $$
Решение. Матрица $ C_{} $ перехода от старого базиса к новому находится по ☞ формуле $$ C= \left[X_1|X_2|X_3\right]^{-1} \cdot \left[{\mathfrak X}_1|{\mathfrak X}_2|{\mathfrak X}_3\right]= $$ $$ =\left( \begin{array}{rrr} 8&-16&9\\ -6&7&-3\\ 7&-13 &7 \end{array}\right)^{-1} \left( \begin{array}{rrr} 1&3&2\\ -2&-1&1\\ 1&2 &2 \end{array}\right) = $$ $$ =\left (\begin{array}{rrr} 2&-1&-3\\ {\scriptstyle 21}/{\scriptstyle 5}& -{\scriptstyle 7}/{\scriptstyle 5}&-6\\ {\scriptstyle 29}/{\scriptstyle 5}&-{\scriptstyle 8}/{\scriptstyle 5}&-8 \end{array}\right) \left( \begin{array}{rrr} 1&3&2\\ -2&-1&1\\ 1&2 &2 \end{array}\right)= \left(\begin{array}{rrr} 1&1&-3\\ 1&2&-5\\ 1&3&-6 \end{array}\right) \ . $$ По теореме: $$ {\mathbf B}=C^{-1} {\mathbf A} C= \left(\begin{array}{rrr} 3&-3&1\\ 1&-3&2\\ 1&-2&1 \end{array}\right) \left( \begin{array}{rrr} 1&-18&15\\ -1&-22&20\\ 1&-25 &22 \end{array}\right) \left(\begin{array}{rrr} 1&1&-3\\ 1&2&-5\\ 1&3&-6 \end{array}\right)= $$ $$ =\left(\begin{array}{rrr} 7&-13&7\\ 6&-2&-1\\ 4&1&-3 \end{array}\right) \left(\begin{array}{rrr} 1&1&-3\\ 1&2&-5\\ 1&3&-6 \end{array}\right)=\left(\begin{array}{rrr} 1&2&2\\ 3&-1&-2 \\ 2&-3&1 \end{array}\right). $$ ♦
Матрицы $ {\mathbf A} $ и $ {\mathbf B} $, связанные соотношением $ {\mathbf B}=C^{-1}\cdot {\mathbf A} \cdot C $ при какой-то неособенной матрице $ C_{} $, называются подобными, этот факт будем записывать: $ {\mathbf A}\doteq {\mathbf B} $.
Доказать, что отношение подобия есть отношение эквивалентности, и если $ {\mathbf A}\doteq {\mathbf B} $ то $ g({\mathbf A})\doteq g({\mathbf B}) $ при любом полиноме $ g_{}(x) $.
Теорема 9. Для оператора $ \mathcal A_{} $ ранг его матрицы является инвариантом, т.е. не зависит от выбора базиса пространства. Этот ранг совпадает с рангом оператора $ \mathcal A_{} $.
Доказательство. Если $ {\mathbf A} $ и $ {\mathbf B} $ — матрицы оператора в двух разных базисах, то они являются подобными: $ {\mathbf B}=C^{-1}{\mathbf A} C $. По свойству ранга матрицы имеем: $ \operatorname{rank}( {\mathbf B})= \operatorname{rank}({\mathbf A}) $. ♦
Дефект оператора $ \mathcal A_{} $ совпадает с дефектом его матрицы в произвольном базисе пространства.
Теорема 10. Для оператора $ \mathcal A_{} $ определитель и след его матрицы являются инвариантами, т.е. не зависят от выбора базиса пространства.
Доказательство. Действительно, для подобных матриц $ {\mathbf A} $ и $ {\mathbf B} $, на основании теоремы Бине-Коши имеем: $$ \det ({\mathbf B}) = \det (C^{-1}{\mathbf A} C) = \det (C^{-1}) \cdot \det ({\mathbf A}) \cdot \det (C) =\det ({\mathbf A}) . $$ Далее, по свойству следа матрицы: $$ \operatorname{Sp}({\mathbf B}) = \operatorname{Sp}(C^{-1}{\mathbf A} C)=\operatorname{Sp}({\mathbf A} \cdot C \cdot C^{-1})=\operatorname{Sp}({\mathbf A}) \ . $$ ♦
Этот результат позволяет ввести понятие определителя и следа оператора $ \mathcal A_{} $ — посредством матрицы этого оператора в произвольном базисе пространства. Такое определение оказывается корректным поскольку оба значения не зависят от выбора базиса.
Каков "физический" смысл определителя оператора?
Начнем с примера.
Пример. Пусть на плоскости $ \mathbb R^2 $ задано стандартное скалярное произведение. Рассмотрим оператор, отображающий векторы по правилу
$$ \left(\begin{array}{l} y_1 \\ y_2 \end{array} \right)= \left(\begin{array}{rr} 1 & - 3 \\ 1 & -1 \end{array} \right) \left(\begin{array}{l} x_1 \\ x_2 \end{array} \right) \ . $$ Свойство линейности оператора как отображения плоскости проявляется в том, что параллельные отрезки он отображает в параллельные же отрезки (см. упражнение к теореме 2 из ☞ ПУНКТА ), и, следовательно, любой параллелограмм отображается им в параллелограмм.
Площади соответствующих параллелограммов оказываются связанными через определитель матрицы — более точно, через модуль этого определителя. Причем этот результат не зависит от расположения отображаемой фигуры: коэффициент растяжения будет одинаков в любом месте плоскости. ♦
В рассмотренном примере это проверяется непосредственно; что касается обобщения на произвольное евклидово пространство, в котором понятие объема вводится аксиоматически то справедлив следующий результат.
Теорема 11. Пусть $ \{X_{1},\dots,X_n \} $ — произвольные векторы $ n_{} $-мерного евклидова пространства $ \mathbb E_{} $, а $ \mathcal A_{} $ — линейный оператор, действующий в этом пространстве. Справедливо равенство
$$ {\mathfrak G}(\mathcal A (X_1),\dots, \mathcal A (X_n))=\left( \det (\mathcal A) \right)^2 \cdot {\mathfrak G}(X_1,\dots, X_n) \ . $$ Здесь ${\mathfrak G}$ — определитель Грама.
Доказательство проведем для частного случая пространства столбцов $ \mathbb R^n $ со стандартным скалярным произведением и оператором $$ Y=AX $$ при вещественной матрице $ A_{n\times n} $. Составим матрицу из столбцов $$ \mathbf X=\left[X_1|X_2|\dots|X_n \right] \, . $$ Тогда матрицу Грама этих столбцов можно представить в виде $$ G(X_1,X_2,\dots,X_n) = \mathbf X^{\top} \mathbf X \, , $$ и ее определитель равен $ (\det \mathbf X)^2 $. А матрицу Грама столбцов $ \{ AX_1,AX_2,\dots, AX_n \} $ можно представить в виде $$ G(AX_1,AX_2,\dots,AX_n) = (A\mathbf X)^{\top} (A\mathbf X) = \mathbf X^{\top} A^{\top} A \mathbf X \, . $$ На основании теоремы Бине-Коши определитель последней матрицы равен $ (\det A)^2 (\det \mathbf X)^2 $. ♦
Теперь совмещаем этот результат со следующим, взятым ОТСЮДА
Теорема. Квадрат объема параллелепипеда, построенного на векторах системы $ \{X_1,X_2,\dots,X_k\} $, совпадает с величиной определителя Грама от той же системы:
$$[V(X_1,X_2,\dots,X_k)]^2= \mathfrak G (X_1,X_2,\dots,X_k) \ .$$
Где-то в курсе математического анализа есть результат, что внутрь оболочки любого кубируемого тела в $ \mathbb R^3 $ может быть заложен конечный набор параллелепипедов так что суммарный объем этого набора сколь угодно мало будет отличаться от объема тела (см. ☞ видео). За счет этого результата (и его абстрагированием в произвольное евклидово пространство) приходим к умозаключению.
Случаю $ |\det (\mathcal A)|=1 $ соответствует оператор, сохраняющий объемы. Примером такого оператора является оператор
$$ PX,\ X\in \mathbb R^n , $$ при ортогональной матрице $ P \in \mathbb R^{n\times n} $. Этот оператор сохраняет не только объемы, но и расстояния между точками пространства, а также углы между векторами. Так, к примеру, $$ \langle PX, PX \rangle = X^{\top} P^{\top}P X = X^{\top} E X= X^{\top} X = \langle X, X \rangle \, . $$
Теорема 6. Оператор обратим тогда и только тогда, когда когда его определитель отличен от нуля.
Теорема 7. Линейное пространство $ {\mathcal H}om(\mathbb V,\mathbb V) $ операторов на $ \mathbb V_{}, \dim \mathbb V = n $ изоморфно линейному пространству квадратных матриц порядка $ n_{} $ (с элементами из $ \mathbb R_{} $ или из $ \mathbb C_{} $).
Это утверждение является простым следствием теоремы 2, приведенной в пункте ☞ МАТРИЦА ЛИНЕЙНОГО ОТОБРАЖЕНИЯ. Однако в случае операторов установленный изоморфизм сохранит не только результат операции сложения, но и результат операции умножения: $$ . \mbox{ если } \mathcal A_1 \leftrightarrow \mathbf A_1,\ \mathcal A_2 \leftrightarrow \mathbf A_2, \mbox{ то } \mathcal A_1+ \mathcal A_2 \leftrightarrow \mathbf A_1 + \mathbf A_2,\ \lambda \mathcal A_1 \leftrightarrow \lambda \mathbf A_1 \ , \ \mathcal A_1 \mathcal A_2 \leftrightarrow \mathbf A_1 \mathbf A_2 \ . $$ Я сформулирую этот «усиленный вариант» изоморфизма в виде набора свойств, которыми буду пользоваться по мере возникновения потребности.
Теорема 8. В любом базисе пространства
а) матрица нулевого оператора $ \mathcal O $ является нулевой матрицей $ \mathbb O_{} $, а матрица тождественного оператора $ \mathcal E $ является единичной матрицей $ E_{} $; обратно: если матрица оператора в этом базисе — нулевая (единичная), то оператор является нулевым (соответственно, тождественным);
б) матрица произведения операторов совпадает с произведением матриц этих операторов5);
в) коммутирующим операторам соответствуют коммутирующие матрицы;
г) если $ {\mathbf A} $ — матрица оператора, то $ {\mathbf A}^{-1} $ — матрица обратного оператора;
д) если $ {\mathbf A} $ — матрица оператора $ \mathcal A $, то матрицей операторного полинома $ g (\mathcal A) $ является матрица $ g({\mathbf A}) $ .
Эти матрицы как-то взаимодействовали между собой в предыдущем пункте, хотя вторая была определена совершенно в другом разделе. Обе матрицы квадратные, обе имеют в определении «завязку» на базис пространства $ \mathbb V_{} $. У начинающих изучать теорию часто возникает путаница при различении этих определений.
«Физический» смысл этих понятий различен. Образно говоря, если рассматривать оператор как процесс (точнее: установленную связь между входными и выходными значениями процесса), то выбор базиса можно интерпретировать как выбор точки зрения на этот процесс (можно трактовать эти слова как формализацию выражения «рассмотрим этот процесс под другим углом»).
Тем не менее, с чисто формальной точки зрения, матрица $ C_{} $ перехода от базиса $ \{X_1,X_2,\dots,X_n \} $ пространства $ \mathbb V_{} $ к какому-то другому базису $ \{\mathfrak X_1,\mathfrak X_2,\dots,\mathfrak X_n \} $ того же пространства может считаться матрицей некоторого оператора, действующего в этом пространстве. В самом деле, на основании теоремы 6, существует единственный оператор $ \mathcal C $, переводящий старые базисные векторы в новые, взятые в той же последовательности: $$ \mathcal C (X_1)=\mathfrak X_1, \mathcal C (X_2)= \mathfrak X_2, \dots, \mathcal C (X_n)= \mathfrak X_n \ . $$ Но тогда матрица оператора $ \mathcal C $ в базисе $ \{X_1,X_2,\dots,X_n \} $ совпадает с матрицей $ C_{} $ перехода от базиса $ \{X_1,X_2,\dots,X_n \} $ к базису $ \{\mathfrak X_1,\mathfrak X_2,\dots,\mathfrak X_n \} $.
Я буду записывать матрицы операторов и матрицы переходов от базиса к базису в разных стилях: $ \mathbf A, \mathbf B,\dots $ и, соответственно, $ C, P, T, \dots $ — с целью быстрого распознавания их «физической» сущности.
Теорема. Рассмотрим линейную оболочку линейно независимой системы столбцов $ \{Y_1,\dots, Y_k \} \subset \mathbb R^n $.
$$ \mathbb M =\left\{ \lambda_1 Y_1 + \dots + \lambda_k Y_k \ \big| \ \{\lambda_1,\dots,\lambda_k\} \subset \mathbb R \right\}= \mathcal L (Y_1,\dots,Y_k) \, . $$ Пусть скалярное произведение векторов $ X_{} $ и $ Y_{} $ задается стандартным способом, т.е. $ \langle X,Y \rangle =x_1y_1+\dots+x_ny_n $. Ближайшей к точке $ X_0 \subset \mathbb R^n $ точкой многообразия (или ортогональной проекцией точки $ X_0 $ на многообразие) $ \mathbb M_{} $ является $$ X_{\ast} = \mathbf L (\mathbf L^{\top} \mathbf L )^{-1} \mathbf L^{\top} X_0 \, . $$ Здесь $ \mathbf L=[Y_1 |\dots |Y_k]_{n\times k} $.
Доказательство. Пусть $ X_0=X_0^{^{\parallel}}+X_0^{^{\bot}} $, где $ X_0^{^{\parallel}} $ — ортогональная проекция точки $ X_0 $ на $ \mathbb M $, а $ X_0^{^{\bot}} $ — ортогональная составляющая. Тогда $$ \mathbf L^{\top} X_0^{^{\bot}}=\mathbb O $$ поскольку $ Y_1^{\top} X_0^{^{\bot}}=0,\dots, Y_k^{\top} X_0^{^{\bot}}=0 $. Далее, $ X_0^{^{\parallel}} $ можно разложить по базису $ \{Y_1,\dots, Y_k \} $: $$ X_0^{^{\parallel}}=\alpha_1 Y_1+\dots+ \alpha_k Y_k \quad npu \quad \{\alpha_1,\dots,\alpha_k\} \subset \mathbb R \, . $$ Следовательно, $$ \mathbf L^{\top} X_0=\mathbf L^{\top} (X_0^{^{\parallel}}+X_0^{^{\bot}})=\mathbf L^{\top} X_0^{^{\parallel}}= \mathbf L^{\top} (\alpha_1 Y_1+\dots+ \alpha_k Y_k)= $$ $$ =\left( \begin{array}{c} \alpha_1 Y_1^{\top} Y_1 +\dots + \alpha_k Y_1^{\top} Y_k \\ \alpha_1 Y_2^{\top} Y_1 +\dots + \alpha_k Y_2^{\top} Y_k \\ \dots \\ \alpha_1 Y_k^{\top} Y_1 +\dots + \alpha_k Y_k^{\top} Y_k \end{array} \right)= \mathbf L^{\top} \mathbf L \left( \begin{array}{c} \alpha_1 \\ \alpha_2 \\ \vdots \\ \alpha_k \end{array} \right)\, . $$ Тогда $$ \mathbf L (\mathbf L^{\top} \mathbf L )^{-1} \mathbf L^{\top} X_0= \mathbf L \left( \begin{array}{c} \alpha_1 \\ \alpha_2 \\ \vdots \\ \alpha_k \end{array} \right) =\alpha_1 Y_1+\dots+ \alpha_k Y_k= X_0^{^{\parallel}} \, . $$ На основании теорем $ 1_{} $ и $ 2_{} $, приведенных ☞ ЗДЕСЬ, точка $ X_0^{^{\parallel}} $ является ближайшей точкой многообразия $ \mathbb M $ к точке $ X_{0} $. ♦
Матрица $ P=\mathbf L (\mathbf L^{\top} \mathbf L )^{-1} \mathbf L^{\top} $ является матрицей оператора ортогонального проецирования на многообразие $ \mathbb M_{} $ в стандартном базисе $$ \bigg\{{\mathfrak e}_j = \big[\underbrace{0,\dots,0,1}_{j},0,\dots,0\big]^{\top} \bigg\}_{j=1}^n \, . $$ Она симметрична и идемпотентна, т.е. обладает свойством $ P^2=P $.
Пример. В $ \mathbb R^{3} $ найти матрицу проецирования на плоскость $ x+y+z=0 $.
Решение. Параметрическое задание плоскости: $$ \mathbb M=\{ \lambda_1 \underbrace{[1,-1,0]^{\top}}_{Y_1} + \lambda_2 \underbrace{[0,1,-1]^{\top}}_{Y_2}\ \big| \{\lambda_1,\lambda_2\} \subset \mathbb R \} \, . $$ Имеем: $$ \mathbf L= \left(\begin{array}{rr} 1 & 0 \\ -1 & 1 \\ 0 & -1 \end{array} \right) \ \Rightarrow \ \mathbf L^{\top} \mathbf L= \left(\begin{array}{rr} 2 & -1 \\ -1 & 2 \end{array} \right) \ \Rightarrow \ (\mathbf L^{\top} \mathbf L )^{-1}= \left(\begin{array}{rr} 2/3 & 1/3 \\ 1/3 & 2/3 \end{array} \right) \ \Rightarrow \ $$ $$ \ \Rightarrow \ \mathbf L (\mathbf L^{\top} \mathbf L )^{-1} \mathbf L^{\top}= \frac{1}{3} \left(\begin{array}{rrr} 2 & -1 & -1 \\ -1& 2 & -1 \\ -1 & -1 & 2 \end{array} \right) \, . $$ ♦
В пространстве $ \mathbb R^n $ со стандартным скалярным произведением рассмотрим плоскость, заданную уравнением $$ C^{\top}X= c_1x_1+c_2x_2+\dots+c_nx_n = 0 $$ при векторе нормали $ C^{\top}=(c_1,c_2,\dots,c_n) $ единичной длины: $ |C|^2= C^{\top}C=1 $. Действие оператора зеркального отражения или оператора Хаусхолдера6) относительно этой плоскости на вектор (точку) $ X \in \mathbb R^n $ определим правилом $$ \mathcal H( X^{^{\parallel}} + X^{^{\bot}})= X^{^{\parallel}} - X^{^{\bot}} \ ; $$ здесь $ X^{^{\parallel}} $ — ортогональная проекция вектора $ X_{} $ на заданную плоскость, а $ X^{^{\bot}} $ — ортогональная составляющая вектора $ X_{} $ относительно этой плоскости.
Теорема. Оператор $ \mathcal H $ задается уравнением
$$ \mathcal H(X)=X-2\, \langle X,C \rangle C=X-2\, C (C^{\top}X)= X-2\, C^{\top}XC \, . $$
Доказательство. $$ \mathcal H( X^{^{\parallel}} + X^{^{\bot}})=X^{^{\parallel}} + X^{^{\bot}}-2\, \langle X^{^{\parallel}},C \rangle C-2\, \langle X^{^{\bot}},C \rangle C = $$ Поскольку $ X^{^{\parallel}} $ ортогонален, а вектор $ X^{^{\bot}} $ коллинеарен вектору $ C $ единичной длины, то $$= X^{^{\parallel}} + X^{^{\bot}} - 2\, X^{^{\bot}} = X^{^{\parallel}} - X^{^{\bot}} \, . $$ ♦
Теорема. Матрица оператора $ \mathcal H $ в стандартном базисе
$$ \bigg\{{\mathfrak e}_j = \big[\underbrace{0,\dots,0,1}_{j},0,\dots,0\big]^{\top} \bigg\}_{j=1}^n \, . $$ имеет вид $$ \mathbf H_{C}= E-2\, C \cdot C^{\top} = \left( \begin{array}{cccc} 1-2c_1^2 & -2\,c_1c_2 & \dots & - 2 c_1 c_n \\ -2\,c_1c_2 & 1-2c_2^2 & \dots & - 2 c_2 c_n \\ \vdots & & & \vdots \\ - 2 c_1 c_n & - 2 c_2 c_n & \dots & 1-2c_n^2 \end{array} \right) \, . $$
Пример. Найти зеркальное отражение точки $ [3,2,3] $ относительно плоскости $ 2\,x-2\,y+z = 0 $.
Решение. Здесь $ C^{\top}=[2/3,-2/3,1/3] $ и $$ \mathcal H(X)= \left( \begin{array}{r} 3 \\ 2 \\ 3 \end{array} \right) - 2\langle [3,2,3],[2/3,-2/3,1/3] \rangle \left( \begin{array}{r} 2/3\\ -2/3 \\ 1/3 \end{array} \right)= \left( \begin{array}{r} 7/9 \\ 38/9 \\ 17/9 \end{array} \right) \, . $$ Проверим результат посредством матричного представления: $$ \mathbf H_C= \left( \begin{array}{rrr} 1/9 & 8/9 & -4/9 \\ 8/9 & 1/9 & 4/9 \\ -4/9 & 4/9 & 7/9 \end{array} \right) \quad \Rightarrow \quad \mathbf H \left( \begin{array}{r} 3 \\ 2 \\ 3 \end{array} \right)= \left( \begin{array}{r} 7/9 \\ 38/9 \\ 17/9 \end{array} \right) \, . $$ ♦
Матрица $ \mathbf H_{C} $ одновременно симметрична и ортогональна, и $ \det \mathbf H_{C}=-1 $. Следовательно, ей обратная существует и совпадает с ней самой: $$ \mathbf H_{C}^{-1}= \mathbf H_{C} \, . $$
Задача. Подобрать базис пространства $ \mathbb V_{} $ так, чтобы матрица заданного оператора $ \mathcal A_{} $ имела наиболее простой вид.
Исследуем действие оператора $ \mathcal A $ на произвольное подпространство $ \mathbb V_1 \subset \mathbb V $: $$\mathcal A (\mathbb V_1)= \left\{Y\in \mathbb V \mid Y=\mathcal A (X), \ X \in \mathbb V_1 \right\} \ .$$ Вообще говоря, множества $ \mathbb V_1 $ и $ \mathcal A (\mathbb V_1) $ будут различными, т.е. $ \exists X_1 \in \mathbb V_1 $ такой, что $ \mathcal A (X_1)\notin \mathbb V_1 $.
Подпространство $ \mathbb V_1 $ называется инвариантным подпространством оператора $ \mathcal A $, если оно отображается этим оператором в себя: $$ \mathcal A(\mathbb V_1)\subset \mathbb V_1 \ .$$
$ \mathbb V_1=\{\mathbb O \} $ и $ \mathbb V_1=\mathbb V $ — тривиальные инвариантные подпространства произвольного оператора $ \mathcal A $.
Нас будут интересовать нетривиальные инвариантные подпространства.
Пример. Оператор
$$\left(\begin{array}{c} x \\ y \\ z \end{array} \right) \longmapsto \left(\begin{array}{rrr} {\scriptstyle 1}/{\scriptstyle \sqrt 2} & -{\scriptstyle 1}/{\scriptstyle \sqrt 2} & 0 \\ {\scriptstyle 1}/{\scriptstyle \sqrt 2} & {\scriptstyle 1}/{\scriptstyle \sqrt 2} & 0 \\ 0 & 0 & 1 \end{array} \right) \left(\begin{array}{c} x \\ y \\ z \end{array} \right) $$ задает в пространстве поворот вокруг оси $ \mathbb O z $ на угол $ +\pi /4 $. Нетривиальными инвариантными подпространствами будут
а) ось вращения $ \mathbb V_1=\{(0,0,z)^{^{\top}} \mid z \in \mathbb R\} $, $ \dim \mathbb V_1=1 $ и
б) плоскость, перпендикулярная оси вращения $ \mathbb V_2=\{(x,y,0)^{^{\top}} \mid \{x,y\} \subset \mathbb R\} $, $ \dim \mathbb V_2= 2 $. ♦
Пример. Оператор
$$\left(\begin{array}{c} x \\ y \end{array} \right) \longmapsto \left(\begin{array}{c} \lambda_1 x \\ \lambda_2 y \end{array} \right) $$ задает на плоскости «растяжение»: $ x_{} $-компонента увеличивается в $ \lambda_{1} $ раз, а $ y_{} $-компонента — в $ \lambda_{2} $ раз. При любой комбинации коэффициентов растяжения координатные оси будут инвариантными подпространствами. Однако в частном случае $ \lambda_1=\lambda_2 $ инвариантной будет также любая прямая, проходящая через начало координат. ♦
Пример. Оператор в $ \mathbb R^{n}_{} $ задан блочной матрицей
$$X \longmapsto \left( \begin{array}{cc} {\mathbf A}_1 & {\mathbf *}\\ \mathbb O & {\mathbf A}_2 \end{array} \right) X $$ где $ {\mathbf A}_1 $ — $ n_1\times n_1 $-матрица, $ {\mathbf A}_2 $ — $ (n-n_1)\times (n-n_1) $-матрица. Множество столбцов $$\mathbb V_1=\left\{X=[x_1,\dots,x_{n_1},0,\dots,0]^{^{\top}} \bigg| \{ x_1, \dots, x_{n_1} \} \subset \mathbb R \right\}$$ образует инвариантное подпространство, $ \dim \mathbb V_1=n_1 $. Если же, вдобавок, матрица, обозначенная $ {\mathbf *} $ — нулевая, то вторым инвариантным подпространством будет $$ \mathbb V_2=\left\{X=[0,\dots,0,x_{n_1+1},\dots,x_n]^{^{\top}} \bigg| \{x_{n_1+1},\dots, x_n \} \subset \mathbb R \right\} \ .$$ ♦
Теорема. $ \mathcal{K}er (\mathcal A) $ и $ \mathcal{I}m(\mathcal A) $ — инвариантные подпространства оператора $ \mathcal A $.
Доказать, что сумма двух инвариантных подпространств является инвариантным подпространством.
Теорема. Если пространство $ \mathbb V_{} $ раскладывается в прямую сумму подпространств, инвариантных относительно оператора $ \mathcal A $, то существует базис пространства, в котором матрица оператора будет блочно-диагональной.
Теорема обобщается очевидным образом на произвольное число слагаемых подпространств: $ \mathbb V=\mathbb V_1\oplus \mathbb V_2 \oplus \dots \oplus \mathbb V_k $. Если при этом $ \dim \mathbb V_1= \dots = \dim \mathbb V_k=1 $, то матрица оператора в базисе, полученном объединением базисных векторов слагаемых подпространств, становится диагональной — это и является решением задачи, поставленной в начале пункта.
Задача. Найти одномерные инвариантные подпространства оператора.
Вектор $ X_{}\in \mathbb V $ называется собственным вектором оператора $ \mathcal A_{} $, если $$ {\mathbf a)} X \ne \mathbb O, \quad u \quad {\mathbf b)}\ \exists \ \lambda \in \mathbb C \qquad \mbox{ такое, что } \qquad \mathcal A(X)=\lambda X \ .$$ В этом случае число $ \lambda_{} $ называется собственным или характеристическим числом оператора, соответствующим (или принадлежащим) данному собственному вектору; обратно, говорят, что вектор $ X_{} $ принадлежит собственному числу $ \lambda_{} $.
Пример. Оператор
$$\left(\begin{array}{c} x \\ y \end{array} \right) \longmapsto \left(\begin{array}{rr} 1 & - 5/2 \\ -1/2 & 2 \end{array} \right) \left(\begin{array}{c} x \\ y \end{array} \right) $$ задает отображение плоскости $ \mathbb R^2 $. На рисунке показан результат действия этого отображения на единичную окружность. Все точки плоскости, за исключением начала координат $ \mathbb O_{} $, изменят свое положение — ни одна не останется на месте.
Если рассмотреть эти точки как концы векторов, имеющих начало в $ \mathbb O_{} $, то смещения точек под действием оператора можно представить в виде двух составляющих: растяжения (т.е. увеличения расстояния до начала координат) и поворота вокруг начала координат на некоторый угол. И только по двум направлениям плоскости поворота не происходит. Точки окружности с координатами $$ \pm \left( 0.823, -0.568 \right)^{\top} \quad u \quad \pm \left( 0.960, 0.278 \right)^{\top} $$ будут смещаться без поворота. Эти точки и задают координаты конца собственного вектора. А соответствующие им собственные числа $ 2.725 $ и $ 0.275 $ определяют коэффициенты сдвига. Если вообразить оператор как деформацию физической среды, заполняющей плоскость, то можно сказать, что cобственный вектор задает направление, на котором действие оператора сводится к растяжению, при этом коэффициент растяжения и будет собственным числом.
Анимация процесса ☞ ЗДЕСЬ (1500 Kb, gif).
Пример другого оператора $$ \left(\begin{array}{l} x \\ y \end{array} \right) \longmapsto \left(\begin{array}{rr} 1 & - 3 \\ 1 & -1 \end{array} \right) \left(\begin{array}{l} x \\ y \end{array} \right) $$ показывает, что существование вещественных собственных чисел вовсе не гарантировано даже в случае оператора в вещественном пространстве: в этом примере все точки плоскости повернутся вокруг начала координат. ♦
Доказать, что $ \operatorname{dfc} (\mathcal A) \ne 0 $ тогда и только тогда, когда оператор $ \mathcal A_{} $ имеет собственное число, равное нулю.
Теорема. Любой собственный вектор оператора порождает его одномерное инвариантное подпространство, и обратно: любой ненулевой вектор одномерного инвариантного подпространства оператора является собственным вектором.
Пример. В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степени $ \le 3 $ оператор $ \mathcal A_{} $ действует по правилу
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ т.е. полином $ f_{}(x) $ отображается в остаток от деления произведения $ f(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Найти собственные векторы этого оператора.
Решение. В пространстве $ \mathbb P_3 $ векторами являются полиномы, а условие того, что полином $ f_{}(x) $ является собственным, принадлежащим числу $ \lambda_{} $, записывается в виде: $$ f(x)(x^2-2)\equiv \lambda f(x) \pmod{x^4-x^3-x^2+x} \quad \iff $$ $$ \iff \quad f(x)(x^2-2-\lambda)\equiv 0 \pmod{x^4-x^3-x^2+x} \ . $$ Поскольку $ \deg f \le 3 $, то последнее может выполняться тогда и только тогда, когда полином $ x^2-2-\lambda $ имеет общие корни с $ x^4-x^3-x^2+x \equiv x(x+1)(x-1)^2 $. Из этого условия вытекает, что число $ \lambda_{} $ может принимать только два значения: $ \lambda_1=-2 $ и $ \lambda_2=-1 $. Если $ \lambda_1=-2 $ является собственным числом, то ему соответствующий собственный вектор — полином степени $ \le 3 $ — должен определяться из условия делимости $ f(x)x^2 $ на $ x(x+1)(x-1)^2 $. Такой полином имеет вид $ t(x+1)(x-1)^2 $ при произвольной константе $ t_{} $. Следовательно множество $$ \{ t(x^3-x^2-x+1)= t(x+1)(x-1)^2 \ \mid \ t\ne 0 \} $$ является множеством собственных векторов, принадлежащих $ \lambda_1=-2 $.
С числом $ \lambda_2=-1 $ поступаем аналогично. Условие делимости полинома $ f(x)(x^2-1) $ на $ x(x+1)(x-1)^2 $ дает также бесконечное множество: $$ \{ (t_1x+t_2)x(x-1) \ \mid \ \{t_1,t_2\} \subset \mathbb R \} \ . $$ Однако в этом случае бесконечность множества качественно иная, чем в предыдущем случае; она — «двумерная». ♦
Задача. Для произвольного оператора выяснить условия существования его собственного числа и разработать конструктивный метод его нахождения.
Теорема. В комплексном линейном пространстве любой оператор имеет по крайней мере один собственный вектор.
Доказательство. Пусть $ \{X_1,\dots,X_{n} \} $ — произвольный базис пространства $ \mathbb V_{} $ и $ \mathbf A_{} $ — матрица оператора $ \mathcal A_{} $ в этом базисе. Тогда для того чтобы вектор $ X=x_1X_1+\cdots+x_nX_n \ne \mathbb O $ был собственным, принадлежащим собственному числу $ \lambda_{} $, необходимо и достаточно чтобы выполнялось равенство $$ {\mathbf A}\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array} \right) = \lambda \left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array} \right) \quad \Longleftrightarrow \quad \left(\begin{array}{cccc} \alpha_{11} - \lambda & \alpha_{12}& \dots & \alpha_{1n} \\ \alpha_{21} & \alpha_{22}- \lambda& \dots & \alpha_{2n} \\ \dots & & & \dots \\ \alpha_{n1} & \alpha_{n2}& \dots & \alpha_{nn}- \lambda \end{array} \right) \left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array} \right) = \mathbb O_{n\times 1} $$ Покажем, что существуют комплексные числа $ \lambda_{} $ и не все нулевые $ x_1,\dots,x_{n} $, удовлетворяющие этой системе. Необходимым и достаточным условием существования нетривиального решения у однородной системы линейных уравнений с квадратной матрицей является равенство нулю определителя этой матрицы: $$ \det ({\mathbf A}-\lambda E)=\left|\begin{array}{cccc} \alpha_{11} - \lambda & \alpha_{12}& \dots & \alpha_{1n} \\ \alpha_{21} & \alpha_{22}- \lambda& \dots & \alpha_{2n} \\ \dots & & & \dots \\ \alpha_{n1} & \alpha_{n2}& \dots & \alpha_{nn}- \lambda \end{array} \right|=0 \ . $$ Этот определитель является полиномом степени $ n_{} $ по $ \lambda_{} $. По основной теореме высшей алгебры этот полином имеет по крайней мере один комплексный корень $ \lambda=\lambda_{\ast} $. Подставив его в систему, получаем однородную систему уравнений с нулевым определителем. Находим нетривиальное решение этой системы: $$ x_1=x_{1}^{\ast},\dots,x_n=x_{n}^{\ast}, \quad \exists x_{j}^{\ast} \ne 0 ; $$ но тогда вектор $ {\mathfrak X}_{\ast}= x_{1}^{\ast}X_1+\cdots+x_{n}^{\ast}X_n $ будет собственным вектором оператора $ \mathcal A_{} $, принадлежащим $ \lambda_{\ast}^{} $. ♦
Уравнение $ \det ({\mathbf A}-\lambda E)= 0 $ называется характеристическим или вековым уравнением, а полином в левой его части — характеристическим полиномом матрицы $ {\mathbf A} $. Любой корень характеристического полинома матрицы называется собственным числом этой матрицы. Набор всех собственных чисел матрицы (корней характеристического полинома с учетом кратностей) называется спектром матрицы. Ненулевой вектор $ X \in \mathbb C^n $, удовлетворяющий условию $ {\mathbf A} X= \lambda X $, где $ \lambda $ — собственное число матрицы, называется собственным вектором матрицы, соответствующим (или принадлежащим) данному собственному числу.
Пример. Применим полученный результат для получения альтернативного решения предыдущего примера.
Решение. Базисом в пространстве $ \mathbb P_3 $ выберем $ \{1,\,x,\,x^2,\, x^3\} $. Образы базисных векторов под действием оператора $ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} $: $$ \left\{\begin{array}{lrrrr} \mathcal A (1) =&-2& &+x^2& ,\\ \mathcal A (x) =&&-2\,x &&+x^3 ,\\ \mathcal A (x^2) =& &-x &-x^2 &+x^3, \\ \mathcal A (x^2) =& &-x & & , \end{array} \right. \qquad \Rightarrow \qquad {\mathbf A}= \left(\begin{array}{rrrr} -2 & 0 & 0 & 0 \\ 0 & -2 & -1 & -1 \\ 1& 0 & -1 & 0 \\ 0 & 1 & 1 & 0 \end{array} \right) \ . $$ Характеристический полином матрицы $ {\mathbf A} $: $$ \left|\begin{array}{cccc} -2-\lambda & 0 & 0 & 0 \\ 0 & -2-\lambda & -1 & -1 \\ 1& 0 & -1-\lambda & 0 \\ 0 & 1 & 1 & -\lambda \end{array} \right|\equiv (\lambda+2)(\lambda^3+3\,\lambda^2+3\,\lambda+1)\equiv (\lambda+2)(\lambda+1)^3 \ . $$ Собственные числа $ \lambda_1=-2 $ и $ \lambda_2=-1 $, спектр матрицы $ \{-1,-1,-1,-2\} $. Подставляем каждое из собственных чисел в матрицу $ {\mathbf A}-\lambda E $ и решаем получившиеся системы однородных уравнений. Поскольку каждая из них должна иметь бесконечное множество решений, то мы строим фундаментальные системы решений (ФСР) $$ \begin{array}{ccc} & ({\mathbf A}-\lambda E)X=\mathbb O & \\ {\color{Red} \swarrow } & & {\color{Red} \searrow } \\ \lambda_1=-2 & & \lambda_2=-1 \\ \Downarrow & & \Downarrow \\ \left(\begin{array}{rrrr} 0 & 0 & 0 & 0 \\ 0 & 0 & -1 & -1 \\ 1& 0 & 1 & 0 \\ 0 & 1 & 1 & 2 \end{array} \right) \left(\begin{array}{l} x_1 \\ x_2 \\ x_3 \\ x_4 \end{array} \right)= \mathbb O & & \left(\begin{array}{rrrr} -1 & 0 & 0 & 0 \\ 0 & -1 & -1 & -1 \\ 1& 0 & 0 & 0 \\ 0 & 1 & 1 & 1 \end{array} \right) \left(\begin{array}{l} x_1 \\ x_2 \\ x_3 \\ x_4 \end{array} \right)= \mathbb O \ . \\ {\color{Red} \Downarrow } & & {\color{Red} \Downarrow } \\ x_1=1,x_2=-1,x_3=-1,x_4=1 & & \left\{\begin{array}{c} x_1=0,x_2=-1,x_3=1,x_4=0 \\ x_1=0,x_2=-1,x_3=0,x_4=1 \end{array} \right\} \end{array} $$ Таким образом, собственному числу $ \lambda_1=-2 $ соответствует собственнный вектор — полином $ 1-x-x^2+x^3 $, и он полностью совпадает с полученным при решении предыдущего примера. В то же время собственному числу $ \lambda_2=-1 $ соответствует два линейно независимых собственнных вектора — полиномы $ -x+x^2 $ и $ -x+x^3 $. Любой (не тождественно нулевой) полином множества $$ \{ \tau_1(-x+x^2) +\tau_2(-x+x^3) \mid \{\tau_1,\tau_2 \} \subset \mathbb R \} $$ будет также являться собственным, принадлежащим $ \lambda_2=-1 $. Это множество также совпадает с полученным при решении предыдущего примера. ♦
Итак, два формально различных подхода к решению одного и того же примера не привели к противоречию. Хотелось бы, однако, гарантировать глобальную непротиворечивость определения собственных чисел и векторов — т.е. независимость (инвариантность) этих объектов относительно способов их нахождения, и, в частности, от выбора базиса пространства $ \mathbb V_{} $.
Теорема. Характеристические полиномы подобных матриц одинаковы.
Доказательство. $ {\mathbf A}\doteq {\mathbf B} {\color{Red} \iff } \exists $ неособенная матрица $ C_{} $, такая что $ {\mathbf B}=C^{-1} {\mathbf A} C $. Имеем: $$\det ({\mathbf B}-\lambda E)=\det (C^{-1} {\mathbf A} C-\lambda E)=$$ $$= \det (C^{-1} {\mathbf A} C-\lambda C^{-1}EC)=\det \left[ C^{-1} ({\mathbf A} -\lambda E)C \right] = \det ({\mathbf A}-\lambda E) \ .$$ ♦
Иначе говоря, для оператора $ \mathcal A_{} $ характеристический полином его матрицы не зависит от выбора базиса пространства. Поэтому можно говорить о характеристическом полиноме оператора $ \mathcal A_{} $.
Характеристический полином матрицы подробнее исследуется
☞
ЗДЕСЬ. В частности, в указанном разделе приведен результат, на основании которого (а также на основании пунктов а) и д) теоремы 7, приведенной в пункте
☞
МАТРИЦА ОПЕРАТОРА ) выводится следующее нетривиальное утверждение:
Теорема [Гамильтон, Кэли]. Результатом подстановки оператора в собственный характеристический полином будет нулевой оператор.
Пример. Для рассмотренного в предыдущих примерах оператора
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ действующего в $ \mathbb P_3 $, характеристический полином равен
$$ \lambda^4+5\,\lambda^3+9\,\lambda^2+7\,\lambda+2 \, .$$ Проверим утверждение теоремы Гамильтона-Кэли — должно быть выполнено условие $$ \mathcal A^4+5\,\mathcal A^3+9\,\mathcal A^2+7\,\mathcal A +2\, \mathcal E = \mathcal O \ . $$ Степени данного оператора $ \mathcal A_{} $ обсуждались в примере ☞ ПУНКТА. Переписанное в терминах остатков, последнее условие превращается в $$ (x^2-2)^4f(x)+5\,(x^2-2)^3f(x)+9\,(x^2-2)^2f(x)+7\,(x^2-2)f(x) + $$ $$+2\,f(x) \equiv 0 \pmod{x^4-x^3-x^2+x} \ , $$ т.е. полином, стоящий в левой части сравнения, должен делиться нацело на $ x^4-x^3-x^2+x $ при любом выборе полинома $ f_{}(x) $. Проверяем: $$ (x^2-2)^4+5\,(x^2-2)^3+9\,(x^2-2)^2+7\,(x^2-2)+2 \equiv $$ $$\equiv x^8-3\,x^6+3\,x^4-x^2 \equiv (x^4+x^3-x^2-x)(x^4-x^3-x^2+x) \ , $$ т.е. утверждение оказывается справедливым. ♦
Теорема 1. Собственные векторы оператора, принадлежащие различным собственным числам, линейно независимы.
Доказательство ☞ ЗДЕСЬ.
Теорема 2. Если оператор имеет $ n=\dim \mathbb V $ линейно независимых собственных векторов, то в базисе ими образуемом матрица оператора диагональна. Обратно: если матрица оператора в некотором базисе диагональна, то каждый вектор этого базиса является собственным для оператора.
Базис линейного пространства, состоящий из собственных векторов оператора $ \mathcal A_{} $, называется каноническим.
[Матричная версия теоремы]. Пусть $ A_{} $ — квадратная матрица. Неособенная матрица $ C_{} $, удовлетворяющая равенству
$$C^{-1} A C= A_{diag} \quad \mbox{ при матрице } A_{diag} \quad \mbox{ - диагональной} $$ существует тогда и только тогда, когда существует базис пространства $ \mathbb C^{n}_{} $, состоящий из собственных векторов матрицы $ A_{} $. Тогда матрица $ C_{} $ является матрицей перехода от стандартного базиса $$ \bigg\{{\mathfrak e}_j = \big[\underbrace{0,\dots,0,1}_{j},0,\dots,0\big]^{\top} \bigg\}_{j=1}^n $$ к каноническому, а на диагонали $ A_{diag} $ стоят собственные числа матрицы $ A_{} $: $$ A_{diag}= \left( \begin{array}{cccc} \lambda_1 & 0 & \dots & 0 \\ 0 & \lambda_2 & \dots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \dots & \lambda_n \end{array} \right) \ . $$
Доказательство. Проведем формальное доказательство данного конкретного частного случая. Рассмотрим матричное равенство $$ A C= CA_{diag} $$ при некоторой диагональной матрице $ A_{diag} $. Легко видеть, что оно эквивалентно системе равенств относительно столбцов матрицы $ C_{} $: $$ AC_{[1]}=d_1 C_{[1]},\dots, AC_{[n]}=d_n C_{[n]} \, . $$ Если все столбцы $ \{ C_{[j]} \}_{j=1}^n $ ненулевые, то тогда они являются собственными векторами для матрицы $ A_{} $, а числа $ \{ d_{[j]} \}_{j=1}^n $ — собственными числами, соответствующими этим собственным векторам. Если матрица $ C_{} $ невырождена, то все ее столбцы линейно независимы. Но тогда они образуют базис пространства $ \mathbb C^n $, состоящий из собственных векторов. Обратное тоже верно. ♦
При выполнении условия предыдущего следствия говорят, что матрица $ A_{} $ диагонализуема или приводится к диагональной форме7).
Теорема позволяет сформулировать достаточное условие диагонализуемости.
Теорема 3. Если характеристический полином оператора не имеет кратных корней, то матрица оператора диагонализуема.
Матрица со всеми собственными числами различными называется недефектной8), хотя этот термин иногда употребляют как синоним диагонализуемости.
Это условие не является необходимым, как показывает пример тождественного оператора.
Случай существования кратного корня у характеристического полинома является «пограничным»: существуют примеры как диагонализуемых, так и недиагонализуемых матриц. Так, для матриц $$ A= \left( \begin{array}{rr} 0 &1 \\ -1 &2 \end{array} \right) \quad \mbox{ или } \quad A= \left( \begin{array}{cc} 1 &0 \\ 1&1 \end{array} \right) $$ при попытке подобрать матрицу $ C_{} $, удовлетворяющую равенству $$AC=C \left( \begin{array}{cc} \alpha_1 &0 \\ 0 & \alpha_2 \end{array} \right) \qquad npu \ \forall \{\alpha_1 , \alpha_2 \} \subset \mathbb C $$ получим: $ \det C=0 $.
В случае наличия у характеристического полинома оператора кратного корня, анализ оператора на возможность диагонализуемости его матрицы усложняется.
Теорема 4. Множество собственных векторов оператора, принадлежащих его собственному числу $ \lambda_{\ast}^{} $ , дополненное нулевым вектором, образует линейное подпространство пространства $ \mathbb V_{} $.
Это подпространство $$ \mathbb V_{\ast} = \mathcal{K}er (\mathcal A- \lambda_{\ast} \mathcal E) $$ пространства $ \mathbb V_{} $ называется собственным подпространством оператора, соответствующим $ \lambda_{\ast}^{} $. Величина $$ \dim (\mathcal{K}er (\mathcal A- \lambda_{\ast} \mathcal E)) $$ называется геометрической кратностью собственного числа $ \lambda_{\ast}^{} $. Можно доказать, что геометрическая кратность собственного числа не превосходит кратности собственного числа в характеристическом полиноме. Для акцентирования различий в определениях двух кратностей, кратность собственного числа в характеристическом полиноме называют еще алгебраической кратностью собственного числа.
Если оператор (в некотором базисе пространства) задан своей матрицей $ \mathbf A^{} $, то базисные векторы собственного подпространства $ \mathbb V_{\ast} $ вычисляются посредством нахождения фундаментальной системы решений (ФСР) системы линейных уравнений $$ (\mathbf A- \lambda_{\ast} E) X=\mathbb O \ . $$
Теорема 5. Матрица оператора диагонализуема тогда и только тогда, когда для каждого ее собственного числа алгебраическая кратность равна геометрической кратности:
$$ \operatorname{dfc} ({\mathbf A}-\lambda_{\ast}\, E)= \mbox{ кратность } \ \lambda_{\ast} . $$
Диагонализуема ли матрица оператора
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ рассмотренного в примерах предыдущего пункта?
Пример. Найти все вещественные значения параметра $ {\color{Red}{ \alpha} } $, при которых матрица
$$ \left( \begin{array}{rcc} 1 &2\, {\color{Red}{ \alpha} } & {\color{Red}{ \alpha} } -2 \\ -1 &2 &1 \\ 2 & 0 & -3 \end{array} \right) $$ диагонализуема.
Решение. Характеристический полином $ f(\lambda)=-\lambda^3+3\, \lambda-2\,(3\, {\color{Red}{ \alpha} } -1) $ имеет кратные корни только тогда когда его дискриминант $ \mathcal D(f)=-324\, {\color{Red}{ \alpha} } (3\, {\color{Red}{ \alpha} } -2) $ обращается в нуль. При $ {\color{Red}{ \alpha} } =0 $ корень $ \lambda=-1 $ имеет алгебраическую кратность $ 2_{} $. Найдем дефект матрицы $ A+E $: $$\left( \begin{array}{rrr} 2 &0 & -2 \\ -1 &3 &1 \\ 2 & 0 & -2 \end{array} \right) \ \longrightarrow \ \left( \begin{array}{rrr} 1 &0 & -1 \\ 0 &3 &0 \\ 0 & 0 & 0 \end{array} \right) \ {\color{Red} \Longrightarrow } \ \operatorname{rank} (A+E) =2 \Longrightarrow \operatorname{dfc} (A+E)=1 . $$ Таким образом, геометрическая кратность собственного числа $ \lambda=-1 $ равна $ 1_{} $ и условие теоремы $ 5 $ не выполнено. Оно не будет выполнено и при $ {\color{Red}{ \alpha} } = 2/3 $ (здесь корень $ \lambda=1 $ имеет кратность $ 2_{} $).
Ответ. Матрица диагонализуема при всех значениях параметра, за исключением $ {\color{Red}{ \alpha} } = 0 $ и $ {\color{Red}{ \alpha} } = 2/3 $.
В предыдущем пункте мы рассматривали операторы, не всегда акцентируя внимания на поле, над которым они были определены — над $ \mathbb R_{} $ или над $ \mathbb C_{} $. Сама теорема существования собственного числа гарантирует нам только лишь наличие этих чисел в поле $ \mathbb C_{} $. Как следствие, даже если рассматриваются операторы над полем $ \mathbb R_{} $ (что чаще всего и случается на практике), то существование для них вещественного канонического базиса вовсе не гарантировано.
Задача. Найти условия диагонализуемости матрицы оператора $ \mathcal A $ над полем вещественных чисел.
Необходимое условие следует из теоремы $ 2 $ предыдущего пункта: все собственные числа матрицы должны быть вещественными.
Теорема $ 3 $ позволяет сформулировать и достаточный критерий диагонализуемости матрицы оператора $ \mathcal A $ над $ \mathbb R_{} $.
Теорема. Если характеристический полином оператора имеет только простые вещественные корни, то матрица оператора диагонализуема над $ \mathbb R_{} $.
Условие различности и вещественности корней произвольного полинома $ f(\lambda)=\lambda^n+a_1\lambda^{n-1}+\dots+ a_n \in \mathbb R[x] $ можно проверить по коэффициентам этого полинома «чисто алгебраически», т.е. за конечное число элементарных алгебраических операций над этими коэффициентами. Воспользуемся, например, теоремой Якоби из раздела ☞ ЛОКАЛИЗАЦИЯ КОРНЕЙ ПОЛИНОМА. По коэффициентам $ a_1,\dots,a_n $ можно определить сумму Ньютона полинома $ f(\lambda) $, т.е. величину $$ s_k=\sum_{1\le j \le n} \lambda_j^k \ . $$ Далее, после нахождения всех этих сумм для значений $ k \in \{0,\dots,2n-2\} $, из них составляется ганкелева матрица $$ S=\left[ s_{j+k} \right]_{j,k=0}^{n-1} $$ и вычисляются ее главные миноры $ S_1,\dots, S_{n} $. Для различности всех корней полинома необходимо и достаточно выполнение условия $ S_n \ne 0 $ (этот минор совпадает с дискриминантом $ \mathcal D(f) $ полинома $ f(\lambda) $); для различности и вещественности всех корней необходимо и достаточно, чтобы были выполнены неравенства $$ S_1\ge 0,\dots,S_{n-1} \ge 0,S_n > 0 \ . $$
Пример. Найти все вещественные значения параметра $ {\color{Red}{ \alpha} } $, при которых матрица
$$ \left( \begin{array}{rcc} 1 &2\, {\color{Red}{ \alpha} } & {\color{Red}{ \alpha} } -2 \\ -1 &2 &1 \\ 2 & 0 & -3 \end{array} \right) $$ диагонализуема над $ \mathbb R_{} $.
Решение. На основании теоремы нам нужно установить условия вещественности корней характеристического полинома $ f(\lambda)=-\lambda^3+3\, \lambda-2\,(3\, {\color{Red}{ \alpha} } -1) $. Вычисляем суммы Ньютона: $ s_0=3,\ s_1= 0, \ s_2=6, \ s_3=18\, {\color{Red}{ \alpha} } -6, \ s_4=18 $, составляем матрицу: $$ S=\left(\begin{array}{ccc} 3 & 0 & 6 \\ 0 & 6 & 18\, {\color{Red}{ \alpha} } -6 \\ 6 & 18\, {\color{Red}{ \alpha} } -6 & 18 \end{array} \right) $$ и вычисляем ее главные миноры: $$S_1=3,\ S_2=18, \ S_3=-324\, {\color{Red}{ \alpha} } \, (3\, {\color{Red}{ \alpha} } -2)=\mathcal D(f) \ . $$ При $ {\color{Red}{ \alpha} } \ne 0 $ и $ {\color{Red}{ \alpha} } \ne 2/3 $ все собственные числа различны, условие теоремы выполняется при $ {\color{Red}{ \alpha} } \in ]0,\, 2/3[ $. Граничные точки последнего интервала следовало бы исследовать отдельно: хотя этим значениям параметра и соответствует случай кратных вещественных корней характеристического полинома, но матрица $ A_{} $ может оказаться диагонализуемой на основании теоремы 5 предыдущего пункта. Но при решении примера в предыдущем пункте мы уже установили, что это условие не выполняется.
Ответ. Матрица диагонализуема над $ \mathbb R_{} $ при $ {\color{Red}{ \alpha} } \in ]0,\, 2/3[ $.
Если матрица оператора оказывается недиагонализуемой над $ \mathbb C_{} $, то к какому простейшему виду ее можно привести ? — Этим видом является, например, ☞ ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА.
☞ ЗДЕСЬ.
[1]. Гантмахер Ф.Р. Теория матриц. 4-е изд. М.Наука. 1988.
[2]. Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. М.ГИФМЛ.1960
[3]. Хорн Р., Джонсон Ч. Матричный анализ. М.Мир.1989
[4]. Мишина А.П., Проскуряков И.В. Высшая алгебра. М.Наука. 1965