Для понимания материалов настоящего раздела крайне желательно ознакомиться с разделом
((:mapping ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ))
==Линейный оператор==
~~TOC~~
((:mapping Линейное отображение)) линейного (векторного) пространства $ \mathbb V_{} $ в себя
$$ \mathcal A : \mathbb V \longmapsto \mathbb V $$
называется **линейным преобразованием** $ \mathbb V_{} $ или **линейным оператором**[[operator (//лат.//) --- работник, производитель, творец.]] на $ \mathbb V_{} $.
В дальнейшем под выражением //оператор// понимается исключительно линейный оператор (и линейное пространство $ \mathbb V_{} $ предполагается конечномерным!).
Напомню свойство линейности:
$$
\mathcal A (X_1 +X_2)= \mathcal A(X_1) + \mathcal A(X_2),\quad \mathcal A (\alpha_1 X_1)=
\alpha_1 \mathcal A (X_1),
$$
или, в эквивалентном виде:
$$
\mathcal A(\alpha_1 X_1 + \alpha_2 X_2)= \alpha_1 \mathcal A(X_1) + \alpha_2 \mathcal A(X_2)
$$
для $ \forall \ \{X_1,X_2\} \subset \mathbb V,\
\forall \ \{\alpha_1,\alpha_2 \} \subset \mathbb R \ \mbox{ или } \ \mathbb C $
(здесь $ \alpha_1,\alpha_ 2 $ --- константы из $ \mathbb R_{} $ если $ \mathbb V_{} $
вещественное пространство, и из $ \mathbb C_{} $, если оно комплексное).
===Примеры линейных операторов==
Бóльшую часть примеров пункта
☞
((:mapping#примеры_линейных_отображений ПРИМЕРЫ ЛИНЕЙНЫХ ОТОБРАЖЕНИЙ)) представляют именно линейные операторы. Укажу еще несколько, к которым буду часто обращаться.
!!П!! **Пример 1.** В пространстве $ \mathbb R^{3} $ рассмотрим следующие действия над вектором[[Напомню, что векторы пространства считаются заданными только координатами своего конца, а начало считается "привязанным" к $ \mathbb O $.]] $ (x_{},y,z) $:
* поворот вокруг прямой $ x=y=2\,z $ на угол $ \pi/3 $;
* зеркальное отражение относительно плоскости $ 3\,x-y+z = 0 $;
* растяжение в $ 3.14 $ раза.
Все это --- примеры линейных операторов. Но вот отображение сдвига $ (x,y,z) \mapsto (x+1,y,z+2) $ оператором не является поскольку
$$ {\color{RubineRed} \alpha } (x,y,z) = ( {\color{RubineRed} \alpha } x, {\color{RubineRed} \alpha } y, {\color{RubineRed} \alpha } z) \mapsto ( {\color{RubineRed} \alpha } x+1, {\color{RubineRed} \alpha } y, {\color{RubineRed} \alpha } z+2) \ne {\color{RubineRed} \alpha } (x+1,y,z+2) \ . $$
!!П!! **Пример 2.** В пространстве $ \mathbb R^{3} $ отображение ортогонального проецирования на плоскость $ x+y-7\, z=0 $ будет линейным оператором (а вот на плоскость $ x+y-7\, z=1 $ --- не будет!). Вообще, в произвольном пространстве $ \mathbb V_{} $ разбитом в ((:linear_space#прямая_сумма_линейных_подространств прямую сумму)) нетривиальных подпространств $ \mathbb V= \mathbb V_1 \oplus \mathbb V_2 $ отображение, сопоставляющее вектору $ X_{} $ его проекцию на подпространство $ \mathbb V_1 $ параллельно подпространству $ \mathbb V_2 $, будет оператором.
!!П!! **Пример 3.** В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степеней $ \le 3 $ отображение $ \mathcal A_{} $ действует по правилу
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$
т.е. полином $ f_{}(x) $ отображается в ((:polynomial#делимость_полиномов остаток от деления)) произведения $ f(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Это отображение будет оператором в $ \mathbb P_3 $. Действительно, если
$$
\begin{array}{l}
f_1(x)(x^2-2) \equiv q_1(x)(x^4-x^3-x^2+x)+ r_1(x)\, , \\
f_2(x)(x^2-2) \equiv q_2(x)(x^4-x^3-x^2+x)+ r_2(x) ,
\end{array}
$$
при $ \{q_1(x),q_2(x),r_1(x),r_2(x)\} \subset \mathbb R[x], \deg r_1(x) \le 3, \deg r_2(x) \le 3 $,
то
$$ (\alpha_1 f_1(x)+\alpha_2 f_2(x)) (x^2-2) \equiv (\alpha_1 q_1(x)+\alpha_2 q_2(x))(x^4-x^3-x^2+x)+ (\alpha_1 r_1(x)+\alpha_2 r_2(x)) ;
$$
очевидно, что $ \deg (\alpha_1 r_1(x)+\alpha_2 r_2(x)) \le 3 $.
♦
!!П!! **Пример 4.** Задачу ((:interpolation интерполяции)) можно интерпретировать как построение некоторого отображения. В интерполяционной таблице
$$
\begin{array}{c|ccccc}
x & x_1 & x_2 & \dots & x_n \\ \hline
y & y_1 & y_2 &\dots & y_n
\end{array} \qquad npu \qquad \{ x_{1}, \dots, x_{n}, y_{1},\dots,y_{n} \} \subset \mathbb C
$$
будем считать узлы $ \{ x_j\}_{j=1}^n $ фиксированными, а значения $ \{ y_j\}_{j=1}^n $ --- переменными. Эта таблица однозначно определяет интерполяционный полином $ f(x)=A_{0}+A_1x+\dots+A_{n-1}x^{n-1} $ со свойством $ f(x_j)=y_j $ при $ j \in \{1,\dots,n\} $. При этом $ \{A_{j} \}_{j=0}^{n-1} \subset \mathbb C $. Будет ли получившееся отображение
$$ (y_1,\dots,y_n) \mapsto (A_0,A_1,\dots,A_{n-1}) $$
оператором на $ \mathbb C^n $? Покажем, что отображение
$$ \mathcal A(y_1,\dots,y_n) = f(x) \in \mathbb C[x] $$
является линейным отображением. Действительно, решением задачи интерполяции для таблицы
$$
\begin{array}{c|ccccc}
x & x_1 & x_2 & \dots & x_n \\ \hline
y & \alpha y_1 & \alpha y_2 &\dots & \alpha y_n
\end{array}
\qquad npu \qquad \forall \alpha \in \mathbb C
$$
является полином $ \alpha f(x) $. Если же, вдобавок, решением задачи интерполяции для таблицы
$$
\begin{array}{c|ccccc}
x & x_1 & x_2 & \dots & x_n \\ \hline
y & z_1 & z_2 &\dots & z_n
\end{array}
\qquad npu \qquad \{ z_{1},\dots,z_{n} \} \subset \mathbb C
$$
является полином $ g(x)\in \mathbb C[x], \deg g(x) \le n-1 $, то
решением задачи интерполяции для таблицы
$$
\begin{array}{c|ccccc}
x & x_1 & x_2 & \dots & x_n \\ \hline
y & y_1+z_1 & y_2+z_2 &\dots & y_n+z_n
\end{array}
\qquad
$$
будет полином $ f(x)+g(x) $ и этот полином будет единственным решением среди полиномов степеней $ \le n-1 $. Таким образом, линейность отображения $ \mathcal A $ установлена. Далее, множество $ \mathbb P_{n-1} $ полиномов из $ \mathbb C[x] $ степеней $ \le n-1 $ ((:linear_space#изоморфизм изоморфно)) пространству $ \mathbb C^n $. Следовательно, "сложное" отображение
$$
(y_1,\dots,y_n) \mapsto f(x)=A_{0}+A_1x+\dots+A_{n-1}x^{n-1} \mapsto (A_0,A_1,\dots,A_{n-1})
$$
является линейным отображением из $ \mathbb C^n $ в $ \mathbb C^n $, т.е. оператором на $ \mathbb C^n $.
По аналогии с задачей алгебраической интерполяции, можно поставить и задачу ((:interpolation#тригонометрическая_интерполяция тригонометрической интерполяции)). Имеем здесь "точку входа" в теорию ((:interpolation:dft дискретного преобразования Фурье)).
♦
Этот пример можно "развернуть": ((#основные_определения НИЖЕ)) будет показано, что произвольный оператор,
действующий в пространстве размерности $ n_{} $ полностью определяется своими значениями в $ n_{} $ точках пространства. Важное отличие от традиционной, числовой интерполяции: условие __различности__ этих точек не является достаточным для однозначного определения оператора
!
!!?!! В пространстве $ \mathbb P_2 $ оператор действует следующим образом:
$$ \mathcal A (x^2+x+1) =2\,x+1,\ \mathcal A (x^2-x-1) =2\,x^2-1,\ \mathcal A (x+1) =-x^2+x+1 \ . $$
Вычислить $ \mathcal A (x^2) $ и $ \mathcal A (x^2+1) $.
!!П!! **Пример 5.** В пространстве полиномов степени не выше $ n_{} $ с вещественными коэффициентами от $ m_{} $ переменных $ x_1,x_2,\dots,x_{m} $ отображение
$$ f(x_1,x_2,\dots,x_m) \mapsto \frac{\partial^2 f}{\partial x_1^2} +\frac{\partial^2 f}{\partial x_2^2}+ \dots+ \frac{\partial^2 f}{\partial x_m^2}
$$
яыляется линейным оператором. Этот оператор известен как **оператор Лапласа** и для него используется символьное обозначение
$$ \Delta = \frac{\partial^2 }{\partial x_1^2} +\frac{\partial^2 }{\partial x_2^2}+ \dots+ \frac{\partial^2 }{\partial x_m^2} \, .
$$
!!П!! **Пример 6.** В линейном пространстве квадратных матриц порядка $ n_{} $ с вещественными элементами рассмотрим **коммутирующее отображение**
$$ \mathcal K (X) = AX-XA \ , $$
а также **отображение Ляпунова**
$$ \mathcal V (X) = A^{\top}X+XA $$
при произвольной фиксированной квадратной матрице $ A_{} $ и $ {}^{\top} $ означающем ((:algebra2#транспонирование транспонирование)). Легко проверить, что оба отображения $ \mathcal K $ и $ \mathcal V $ являются операторами.
♦
===Основные определения==
Все введенные для линейного отображения понятия переносятся на этот частный случай. Например, **ядром оператора** называется множество векторов, отображаемых оператором в нулевой вектор:
$$\mathcal{K}er (\mathcal A)= \left\{X\in \mathbb V \big| \mathcal A(X)=\mathbb O \right\} \ ; $$
а **образом оператора** называется множество всех векторов из
$ \mathbb V_{} $, для каждого из которых существует прообраз в том же пространстве:
$$\mathcal{I}m (\mathcal A)= \left\{Y\in \mathbb V \mid \exists X \in \mathbb V, \ \mathcal A(X)= Y
\right\} \ .$$
!!Т!! **Теорема 1**. //Множества// $ \mathcal{K}er (\mathcal A) $ //и// $ \mathcal{I}m (\mathcal A) $ //являются ((:linear_space#определения подпространствами)) пространства// $ \mathbb V_{} $.
!!?!! Доказать, что для оператора в $ \mathbb R^4 $
$$
\mathcal A
\left(\begin{array}{c}
x_1 \\ x_2 \\ x_3 \\ x_4
\end{array}
\right)=
\left(\begin{array}{c}
x_3 \\ x_4 \\ 0 \\ 0
\end{array}
\right)
$$
имеет место равенство $ \mathcal{K}er (\mathcal A) = \mathcal{I}m (\mathcal A) $.
----
Для оператора $ \mathcal A_{} $ его **дефектом** его называется размерность ядра,
а его **рангом** --- размерность образа:
$$ \operatorname{dfc}(\mathcal A )=\dim (\mathcal{K}er (\mathcal A )) , \
\operatorname{rank}(\mathcal A )= \dim (\mathcal{I}m (\mathcal A )) \ .
$$
Оператор называется **невырожденным** если $ \operatorname{dfc}(\mathcal A )=0 $.
----
!!П!! **Пример.** В пространстве $ \mathbb R^{3} $ оператор проецирования на плоскость:
$$ \mathcal A \left(x, y, z\right) \longmapsto \left(x, y, 0 \right)
$$
является вырожденным поскольку его ядро нетривиально: $ \mathcal{K}er (\mathcal A)=\{(0,0,z) | z \in \mathbb R \} $.
♦
Следующий результат является следствием теоремы $ 4 $ из
☞
((:mapping#ядро_и_образ_линейного_отображения ПУНКТА)).
!!Т!! **Теорема 2.** //Имеет место равенство//:
$$ \dim \mathbb V=\dim \left( \mathcal{K}er (\mathcal A) \right) + \dim \left( \mathcal{I}m (\mathcal A) \right) = \operatorname{dfc}(\mathcal A )+ \operatorname{rank}(\mathcal A ) \ .$$
В чем смысл свойства вырожденности оператора? --- В том, что такой оператор "схлопывает" пространство, в котором действует: $ \dim \left( \mathcal{I}m (\mathcal A) \right) < \dim \mathbb V $. Происходит уменьшение размерности подобное тому, что описано в предыдущем примере: трехмерное пространство прообразов оператором проецирования отображается в двухмерное пространство всевозможных образов.
Отображение $ \mathcal P:\ \mathbb V \longmapsto \mathbb V $ называется **произведением** оператора $ \mathcal A $ на оператор $ \mathcal B $ если
$ \mathcal P(X)=\mathcal A (\mathcal B(X)) $ для любого $ X\in \mathbb V_{} $. Записывать этот факт будем в виде $ \mathcal P=\mathcal A \, \mathcal B $.
Фактически, произведение операторов --- частный случай понятия сложной функции.
!!Т!! **Теорема 3.** //Произведение операторов является оператором на// $ \mathbb V_{} $.
//Операция произведения ассоциативна.//
**Доказательство.** Имеем на основании свойства линейности
$$\mathcal P (\alpha_1X_1+\alpha_2X_2)=
\mathcal A (\mathcal B(\alpha_1X_1+\alpha_2X_2))=\mathcal A (\alpha_1\mathcal B(X_1)+
\alpha_2\mathcal B(X_2))=$$
$$=\alpha_1\mathcal A (\mathcal B(X_1))+
\alpha_2\mathcal A (\mathcal B(X_2))=\alpha_1\mathcal P(X_1)+\alpha_2{\mathcal P}(X_2).$$
Далее, для любого вектора $ X_{} $:
$$\mathcal A_1(\mathcal A_2\mathcal A_3(X))= \mathcal A_1(\mathcal A_2(\mathcal A_3(X)))=\mathcal A_1\mathcal A_2({\mathcal A}_3(X))
\ ,$$
откуда и следует ассоциативность.
♦
----
Говорят, что операторы $ \mathcal A $ и $ \mathcal B $ ** коммутируют** если $ \mathcal A \, \mathcal B = \mathcal B \, \mathcal A $.
----
!!П!! **Пример.** В плоскости $ \mathbb R^2 $ операторы поворота точек вокруг начала координат на углы $ \varphi $
$$
(x,y) \mapsto (x \cos \varphi -y \sin \varphi, \ x \sin \varphi + y \cos \varphi)
$$
и $ \psi $
$$
(x,y) \mapsto (x \cos \psi - y \sin \psi, \ x \sin \psi + y \cos \psi)
$$
против часовой стрелки коммутируют. Результатом их произведения является оператор
$$
(x,y) \mapsto \left(x \cos (\varphi+\psi) -y \sin (\varphi+\psi), \ x \sin (\varphi+\psi) + y \cos (\varphi+\psi) \right)
$$
поворота на угол $\varphi+\psi $.
Напротив, в пространстве $ \mathbb R^3 $ оператор поворота точек вокруг оси $ Oz $ на угол $ \pi/2 $ не коммутирует с оператором поворота точек вокруг оси $ Ox $ на угол $ \pi/2 $.
!!П!! **Пример.** В пространстве полиномов $ \mathbb P_{n} $ рассмотрим
дифференциальный оператор
$$\mathcal A = x\frac{d}{d\, x}\times \Box - 1\times \Box \ : \
\mathcal A(p(x)) = x p'(x) - p(x) \ .$$
Этот оператор не коммутирует с обычным оператором дифференцирования
$ \displaystyle \mathcal B= \frac{d}{d\, x} $:
$$\mathcal A (x^2)=x^2, \quad \mathcal B (\mathcal A(x^2))=2\,x, \quad
\mathcal B (x^2)=2\,x, \quad \mathcal A (\mathcal B (x^2))=0 \ .$$
♦
----
Оператор $ \mathcal E $, отображающий произвольный вектор $ X\in \mathbb V_{} $ в себя : $ \mathcal E(X)= X $, называется **тождественным** на $ \mathbb V_{} $. Оператор $ \mathcal B $ называется (**левым**)
**обратным оператору** $ \mathcal A_{} $, если $ \mathcal B\mathcal A=\mathcal E $.
В этом случае оператор $ \mathcal A_{} $ называют **обратимым** и записывают:
$ \mathcal B=\mathcal A^{-1} $.
----
Не всякий оператор обратим.
!!П!! **Пример.** В пространстве $ \mathbb R^{3} $ для оператора проецирования на плоскость:
$$ \mathcal A \left(x, y, z\right) \longmapsto \left(x, y, 0 \right)
$$
обратного не существует, т.к. $ \mathcal A(0,0,1)=(0,0,0) $ и ни при каком выборе оператора $ \mathcal B $ нельзя добиться выполнения равенства $ \mathcal B(0,0,0)=(0,0,1) $.
♦
!!?!! Показать, что обратным для оператора
$$\frac{1}{x}\int_0^x \ : p(x) \longmapsto \frac{1}{x}\int_{0}^{x}
p(t) d\, t \ ,$$
на $ \mathbb P_{n} $ является оператор
$$ \frac{d}{d\,x}\left(x\times \Box \right) \ : p(x) \longmapsto
(xp(x))' \ .$$
!!Т!! **Теорема 4.** //Оператор// $ \mathcal A_{} $ //обратим тогда и только тогда, когда
когда он невырожден//: $ \operatorname{dfc} (\mathcal A) =0 $. //В этом случае// $ \mathcal A^{-1} $ //единствен и коммутирует с// $ \mathcal A $.
Из теоремы следует, что левый обратный оператор к оператору $ \mathcal A_{} $ --- если он существует --- совпадает с правым обратным оператором. Это утверждение не будет справедливым для бесконечномерных пространств. См. задачу
7
☞
((:mapping:operator:problems ЗДЕСЬ)).
При $ K\in \mathbb N $ и $ K>1 $, $ K_{} $-я степень оператора $ \mathcal A $ определяется
рекурсивной формулой
$$\mathcal A^{\, K}=\mathcal A (\mathcal A^{\, K-1})\ .$$
Если, вдобавок, $ \mathcal A $ невырожден, то отрицательная степень оператора определяется формулой
$$\mathcal A^{-K}=\left(\mathcal A^{-1}\right)^K \ . $$
Полагают также $ \mathcal A^{\, 0}= {\mathcal E} $ для любого $ \mathcal A \ne {\mathcal O} $.
!!Т!! **Теорема 5.** //Степени оператора// $ \mathcal A $ //коммутируют://
$$\mathcal A^{\, K} \mathcal A^{\, L}=\mathcal A^{\, L}\mathcal A^{\, K}=\mathcal A^{\, K+L} \ .$$
!!П!! **Пример.** $ K_{} $-й степенью оператора дифференцирования в пространстве полиномов $ \mathbb P_{n} $ будет оператор нахождения $ K_{} $-й производной:
$$\left( \frac{d}{d\,x} \right)^K = \frac{d^K}{d\,x^K} \ .$$
Очевидно, что при $ K_{}>n $ этот оператор будет нулевым.
♦
!!П!! **Пример.** В произвольном пространстве $ \mathbb V_{} $ разбитом в ((:linear_space#прямая_сумма_линейных_подространств прямую сумму)) нетривиальных подпространств $ \mathbb V= \mathbb V_1 \oplus \mathbb V_2 $ оператор проецирования $ \mathcal P $ на подпространство $ \mathbb V_1 $ параллельно подпространству $ \mathbb V_2 $ обладает свойством $ \mathcal P^2 = \mathcal P $ (проецирование проекции оставляет ее на месте).
♦
----
Оператор $ \mathcal A $, обладающий свойством $ \mathcal A^2 = \mathcal A $, называется **идемпотентным**[[idem (//лат.//) тот же, такой же; potentia (//лат.//) сила, политическая власть.]].
----
!!П!! **Пример.** В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степени $ \le 3 $ отображение $ \mathcal A_{} $ действует по правилу
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$
т.е. полином $ f_{}(x) $ отображается в ((:polynomial#делимость_полиномов остаток от деления)) произведения $ f(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Для этого оператора $ K_{} $-й его степенью является оператор
$$ \mathcal B (f(x)) = f(x) (x^2-2)^K \pmod{x^4-x^3-x^2+x} \ . $$
Действительно, если
$$
f(x)(x^2-2) \equiv q(x)(x^4-x^3-x^2+x)+ r(x)
$$
при $ \{q(x),r(x)\} \subset \mathbb R[x] $ и $ \deg r(x) \le 3 $, то
$$
f(x)(x^2-2)^2 \equiv q(x)(x^4-x^3-x^2+x)(x^2-2)+ r(x)(x^2-2) \ .
$$
Но тогда
$$ \mathcal A^2 (f(x))= \mathcal A (r(x)) = r(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \equiv
$$
$$
\equiv f(x)(x^2-2)^2 \pmod{x^4-x^3-x^2+x} \ .
$$
Завершает доказательство //((:basics:induction святая индукция))// по степени $ K_{} $...
♦
Пусть задан произвольный полином
$ g(x)=b_{0}x^m+b_1x^{m-1}+\dots+b_m $ из $ \mathbb R[x] $ или $ \mathbb C[x] $. Выражение
$$g(\mathcal A )= b_0\mathcal A^{m}+b_1\mathcal A^{m-1}+\dots+b_m{\mathcal E}$$
будем называть **операторным полиномом**.
!!?!! Доказать, что операторные полиномы коммутируют:
$ g_1(\mathcal A )g_2(\mathcal A )=g_2(\mathcal A )g_1(\mathcal A ) $.
!!?!! Доказать, что для любого $ \mathcal A \in {\mathcal H}om(\mathbb V,\mathbb V) $
всегда найдется полином $ g_{}(x) $, $ \deg g \le n^2+1 $ такой, что
$ g(\mathcal A)={\mathcal O} $.
Сформулируем еще один результат, являющийся частным случаем приведенного в пункте
☞
((:mapping#свойства_линейных_отображений СВОЙСТВА ЛИНЕЙНЫХ ОТОБРАЖЕНИЙ)).
!!Т!! **Теорема 6.** //Пусть// $ \{X_1,X_2,\dots,X_n\} $ --- //произвольный базис// $ \mathbb V_{} $,
//а// $ Y_1,Y_2,\dots,Y_n $ --- //произвольные векторы того же пространства. Существует единственный оператор// $ \mathcal A: \mathbb V \longmapsto \mathbb V $ //такой, что//
$$ \mathcal A(X_1)=Y_1,\mathcal A(X_2)=Y_2, \dots,\mathcal A(X_n)=Y_n \ .$$
**Доказательство.** Искомый оператор строится следующим образом. Если $ X=x_1X_1+x_2X_2+\dots+x_nX_n $ --- разложение произвольного вектора $ X \in \mathbb V $ по базису, то
$$ \mathcal A(X)=x_1 Y_1+x_2Y_2+\dots+ x_nY_n \ . $$
Единственность этого оператора доказывается от противного. Любой другой оператор $ \mathcal B $, удовлетворяющий условиям $ \{\mathcal B(X_j)=Y_j\}_{j=1}^n $, будет действовать на тот же вектор $ X_{} $ с тем же результатом:
$$ \mathcal B(X)=x_1 \mathcal B(X_1)+x_2\mathcal B(X_2) +\dots+ x_n\mathcal B(X_n)=
x_1 Y_1+x_2Y_2+\dots+ x_nY_n= \mathcal A(X)\ . $$
♦
Таким образом, оператор --- как функция, действующая в $ n_{} $-мерном линейном пространстве, однозначно определяется заданием на $ n_{} $ __линейно независимых__ векторах. В доказательстве теоремы дается и конструктивный способ представления оператора по этим значениям (т.е. строится его ((:interpolation "интерполяционная формула")) ).
===Матрица оператора==
Рассмотрим оператор $ \mathcal A $ на $ \mathbb V_{} $ и пусть $ \{X_1,\dots,X_n\} $ --- базис $ \mathbb V_{} $. Являясь частным случаем ((:mapping#_определение линейного отображения)), оператор должен обладать и соответствующей ((:mapping#матрица_линейного_отображения матрицей)). Существенной особенностью, отличающей наш случай от
рассмотренного в пункте
☞
((:mapping#матрица_линейного_отображения МАТРИЦА ЛИНЕЙНОГО ОТОБРАЖЕНИЯ)), является невозможность //произвола// при выборе базиса для $ \mathcal{I}m (\mathcal A) $. Поскольку $ \mathcal{I}m (\mathcal A) $ является
подпространством $ \mathbb V_{} $, то было бы слишком большой роскошью
иметь два разных базиса для одного и того же пространства.
Найдем координаты образов базисных векторов
$ \mathcal A (X_1),\dots,\mathcal A (X_n) $ в том же базисе $ \{X_1,\dots,X_n\} $:
$$
\left\{ \begin{array}{ccc}
\mathcal A(X_1)&=&{{\color{RubineRed} \alpha }}_{11}X_1+{{\color{RubineRed} \alpha }}_{21}X_2+\dots+{{\color{RubineRed} \alpha }}_{n1}X_n, \\
\mathcal A(X_2)&=&{{\color{Green} \alpha }}_{12}X_1+{{\color{Green} \alpha }}_{22}X_2+\dots+{{\color{Green} \alpha }}_{n2}X_n, \\
\dots & & \qquad \dots , \\
\mathcal A(X_n)&=&\alpha_{1n}X_1+\alpha_{2n}X_2+\dots+\alpha_{nn}X_n.
\end{array} \right.
$$
Матрица
$$
\mathbf A= \left(\begin{array}{cccc}
{{\color{RubineRed} \alpha }}_{11} & {{\color{Green} \alpha }}_{12}& \dots & \alpha_{1n} \\
{{\color{RubineRed} \alpha }}_{21} & {{\color{Green} \alpha }}_{22}& \dots & \alpha_{2n} \\
\dots & & & \dots \\
{{\color{RubineRed} \alpha }}_{n1} & {{\color{Green} \alpha }}_{n2}& \dots & \alpha_{nn}
\end{array}
\right)_{n\times n},
$$
в столбцах которой стоят координаты образов базисных векторов,
называется **матрицей оператора** $ \mathcal A_{} $ **в базисе** $ \{X_1,\dots,X_n\} $.
!!П!! **Пример.** Известны образы базисных векторов $ \mathbb R^{3} $
под действием оператора $ \mathcal A_{} $:
$$\mathcal A \left( \begin{array}{r}
5 \\ 3 \\ 1
\end{array}\right)=
\left( \begin{array}{r}
-2 \\ 1 \\ 0
\end{array}\right)
,\
\mathcal A \left( \begin{array}{r}
1 \\ -3 \\ -2
\end{array}\right) =
\left( \begin{array}{r}
-1 \\ 3 \\ 0
\end{array}\right)
,\
\mathcal A
\left( \begin{array}{r}
1\\ 2 \\ 1
\end{array}\right)=
\left( \begin{array}{r}
-2 \\ -3 \\ 0
\end{array}\right) \ .
$$
Найти матрицу этого оператора в исходном базисе.
**Решение.** Элементы матрицы $ {\mathbf A} $ ищутся по формулам из определения, которые можно переписать в матричном виде:
$$\left[ X_1,\dots,X_n \right] {\mathbf A}=\left[ \mathcal A (X_1),\dots,\mathcal A (X_n) \right]
\ .$$
Откуда
$${\mathbf A}= \left[ X_1,\dots,X_n \right]^{-1} \left[ \mathcal A (X_1),\dots,\mathcal A (X_n)
\right] \ ,$$
и для нашего примера эта формула дает
$$
{\mathbf A}=
\left(\begin{array}{rrr}
5&1&1 \\
3&-3&2 \\
1&-2&1
\end{array}\right)^{-1}
\left(\begin{array}{rrr}
-2&-1&-2 \\
1&3&-3 \\
0&0&0
\end{array}\right)
=
$$
$$
=\left(\begin{array}{rrr} 1&-3&5\\
-1&4&-7\\
-3&11&-18
\end{array}\right)
\left(\begin{array}{rrr}
-2&-1&-2 \\
1&3&-3 \\
0&0&0
\end{array}\right)
=
\left(\begin{array}{rrr}
-5&-10&7\\
6&13&-10\\
17&36&-27
\end{array}
\right).
$$
♦
!!?!! В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степени $ \le 3 $ оператор $ \mathcal A_{} $ действует по правилу
$$ \mathcal A (f(x)) = f(x) (x^3+2\,x^2+1) \pmod{x^4+4} \ , $$
т.е. полином $ f_{}(x) $ отображается в ((:polynomial#делимость_полиномов остаток от деления)) произведения $ f(x) (x^3+2\,x^2+1) $ на $ x^4+4 $. Найти матрицу оператора $ \mathcal A_{} $ в базисе $ \{1,x,x^2,x^3\} $.
**Ответ.**
$$
\left(\begin{array}{rrrr}
1 & -4 & -8 & 0 \\
0 & 1 & -4 & -8 \\
2& 0 & 1 & -4 \\
1 & 2 & 0 & 1
\end{array}
\right) \ .
$$
!!Т!! **Теорема 7.** //Координаты произвольного вектора// $ X=x_1X_1+\dots+x_nX_n $ //и его образа// $ Y=\mathcal A(X)=y_1X_1+\dots+y_nX_n $ //связаны формулой//
$$
\left(\begin{array}{c}
y_1 \\ \vdots \\ y_n
\end{array}
\right) =
{\mathbf A}\left(\begin{array}{c}
x_1 \\ \vdots \\ x_n
\end{array}
\right) \ .
$$
Как изменяется матрица оператора при переходе к новому базису?
!!Т!! **Теорема 8.** //Если// $ C_{} $ --- //((:linear_space#преобразование_координат_при_замене_базиса матрица перехода от старого базиса
к новому)), то матрицы// $ {\mathbf A} $ //и// $ {\mathbf B} $ //оператора в старом и новом
базисах связаны формулой//:
$$
{\mathbf B}=C^{-1}\cdot {\mathbf A} \cdot C \ .
$$
**Доказательство**
☞
((:mapping:operator:vspom1 ЗДЕСЬ)).
!!П!! **Пример.** Оператор $ \mathcal A $ в базисе пространства $ \mathbb R^{3} $
$$
\underbrace{\left( \begin{array}{r}
8 \\ -6 \\ 7
\end{array}\right)}_{X_1},\
\underbrace{\left( \begin{array}{r}
-16 \\ 7 \\ -13
\end{array}\right)}_{X_2} ,\
\underbrace{\left( \begin{array}{r}
9\\ -3 \\ 7
\end{array}\right)}_{X_3}
\qquad
\mbox{ имеет матрицу }
\qquad
\left( \begin{array}{rrr}
1&-18&15\\
-1&-22&20\\
1&-25 &22
\end{array}\right).
$$
Найти его матрицу в базисе
$$
\underbrace{\left( \begin{array}{r}
1\\ -2 \\ 1
\end{array}\right)}_{\mathfrak X_1} , \
\underbrace{\left( \begin{array}{r}
3\\ -1 \\ 2
\end{array}\right)}_{\mathfrak X_2} , \
\underbrace{\left( \begin{array}{r}
2\\ 1 \\ 2
\end{array}\right)}_{\mathfrak X_3}.
$$
**Решение.** Матрица $ C_{} $ перехода от старого базиса к новому
находится по
☞
((:linear_space#преобразование_координат_при_замене_базиса формуле))
$$ C= \left[X_1|X_2|X_3\right]^{-1} \cdot \left[{\mathfrak X}_1|{\mathfrak X}_2|{\mathfrak X}_3\right]= $$
$$
=\left( \begin{array}{rrr}
8&-16&9\\
-6&7&-3\\
7&-13 &7
\end{array}\right)^{-1}
\left( \begin{array}{rrr}
1&3&2\\
-2&-1&1\\
1&2 &2
\end{array}\right)
=
$$
$$
=\left (\begin{array}{rrr}
2&-1&-3\\
{\scriptstyle 21}/{\scriptstyle 5}& -{\scriptstyle 7}/{\scriptstyle 5}&-6\\
{\scriptstyle 29}/{\scriptstyle 5}&-{\scriptstyle 8}/{\scriptstyle 5}&-8
\end{array}\right)
\left( \begin{array}{rrr}
1&3&2\\
-2&-1&1\\
1&2 &2
\end{array}\right)=
\left(\begin{array}{rrr}
1&1&-3\\
1&2&-5\\
1&3&-6
\end{array}\right) \ .
$$
По теореме:
$$
{\mathbf B}=C^{-1} {\mathbf A} C=
\left(\begin{array}{rrr}
3&-3&1\\
1&-3&2\\
1&-2&1
\end{array}\right)
\left( \begin{array}{rrr}
1&-18&15\\
-1&-22&20\\
1&-25 &22
\end{array}\right)
\left(\begin{array}{rrr}
1&1&-3\\
1&2&-5\\
1&3&-6
\end{array}\right)=
$$
$$
=\left(\begin{array}{rrr}
7&-13&7\\
6&-2&-1\\
4&1&-3
\end{array}\right)
\left(\begin{array}{rrr}
1&1&-3\\
1&2&-5\\
1&3&-6
\end{array}\right)=\left(\begin{array}{rrr}
1&2&2\\
3&-1&-2 \\
2&-3&1
\end{array}\right).
$$
♦
Матрицы $ {\mathbf A} $ и $ {\mathbf B} $, связанные соотношением
$ {\mathbf B}=C^{-1}\cdot {\mathbf A} \cdot C $ при какой-то неособенной матрице $ C_{} $, называются **подобными**, этот факт будем записывать: $ {\mathbf A}\doteq {\mathbf B} $.
!!?!! Доказать, что отношение подобия есть отношение эквивалентности, и если $ {\mathbf A}\doteq {\mathbf B} $ то $ g({\mathbf A})\doteq g({\mathbf B}) $ при любом ((:polynomial полиноме)) $ g_{}(x) $.
!!Т!! **Теорема 9.** //Для оператора// $ \mathcal A_{} $ //ранг его матрицы является инвариантом, т.е. не зависит от выбора базиса пространства. Этот ранг совпадает с рангом оператора// $ \mathcal A_{} $.
**Доказательство.** Если $ {\mathbf A} $ и $ {\mathbf B} $ --- матрицы оператора в двух разных базисах, то они являются подобными: $ {\mathbf B}=C^{-1}{\mathbf A} C $. По ((:algebra2:rank#неравенства_для_ранга свойству ранга матрицы)) имеем:
$ \operatorname{rank}( {\mathbf B})= \operatorname{rank}({\mathbf A}) $.
♦
!!=>!! Дефект оператора $ \mathcal A_{} $ совпадает с дефектом его матрицы в произвольном базисе пространства.
!!Т!! **Теорема 10.** //Для оператора// $ \mathcal A_{} $ //определитель и ((:algebra2#след след)) его матрицы являются инвариантами, т.е. не зависят от выбора базиса пространства.//
**Доказательство.** Действительно, для подобных матриц $ {\mathbf A} $ и $ {\mathbf B} $, на основании ((:algebra/dets/binet_cauchy теоремы Бине-Коши)) имеем:
$$ \det ({\mathbf B}) = \det (C^{-1}{\mathbf A} C) = \det (C^{-1}) \cdot \det ({\mathbf A}) \cdot \det (C) =\det ({\mathbf A}) . $$
Далее, по свойству следа матрицы:
$$ \operatorname{Sp}({\mathbf B}) = \operatorname{Sp}(C^{-1}{\mathbf A} C)=\operatorname{Sp}({\mathbf A} \cdot C \cdot C^{-1})=\operatorname{Sp}({\mathbf A}) \ . $$
♦
Этот результат позволяет ввести понятие **определителя** и **следа оператора** $ \mathcal A_{} $ --- посредством матрицы этого оператора в произвольном базисе пространства. Такое определение оказывается корректным поскольку оба значения не зависят от выбора базиса.
===Оператор в евклидовом пространстве==
Каков "физический" смысл определителя оператора?
Начнем с примера.
!!П!! **Пример.** Пусть на плоскости $ \mathbb R^2 $ задано ((:euclid_space#opredelenija стандартное скалярное произведение)). Рассмотрим оператор, отображающий векторы по правилу
$$
\left(\begin{array}{l} y_1 \\ y_2 \end{array} \right)=
\left(\begin{array}{rr} 1 & - 3 \\ 1 & -1 \end{array} \right)
\left(\begin{array}{l} x_1 \\ x_2 \end{array} \right) \ .
$$
Свойство линейности оператора как отображения плоскости проявляется в том, что параллельные отрезки он отображает в параллельные же отрезки (см. упражнение к теореме 2 из
☞
((:mapping#свойства_линейных_отображений ПУНКТА)) ), и, следовательно, любой параллелограмм отображается им в параллелограмм.
{{ mapping:map1.jpg |}}
Площади соответствующих параллелограммов оказываются связанными через определитель матрицы --- более точно, через __модуль__ этого определителя. Причем этот результат не зависит от расположения отображаемой фигуры: коэффициент растяжения будет одинаков в любом месте плоскости.
♦
В рассмотренном примере это проверяется непосредственно; что касается обобщения на произвольное //евклидово// пространство, в котором понятие объема вводится ((:dets:gram#объемы_параллелепипедов аксиоматически)) то справедлив следующий результат.
!!Т!! **Теорема 11.** //Пусть// $ \{X_{1},\dots,X_n \} $ --- //произвольные векторы// $ n_{} $//-мерного евклидова пространства// $ \mathbb E_{} $, //а// $ \mathcal A_{} $ --- //линейный оператор, действующий в этом пространстве. Справедливо равенство//
$$ {\mathfrak G}(\mathcal A (X_1),\dots, \mathcal A (X_n))=\left( \det (\mathcal A) \right)^2 \cdot {\mathfrak G}(X_1,\dots, X_n) \ . $$
//Здесь// ${\mathfrak G}$ --- //((:dets/gram#matrica_i_opredelitel_grama определитель Грама))//.
**Доказательство** проведем для частного случая пространства столбцов $ \mathbb R^n $ со стандартным скалярным произведением и оператором
$$ Y=AX $$
при вещественной матрице $ A_{n\times n} $. Составим матрицу из столбцов
$$
\mathbf X=\left[X_1|X_2|\dots|X_n \right] \, .
$$
Тогда матрицу Грама этих столбцов можно представить в виде
$$
G(X_1,X_2,\dots,X_n) = \mathbf X^{\top} \mathbf X \, ,
$$
и ее определитель равен $ (\det \mathbf X)^2 $.
А матрицу Грама столбцов $ \{ AX_1,AX_2,\dots, AX_n \} $ можно представить в виде
$$
G(AX_1,AX_2,\dots,AX_n) = (A\mathbf X)^{\top} (A\mathbf X) = \mathbf X^{\top} A^{\top} A \mathbf X \, .
$$
На основании ((:algebra/dets/binet_cauchy теоремы Бине-Коши)) определитель последней матрицы равен $ (\det A)^2 (\det \mathbf X)^2 $.
♦
Теперь совмещаем этот результат со следующим, взятым ((:dets/gram#obemy_parallelepipedov ОТСЮДА))
!!Т!! **Теорема.** //Квадрат объема параллелепипеда, построенного на векторах системы// $ \{X_1,X_2,\dots,X_k\} $, //совпадает с величиной определителя Грама от той же системы//:
$$[V(X_1,X_2,\dots,X_k)]^2= \mathfrak G (X_1,X_2,\dots,X_k) \ .$$
Где-то в курсе математического анализа есть результат, что внутрь оболочки любого кубируемого тела в $ \mathbb R^3 $ может быть заложен __конечный__ набор параллелепипедов так что суммарный объем этого набора сколь угодно мало будет отличаться от объема тела (см.
☞
((https://dzen.ru/video/watch/65e1062c454d4741b3fbaa9b видео))).
За счет этого результата (и его абстрагированием в произвольное евклидово пространство) приходим к умозаключению.
"Физический" смысл определителя оператора заключается в том, что модуль его значения представляет коэффициент расширения[[Слово "расширение" следует понимать в обобщенном смысле, т.е. в случае $ |\det (\mathcal A)| <1 $ имеет место сжатие.]]объема (в рассмотренном выше примере --- площади) тела (соответственно, плоской фигуры) под воздействием этого оператора.
Подчеркну: рассматриваемое линейное пространство обязано быть евклидовым, т.е. в нем должна быть определена длина любого вектора. Как правило, в дальнейшем будем иметь дело с пространством $ \mathbb R^n $ со стандартным скалярным произведением.
!!=>!! Случаю $ |\det (\mathcal A)|=1 $ соответствует оператор, сохраняющий объемы. Примером такого оператора является оператор
$$ PX,\ X\in \mathbb R^n , $$
при ((:algebra2/ort_matrix ортогональной матрице)) $ P \in \mathbb R^{n\times n} $. Этот оператор сохраняет не только объемы, но и расстояния между точками пространства, а также углы между векторами. Так, к примеру,
$$ \langle PX, PX \rangle = X^{\top} P^{\top}P X = X^{\top} E X= X^{\top} X = \langle X, X \rangle \, . $$
А вот объяснить "физический" смысл __следа__ оператора посложнее будет...:-\
===Матрица оператора (продолжение)==
!!Т!! **Теорема 6.** //Оператор обратим тогда и только тогда, когда когда его определитель отличен от нуля.//
!!Т!! **Теорема 7.** //Линейное пространство// $ {\mathcal H}om(\mathbb V,\mathbb V) $ //операторов на// $ \mathbb V_{}, \dim \mathbb V = n $ //изоморфно линейному пространству квадратных матриц порядка// $ n_{} $ (//с элементами из// $ \mathbb R_{} $ //или из// $ \mathbb C_{} $).
Это утверждение является простым следствием теоремы 2, приведенной в пункте
☞
((:mapping#матрица_линейного_отображения МАТРИЦА ЛИНЕЙНОГО ОТОБРАЖЕНИЯ)).
Однако в случае операторов установленный изоморфизм сохранит не только результат операции сложения, но и результат операции умножения:
$$ . \mbox{ если } \mathcal A_1 \leftrightarrow \mathbf A_1,\
\mathcal A_2 \leftrightarrow \mathbf A_2, \mbox{ то } \mathcal A_1+ \mathcal A_2 \leftrightarrow \mathbf A_1 + \mathbf A_2,\ \lambda \mathcal A_1
\leftrightarrow \lambda \mathbf A_1 \ , \ \mathcal A_1 \mathcal A_2 \leftrightarrow \mathbf A_1 \mathbf A_2 \ .
$$
Я сформулирую этот "усиленный вариант" изоморфизма в виде набора свойств, которыми буду пользоваться по мере возникновения потребности.
!!Т!! **Теорема 8.** //В любом базисе пространства//
**а)** //матрица нулевого оператора// $ \mathcal O $ //является нулевой матрицей// $ \mathbb O_{} $, //а матрица тождественного оператора// $ \mathcal E $ //является единичной матрицей// $ E_{} $; //обратно: если матрица оператора в этом базисе --- нулевая (единичная), то оператор является нулевым (соответственно, тождественным);//
**б)** //матрица произведения операторов совпадает с произведением матриц этих операторов[[Взятых в том же порядке!]];//
**в)** //коммутирующим операторам соответствуют коммутирующие матрицы;//
**г)** //если// $ {\mathbf A} $ --- //матрица оператора//, //то// $ {\mathbf A}^{-1} $ --- //матрица обратного оператора;//
**д)** //если// $ {\mathbf A} $ --- //матрица оператора// $ \mathcal A $, //то матрицей операторного полинома// $ g (\mathcal A) $ //является матрица// $ g({\mathbf A}) $ .
====Матрица оператора и матрица перехода от базиса к базису==
Эти матрицы как-то взаимодействовали между собой в предыдущем пункте, хотя вторая была определена совершенно в другом ((:linear_space#преобразование_координат_при_замене_базиса разделе)). Обе матрицы квадратные, обе имеют в определении "завязку" на базис пространства $ \mathbb V_{} $. У начинающих изучать теорию часто возникает путаница при различении этих определений.
"Физический" смысл этих понятий различен. Образно говоря, если рассматривать оператор как //процесс// (точнее: установленную связь между входными и выходными значениями процесса), то выбор базиса можно интерпретировать как выбор //точки зрения// на этот процесс (можно трактовать эти слова как формализацию выражения "рассмотрим этот процесс под другим углом").
Тем не менее, с //чисто формальной точки зрения//, матрица $ C_{} $ перехода от базиса $ \{X_1,X_2,\dots,X_n \} $ пространства $ \mathbb V_{} $ к какому-то другому базису $ \{\mathfrak X_1,\mathfrak X_2,\dots,\mathfrak X_n \} $ того же пространства __может считаться матрицей некоторого оператора__, действующего в этом пространстве. В самом деле, на основании ((#osnovnye_opredelenija теоремы 6)), существует единственный оператор $ \mathcal C $, переводящий старые базисные векторы в новые, взятые в той же последовательности:
$$ \mathcal C (X_1)=\mathfrak X_1, \mathcal C (X_2)= \mathfrak X_2, \dots, \mathcal C (X_n)= \mathfrak X_n \ . $$
Но тогда матрица оператора $ \mathcal C $ в базисе $ \{X_1,X_2,\dots,X_n \} $ совпадает с матрицей $ C_{} $ перехода от базиса $ \{X_1,X_2,\dots,X_n \} $ к базису $ \{\mathfrak X_1,\mathfrak X_2,\dots,\mathfrak X_n \} $.
Я буду записывать матрицы операторов и матрицы переходов от базиса к базису в разных стилях: $ \mathbf A, \mathbf B,\dots $ и, соответственно, $ C, P, T, \dots $ ---
с целью быстрого распознавания их "физической" сущности.
====Матрица оператора проецирования==
Настоящий пункт может быть пропущен при первоначальном чтении.
!!T!! **Теорема.** //Рассмотрим линейную оболочку линейно независимой системы столбцов// $ \{Y_1,\dots, Y_k \} \subset \mathbb R^n $.
$$ \mathbb M =\left\{ \lambda_1 Y_1 + \dots + \lambda_k Y_k \ \big| \ \{\lambda_1,\dots,\lambda_k\} \subset \mathbb R \right\}= \mathcal L (Y_1,\dots,Y_k) \, . $$
//Пусть ((#euclid_space#определения скалярное произведение)) векторов// $ X_{} $ //и// $ Y_{} $ //задается стандартным способом, т.е.// $ \langle X,Y \rangle =x_1y_1+\dots+x_ny_n $.
//Ближайшей к точке// $ X_0 \subset \mathbb R^n $ //точкой многообразия (или ортогональной проекцией точки// $ X_0 $ //на многообразие) // $ \mathbb M_{} $ //является//
$$ X_{\ast} = \mathbf L (\mathbf L^{\top} \mathbf L )^{-1} \mathbf L^{\top} X_0 \, . $$
//Здесь// $ \mathbf L=[Y_1 |\dots |Y_k]_{n\times k} $.
Матрица $ \mathbf L^{\top} \mathbf L $ невырождена, поскольку является ((:euclid_space#свойства_матрицы_грама матрицей Грама))
$$
\mathbf L^{\top} \mathbf L=
\left(\begin{array}{cccc}
Y_1^{\top} Y_1 & Y_1^{\top} Y_2 & \dots & Y_1^{\top} Y_k \\
Y_2^{\top} Y_1 & Y_2^{\top} Y_2 & \dots & Y_2^{\top} Y_k \\
\dots & & & \dots \\
Y_k^{\top} Y_1 & Y_k^{\top} Y_2 & \dots & Y_k^{\top} Y_k
\end{array}
\right)
$$
системы линейно независимых столбцов $ \{Y_1,\dots, Y_k \} $.
**Доказательство.** Пусть $ X_0=X_0^{^{\parallel}}+X_0^{^{\bot}} $, где $ X_0^{^{\parallel}} $ --- ортогональная проекция точки $ X_0 $ на $ \mathbb M $, а $ X_0^{^{\bot}} $ --- ортогональная составляющая.
Тогда
$$ \mathbf L^{\top} X_0^{^{\bot}}=\mathbb O $$
поскольку $ Y_1^{\top} X_0^{^{\bot}}=0,\dots, Y_k^{\top} X_0^{^{\bot}}=0 $. Далее, $ X_0^{^{\parallel}} $ можно разложить по базису $ \{Y_1,\dots, Y_k \} $:
$$ X_0^{^{\parallel}}=\alpha_1 Y_1+\dots+ \alpha_k Y_k \quad npu \quad \{\alpha_1,\dots,\alpha_k\} \subset \mathbb R \, .
$$
Следовательно,
$$
\mathbf L^{\top} X_0=\mathbf L^{\top} (X_0^{^{\parallel}}+X_0^{^{\bot}})=\mathbf L^{\top} X_0^{^{\parallel}}=
\mathbf L^{\top} (\alpha_1 Y_1+\dots+ \alpha_k Y_k)=
$$
$$
=\left(
\begin{array}{c}
\alpha_1 Y_1^{\top} Y_1 +\dots + \alpha_k Y_1^{\top} Y_k \\
\alpha_1 Y_2^{\top} Y_1 +\dots + \alpha_k Y_2^{\top} Y_k \\
\dots \\
\alpha_1 Y_k^{\top} Y_1 +\dots + \alpha_k Y_k^{\top} Y_k
\end{array}
\right)= \mathbf L^{\top} \mathbf L
\left(
\begin{array}{c}
\alpha_1 \\
\alpha_2 \\
\vdots \\
\alpha_k
\end{array}
\right)\, .
$$
Тогда
$$
\mathbf L (\mathbf L^{\top} \mathbf L )^{-1} \mathbf L^{\top} X_0=
\mathbf L
\left(
\begin{array}{c}
\alpha_1 \\
\alpha_2 \\
\vdots \\
\alpha_k
\end{array}
\right)
=\alpha_1 Y_1+\dots+ \alpha_k Y_k= X_0^{^{\parallel}} \, .
$$
На основании теорем $ 1_{} $ и $ 2_{} $, приведенных
☞
((:euclid_space#вычисление_расстояния ЗДЕСЬ)),
точка $ X_0^{^{\parallel}} $ является ближайшей точкой многообразия $ \mathbb M $ к точке $ X_{0} $.
♦
Матрица $ P=\mathbf L (\mathbf L^{\top} \mathbf L )^{-1} \mathbf L^{\top} $ является матрицей оператора ортогонального проецирования на многообразие $ \mathbb M_{} $
в стандартном базисе
$$ \bigg\{{\mathfrak e}_j = \big[\underbrace{0,\dots,0,1}_{j},0,\dots,0\big]^{\top} \bigg\}_{j=1}^n \, . $$
Она симметрична и ((#основные_определения идемпотентна)), т.е. обладает свойством $ P^2=P $.
!!П!! **Пример.** В $ \mathbb R^{3} $ найти матрицу проецирования на плоскость $ x+y+z=0 $.
**Решение.** Параметрическое задание плоскости:
$$
\mathbb M=\{ \lambda_1 \underbrace{[1,-1,0]^{\top}}_{Y_1} + \lambda_2 \underbrace{[0,1,-1]^{\top}}_{Y_2}\ \big| \{\lambda_1,\lambda_2\} \subset \mathbb R \} \, .
$$
Имеем:
$$
\mathbf L=
\left(\begin{array}{rr}
1 & 0 \\
-1 & 1 \\
0 & -1
\end{array}
\right) \ \Rightarrow \
\mathbf L^{\top} \mathbf L=
\left(\begin{array}{rr}
2 & -1 \\
-1 & 2
\end{array}
\right) \ \Rightarrow \ (\mathbf L^{\top} \mathbf L )^{-1}=
\left(\begin{array}{rr}
2/3 & 1/3 \\
1/3 & 2/3
\end{array}
\right) \ \Rightarrow \
$$
$$
\ \Rightarrow \ \mathbf L (\mathbf L^{\top} \mathbf L )^{-1} \mathbf L^{\top}=
\frac{1}{3} \left(\begin{array}{rrr}
2 & -1 & -1 \\
-1& 2 & -1 \\
-1 & -1 & 2
\end{array}
\right) \, .
$$
♦
В общем случае отображение точки $ X_{0} $ на ближайшую к ней точку __произвольного__ многобразия
$$ \mathbb M =\left\{ Y_0+\lambda_1 Y_1 + \dots + \lambda_k Y_k \ \big| \ \{\lambda_1,\dots,\lambda_k\} \subset \mathbb R \right\} \, ,$$
при $ Y_0 $ линейно независимом от $ \{Y_1,\dots,Y_k\} $, не является линейным оператором, а относится к типу ((:algebra2:optimiz:distance#аффинные_отображения аффинных отображений)). Выражение для этого отображения см. в разделе
☞
((:algebra2:optimiz:distance#расстояние_от_точки_до_линейного_многообразия_плоскости ВЫЧИСЛЕНИЕ РАССТОЯНИЙ МЕЖДУ ГЕОМЕТРИЧЕСКИМИ ОБЪЕКТАМИ)).
====Матрица оператора отражения (оператора Хаусхолдера)==
Настоящий пункт может быть пропущен при первоначальном чтении.
В пространстве $ \mathbb R^n $ со стандартным скалярным произведением рассмотрим плоскость, заданную уравнением
$$ C^{\top}X= c_1x_1+c_2x_2+\dots+c_nx_n = 0 $$
при векторе нормали $ C^{\top}=(c_1,c_2,\dots,c_n) $ единичной длины: $ |C|^2= C^{\top}C=1 $. Действие оператора **зеркального отражения** или **оператора Хаусхолдера**[[Householder A.S. (1904-1993) --- американский математик.]] относительно этой плоскости на вектор (точку) $ X \in \mathbb R^n $ определим правилом
$$ \mathcal H( X^{^{\parallel}} + X^{^{\bot}})= X^{^{\parallel}} - X^{^{\bot}} \ ; $$
здесь $ X^{^{\parallel}} $ --- ((:euclid_space#вычисление_расстояния ортогональная проекция)) вектора $ X_{} $ на заданную плоскость, а $ X^{^{\bot}} $ --- ((:euclid_space#вычисление_расстояния ортогональная составляющая)) вектора $ X_{} $ относительно этой плоскости.
{{ mapping:reflection.png |}}
!!Т!! **Теорема.** //Оператор// $ \mathcal H $ //задается уравнением//
$$ \mathcal H(X)=X-2\, \langle X,C \rangle C=X-2\, C (C^{\top}X)= X-2\, C^{\top}XC \, . $$
Последний вариант формулы никогда не встречал, но он имеет формальное право на существование!
**Доказательство.**
$$ \mathcal H( X^{^{\parallel}} + X^{^{\bot}})=X^{^{\parallel}} + X^{^{\bot}}-2\, \langle X^{^{\parallel}},C \rangle C-2\,
\langle X^{^{\bot}},C \rangle C = $$
Поскольку $ X^{^{\parallel}} $ ортогонален, а вектор $ X^{^{\bot}} $ коллинеарен вектору $ C $ единичной длины, то
$$= X^{^{\parallel}} + X^{^{\bot}} - 2\, X^{^{\bot}} = X^{^{\parallel}} - X^{^{\bot}} \, . $$
♦
!!Т!! **Теорема.** //Матрица оператора// $ \mathcal H $ //в стандартном базисе//
$$ \bigg\{{\mathfrak e}_j = \big[\underbrace{0,\dots,0,1}_{j},0,\dots,0\big]^{\top} \bigg\}_{j=1}^n \, . $$
//имеет вид//
$$ \mathbf H_{C}= E-2\, C \cdot C^{\top} =
\left( \begin{array}{cccc}
1-2c_1^2 & -2\,c_1c_2 & \dots & - 2 c_1 c_n \\
-2\,c_1c_2 & 1-2c_2^2 & \dots & - 2 c_2 c_n \\
\vdots & & & \vdots \\
- 2 c_1 c_n & - 2 c_2 c_n & \dots & 1-2c_n^2
\end{array}
\right) \, .
$$
!!П!! **Пример.** Найти зеркальное отражение точки $ [3,2,3] $ относительно плоскости $ 2\,x-2\,y+z = 0 $.
**Решение.** Здесь $ C^{\top}=[2/3,-2/3,1/3] $ и
$$ \mathcal H(X)= \left( \begin{array}{r} 3 \\ 2 \\ 3 \end{array} \right) - 2\langle [3,2,3],[2/3,-2/3,1/3] \rangle
\left( \begin{array}{r} 2/3\\ -2/3 \\ 1/3 \end{array} \right)=
\left( \begin{array}{r} 7/9 \\ 38/9 \\ 17/9 \end{array} \right) \, .
$$
Проверим результат посредством матричного представления:
$$
\mathbf H_C=
\left( \begin{array}{rrr}
1/9 & 8/9 & -4/9 \\
8/9 & 1/9 & 4/9 \\
-4/9 & 4/9 & 7/9
\end{array}
\right) \quad \Rightarrow \quad \mathbf H \left( \begin{array}{r} 3 \\ 2 \\ 3 \end{array} \right)=
\left( \begin{array}{r} 7/9 \\ 38/9 \\ 17/9 \end{array} \right) \, .
$$
♦
!!=>!! Матрица $ \mathbf H_{C} $ одновременно симметрична и ((:algebra2:ort_matrix ортогональна)), и $ \det \mathbf H_{C}=-1 $. Следовательно, ей обратная существует и совпадает с ней самой:
$$ \mathbf H_{C}^{-1}= \mathbf H_{C} \, . $$
Обобщение оператора отражения на случай нелинейного многообразия см. в пункте
☞
((:dets:discrim:equidist#кривая_зеркального_отражения КРИВАЯ ЗЕРКАЛЬНОГО ОТРАЖЕНИЯ)).
==Инвариантное подпространство==
**Задача.** Подобрать базис пространства $ \mathbb V_{} $ так, чтобы матрица заданного оператора $ \mathcal A_{} $ имела наиболее простой вид.
Исследуем действие оператора $ \mathcal A $ на произвольное подпространство
$ \mathbb V_1 \subset \mathbb V $:
$$\mathcal A (\mathbb V_1)= \left\{Y\in \mathbb V \mid Y=\mathcal A (X), \ X \in \mathbb V_1
\right\} \ .$$
Вообще говоря, множества $ \mathbb V_1 $ и $ \mathcal A (\mathbb V_1) $ будут различными, т.е.
$ \exists X_1 \in \mathbb V_1 $ такой, что $ \mathcal A (X_1)\notin \mathbb V_1 $.
Подпространство $ \mathbb V_1 $ называется **инвариантным подпространством оператора** $ \mathcal A $, если оно отображается этим оператором в себя:
$$ \mathcal A(\mathbb V_1)\subset \mathbb V_1 \ .$$
$ \mathbb V_1=\{\mathbb O \} $ и $ \mathbb V_1=\mathbb V $ --- **тривиальные инвариантные подпространства** произвольного оператора $ \mathcal A $.
Нас будут интересовать нетривиальные инвариантные подпространства.
!!П!! **Пример.** Оператор
$$\left(\begin{array}{c}
x \\ y \\ z
\end{array}
\right) \longmapsto
\left(\begin{array}{rrr}
{\scriptstyle 1}/{\scriptstyle \sqrt 2} &
-{\scriptstyle 1}/{\scriptstyle \sqrt 2} & 0 \\
{\scriptstyle 1}/{\scriptstyle \sqrt 2} &
{\scriptstyle 1}/{\scriptstyle \sqrt 2} & 0 \\
0 & 0 & 1
\end{array}
\right)
\left(\begin{array}{c}
x \\ y \\ z
\end{array}
\right)
$$
задает в пространстве поворот вокруг оси $ \mathbb O z $ на угол
$ +\pi /4 $.
Нетривиальными инвариантными подпространствами будут
**а)** ось вращения $ \mathbb V_1=\{(0,0,z)^{^{\top}} \mid z \in \mathbb R\} $, $ \dim \mathbb V_1=1 $ и
**б)** плоскость, перпендикулярная оси вращения $ \mathbb V_2=\{(x,y,0)^{^{\top}} \mid \{x,y\} \subset \mathbb R\} $, $ \dim \mathbb V_2= 2 $.
♦
!!П!! **Пример.** Оператор
$$\left(\begin{array}{c}
x \\ y
\end{array}
\right) \longmapsto
\left(\begin{array}{c}
\lambda_1 x \\ \lambda_2 y
\end{array}
\right)
$$
задает на плоскости "растяжение": $ x_{} $-компонента увеличивается
в $ \lambda_{1} $ раз, а $ y_{} $-компонента --- в $ \lambda_{2} $ раз.
При любой комбинации коэффициентов растяжения координатные оси будут инвариантными подпространствами. Однако в частном случае $ \lambda_1=\lambda_2 $ инвариантной будет также любая
прямая, проходящая через начало координат.
♦
!!П!! **Пример.** Оператор в $ \mathbb R^{n}_{} $ задан блочной матрицей
$$X \longmapsto \left( \begin{array}{cc}
{\mathbf A}_1 & {\mathbf *}\\
\mathbb O & {\mathbf A}_2
\end{array}
\right) X
$$
где $ {\mathbf A}_1 $ --- $ n_1\times n_1 $-матрица, $ {\mathbf A}_2 $ ---
$ (n-n_1)\times (n-n_1) $-матрица. Множество столбцов
$$\mathbb V_1=\left\{X=[x_1,\dots,x_{n_1},0,\dots,0]^{^{\top}} \bigg| \{ x_1,
\dots, x_{n_1} \} \subset \mathbb R \right\}$$
образует инвариантное подпространство, $ \dim \mathbb V_1=n_1 $. Если же, вдобавок,
матрица, обозначенная $ {\mathbf *} $ --- нулевая, то вторым инвариантным
подпространством будет
$$ \mathbb V_2=\left\{X=[0,\dots,0,x_{n_1+1},\dots,x_n]^{^{\top}} \bigg| \{x_{n_1+1},\dots, x_n \} \subset \mathbb R \right\} \ .$$
♦
!!Т!! **Теорема.** $ \mathcal{K}er (\mathcal A) $ //и// $ \mathcal{I}m(\mathcal A) $ ---
//инвариантные подпространства оператора// $ \mathcal A $.
!!?!! Доказать, что сумма двух инвариантных подпространств является инвариантным подпространством.
!!Т!! **Теорема.** //Если пространство// $ \mathbb V_{} $ //раскладывается в ((:linear_space#прямая_сумма_линейных_подпространств прямую сумму подпространств)), инвариантных относительно оператора// $ \mathcal A $, //то существует базис пространства, в котором матрица оператора будет блочно-диагональной//.
Теорема обобщается очевидным образом на произвольное число слагаемых
подпространств: $ \mathbb V=\mathbb V_1\oplus \mathbb V_2 \oplus \dots \oplus \mathbb V_k $.
Если при этом $ \dim \mathbb V_1= \dots = \dim \mathbb V_k=1 $, то матрица оператора в базисе, полученном объединением базисных векторов слагаемых подпространств, становится диагональной --- это и является решением задачи, поставленной в начале пункта.
===Собственное число и собственный вектор==
**Задача.** Найти одномерные инвариантные подпространства оператора.
Вектор $ X_{}\in \mathbb V $ называется **собственным вектором оператора** $ \mathcal A_{} $, если
$$ {\mathbf a)} X \ne \mathbb O, \quad u \quad {\mathbf b)}\ \exists \ \lambda \in \mathbb C \qquad \mbox{ такое, что } \qquad
\mathcal A(X)=\lambda X \ .$$
В этом случае число $ \lambda_{} $ называется
**собственным** или **характеристическим числом оператора**, соответствующим (или принадлежащим) данному собственному вектору; обратно, говорят, что **вектор** $ X_{} $ **принадлежит собственному числу** $ \lambda_{} $.
Вопрос существования хотя бы одного собственного числа для произвольного оператора $ \mathcal A_{} $ остается пока открытым. Однако, свойство линейности оператора гарантирует, что если это число существует, то ему соответствует бесконечное множество собственных векторов:
$$ \mathcal A(X)=\lambda X \quad \Rightarrow \quad \mathcal A(t\,X)=t \mathcal A(X)= t\lambda\, X \ , $$
т.е. если вектор $ X \in \mathbb V_{} $ является собственным, то и вектор $ t\, X $ будет собственным при любом скаляре $ t\ne 0 $. Заметим, что собственное число разыскивается во множестве комплексных чисел: вопрос о существовании __вещественного__ собственного числа --- даже в случае вещественного пространства $ \mathbb V_{} $ --- остается открытым. Геометрический смысл вещественных собственных чисел и векторов проясняет следующий пример.
!!П!! **Пример.** Оператор
$$\left(\begin{array}{c}
x \\ y
\end{array}
\right) \longmapsto
\left(\begin{array}{rr}
1 & - 5/2 \\
-1/2 & 2
\end{array}
\right)
\left(\begin{array}{c}
x \\ y
\end{array}
\right)
$$
задает отображение плоскости $ \mathbb R^2 $. На рисунке показан результат действия этого отображения на единичную окружность. Все точки плоскости, за исключением начала координат $ \mathbb O_{} $, изменят свое положение --- ни одна не останется на месте.
{{ mapping:eigenvect.gif |}}
Если рассмотреть эти точки как концы векторов, имеющих начало в $ \mathbb O_{} $, то смещения точек под действием оператора можно представить в виде двух составляющих: растяжения (т.е. увеличения расстояния до начала координат) и поворота вокруг начала координат на некоторый угол. И только по двум направлениям плоскости поворота не происходит. Точки окружности с координатами
$$
\pm \left( 0.823, -0.568 \right)^{\top} \quad u \quad
\pm \left( 0.960, 0.278 \right)^{\top}
$$
будут смещаться без поворота. Эти точки и задают координаты конца собственного вектора. А соответствующие им собственные числа $ 2.725 $ и $ 0.275 $ определяют коэффициенты сдвига.
Если вообразить оператор как деформацию физической среды, заполняющей плоскость, то можно сказать, что cобственный вектор задает направление, на котором действие оператора сводится к растяжению, при этом коэффициент растяжения и будет собственным числом.
!!А!! Анимация процесса
☞
((:mapping:operator:anim10 ЗДЕСЬ)) (1500 Kb, gif).
Пример другого оператора
$$
\left(\begin{array}{l} x \\ y \end{array} \right) \longmapsto
\left(\begin{array}{rr} 1 & - 3 \\ 1 & -1 \end{array} \right)
\left(\begin{array}{l} x \\ y \end{array} \right)
$$
показывает, что существование __вещественных__ собственных чисел вовсе не гарантировано даже в случае оператора в вещественном пространстве: в этом примере все точки плоскости повернутся вокруг начала координат.
♦
Я "замыливаю" ответ на вопрос какой физический смысл имеют __отрицательные__ собственные числа...
!!?!! Доказать, что $ \operatorname{dfc} (\mathcal A) \ne 0 $ тогда и только тогда, когда оператор $ \mathcal A_{} $ имеет собственное число, равное нулю.
!!Т!! **Теорема.** //Любой собственный вектор оператора порождает его одномерное инвариантное подпространство, и обратно: любой ненулевой вектор одномерного инвариантного подпространства
оператора является собственным вектором.//
!!П!! **Пример.** В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степени $ \le 3 $ оператор $ \mathcal A_{} $ действует по правилу
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$
т.е. полином $ f_{}(x) $ отображается в ((:polynomial#делимость_полиномов остаток от деления)) произведения $ f(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Найти собственные векторы этого оператора.
**Решение.** В пространстве $ \mathbb P_3 $ векторами являются полиномы, а условие того, что полином $ f_{}(x) $ является собственным, принадлежащим числу $ \lambda_{} $, записывается в виде:
$$ f(x)(x^2-2)\equiv \lambda f(x) \pmod{x^4-x^3-x^2+x} \quad \iff $$
$$ \iff \quad f(x)(x^2-2-\lambda)\equiv 0 \pmod{x^4-x^3-x^2+x} \ . $$
Поскольку $ \deg f \le 3 $, то последнее может выполняться тогда и только тогда, когда полином
$ x^2-2-\lambda $ имеет общие корни с $ x^4-x^3-x^2+x \equiv x(x+1)(x-1)^2 $. Из этого условия вытекает, что число $ \lambda_{} $ может принимать только два значения: $ \lambda_1=-2 $ и
$ \lambda_2=-1 $. Если $ \lambda_1=-2 $ является собственным числом, то ему соответствующий собственный вектор --- полином степени $ \le 3 $ --- должен определяться из условия делимости $ f(x)x^2 $ на $ x(x+1)(x-1)^2 $. Такой полином имеет вид $ t(x+1)(x-1)^2 $ при произвольной константе $ t_{} $. Следовательно множество
$$ \{ t(x^3-x^2-x+1)= t(x+1)(x-1)^2 \ \mid \ t\ne 0 \} $$
является множеством собственных векторов, принадлежащих $ \lambda_1=-2 $.
С числом $ \lambda_2=-1 $ поступаем аналогично. Условие делимости полинома $ f(x)(x^2-1) $ на $ x(x+1)(x-1)^2 $ дает также бесконечное множество:
$$ \{ (t_1x+t_2)x(x-1) \ \mid \ \{t_1,t_2\} \subset \mathbb R \} \ . $$
Однако в этом случае бесконечность множества качественно иная, чем в предыдущем случае; она --- "двумерная".
♦
**Задача.** Для произвольного оператора выяснить условия существования его собственного числа и разработать конструктивный метод его нахождения.
!!Т!! **Теорема.** //В комплексном линейном пространстве любой оператор имеет по крайней мере один собственный вектор.//
**Доказательство.** Пусть $ \{X_1,\dots,X_{n} \} $ --- произвольный базис пространства $ \mathbb V_{} $ и
$ \mathbf A_{} $ --- ((#матрица_оператора матрица оператора)) $ \mathcal A_{} $ в этом базисе. Тогда для
того чтобы вектор $ X=x_1X_1+\cdots+x_nX_n \ne \mathbb O $ был собственным,
принадлежащим собственному числу $ \lambda_{} $, необходимо и достаточно чтобы выполнялось
равенство
$$
{\mathbf A}\left(\begin{array}{c}
x_1 \\ x_2 \\ \vdots \\ x_n
\end{array}
\right) =
\lambda \left(\begin{array}{c}
x_1 \\ x_2 \\ \vdots \\ x_n
\end{array}
\right) \quad
\Longleftrightarrow \quad
\left(\begin{array}{cccc}
\alpha_{11} - \lambda & \alpha_{12}& \dots & \alpha_{1n} \\
\alpha_{21} & \alpha_{22}- \lambda& \dots & \alpha_{2n} \\
\dots & & & \dots \\
\alpha_{n1} & \alpha_{n2}& \dots & \alpha_{nn}- \lambda
\end{array}
\right)
\left(\begin{array}{c}
x_1 \\ x_2 \\ \vdots \\ x_n
\end{array}
\right) = \mathbb O_{n\times 1}
$$
Покажем, что существуют комплексные числа $ \lambda_{} $ и не все нулевые $ x_1,\dots,x_{n} $, удовлетворяющие этой системе. Необходимым и достаточным
условием существования нетривиального решения у однородной системы линейных уравнений с квадратной матрицей ((:algebra2:linearsystems#система_однородных_уравнений является)) равенство нулю определителя этой матрицы:
$$
\det ({\mathbf A}-\lambda E)=\left|\begin{array}{cccc}
\alpha_{11} - \lambda & \alpha_{12}& \dots & \alpha_{1n} \\
\alpha_{21} & \alpha_{22}- \lambda& \dots & \alpha_{2n} \\
\dots & & & \dots \\
\alpha_{n1} & \alpha_{n2}& \dots & \alpha_{nn}- \lambda
\end{array}
\right|=0 \ .
$$
Этот определитель является полиномом степени $ n_{} $ по $ \lambda_{} $. По
((:polynomial#основная_теорема_высшей_алгебры основной теореме высшей алгебры)) этот полином имеет по крайней мере один комплексный корень $ \lambda=\lambda_{\ast} $. Подставив его в
систему, получаем однородную систему уравнений с нулевым
определителем. Находим нетривиальное решение этой системы:
$$ x_1=x_{1}^{\ast},\dots,x_n=x_{n}^{\ast}, \quad \exists x_{j}^{\ast} \ne 0 ; $$
но тогда вектор
$ {\mathfrak X}_{\ast}= x_{1}^{\ast}X_1+\cdots+x_{n}^{\ast}X_n $ будет собственным вектором оператора $ \mathcal A_{} $, принадлежащим $ \lambda_{\ast}^{} $.
♦
Уравнение $ \det ({\mathbf A}-\lambda E)= 0 $ называется **характеристическим** или **вековым уравнением**, а полином в левой его части --- **характеристическим полиномом матрицы** $ {\mathbf A} $. Любой корень характеристического полинома матрицы называется собственным числом этой матрицы. Набор всех собственных чисел матрицы (корней характеристического полинома __с учетом кратностей__) называется **спектром матрицы**. Ненулевой вектор $ X \in \mathbb C^n $, удовлетворяющий условию $ {\mathbf A} X= \lambda X $, где $ \lambda $ --- собственное число матрицы, называется собственным вектором матрицы, соответствующим (или принадлежащим) данному собственному числу.
!!П!! **Пример.** Применим полученный результат для получения альтернативного решения предыдущего примера.
**Решение.** Базисом в пространстве $ \mathbb P_3 $ выберем $ \{1,\,x,\,x^2,\, x^3\} $. Образы базисных векторов под действием оператора $ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} $:
$$
\left\{\begin{array}{lrrrr}
\mathcal A (1) =&-2& &+x^2& ,\\
\mathcal A (x) =&&-2\,x &&+x^3 ,\\
\mathcal A (x^2) =& &-x &-x^2 &+x^3, \\
\mathcal A (x^2) =& &-x & & ,
\end{array} \right. \qquad \Rightarrow \qquad {\mathbf A}=
\left(\begin{array}{rrrr}
-2 & 0 & 0 & 0 \\
0 & -2 & -1 & -1 \\
1& 0 & -1 & 0 \\
0 & 1 & 1 & 0
\end{array}
\right) \ .
$$
Характеристический полином матрицы $ {\mathbf A} $:
$$
\left|\begin{array}{cccc}
-2-\lambda & 0 & 0 & 0 \\
0 & -2-\lambda & -1 & -1 \\
1& 0 & -1-\lambda & 0 \\
0 & 1 & 1 & -\lambda
\end{array}
\right|\equiv (\lambda+2)(\lambda^3+3\,\lambda^2+3\,\lambda+1)\equiv (\lambda+2)(\lambda+1)^3 \ .
$$
Собственные числа $ \lambda_1=-2 $ и $ \lambda_2=-1 $, спектр матрицы $ \{-1,-1,-1,-2\} $. Подставляем каждое из собственных чисел в матрицу $ {\mathbf A}-\lambda E $ и решаем получившиеся системы однородных уравнений. Поскольку каждая из них должна иметь бесконечное множество решений, то мы строим ((:algebra2:linearsystems#система_однородных_уравнений фундаментальные системы решений)) (**ФСР**)
$$
\begin{array}{ccc}
& ({\mathbf A}-\lambda E)X=\mathbb O & \\
{\color{Red} \swarrow } & & {\color{Red} \searrow } \\
\lambda_1=-2 & & \lambda_2=-1 \\
\Downarrow & & \Downarrow \\
\left(\begin{array}{rrrr}
0 & 0 & 0 & 0 \\
0 & 0 & -1 & -1 \\
1& 0 & 1 & 0 \\
0 & 1 & 1 & 2
\end{array}
\right)
\left(\begin{array}{l}
x_1 \\ x_2 \\ x_3 \\ x_4
\end{array}
\right)= \mathbb O
& &
\left(\begin{array}{rrrr}
-1 & 0 & 0 & 0 \\
0 & -1 & -1 & -1 \\
1& 0 & 0 & 0 \\
0 & 1 & 1 & 1
\end{array}
\right) \left(\begin{array}{l}
x_1 \\ x_2 \\ x_3 \\ x_4
\end{array}
\right)= \mathbb O \ . \\
{\color{Red} \Downarrow } & & {\color{Red} \Downarrow } \\
x_1=1,x_2=-1,x_3=-1,x_4=1 & & \left\{\begin{array}{c}
x_1=0,x_2=-1,x_3=1,x_4=0 \\
x_1=0,x_2=-1,x_3=0,x_4=1
\end{array} \right\}
\end{array}
$$
Таким образом, собственному числу $ \lambda_1=-2 $ соответствует собственнный вектор --- полином $ 1-x-x^2+x^3 $, и он полностью совпадает с полученным при решении предыдущего примера. В то же время собственному числу $ \lambda_2=-1 $ соответствует два линейно независимых собственнных вектора --- полиномы $ -x+x^2 $ и $ -x+x^3 $. Любой (не тождественно нулевой) полином множества
$$ \{ \tau_1(-x+x^2) +\tau_2(-x+x^3) \mid \{\tau_1,\tau_2 \} \subset \mathbb R \} $$
будет также являться собственным, принадлежащим $ \lambda_2=-1 $. Это множество также совпадает с полученным при решении предыдущего примера.
♦
Итак, два формально различных подхода к решению одного и того же примера не привели к противоречию. Хотелось бы, однако, гарантировать глобальную непротиворечивость определения собственных чисел и векторов --- т.е. независимость (инвариантность) этих объектов относительно способов их нахождения, и, в частности, от выбора базиса пространства $ \mathbb V_{} $.
!!Т!! **Теорема.** //Характеристические полиномы подобных матриц одинаковы.//
**Доказательство.** $ {\mathbf A}\doteq {\mathbf B} {\color{Red} \iff } \exists $ неособенная матрица $ C_{} $,
такая что $ {\mathbf B}=C^{-1} {\mathbf A} C $. Имеем:
$$\det ({\mathbf B}-\lambda E)=\det (C^{-1} {\mathbf A} C-\lambda E)=$$
$$=
\det (C^{-1} {\mathbf A} C-\lambda C^{-1}EC)=\det \left[ C^{-1} ({\mathbf A} -\lambda
E)C \right] = \det ({\mathbf A}-\lambda E) \ .$$
♦
Иначе говоря, для оператора $ \mathcal A_{} $ характеристический полином его матрицы не
зависит от выбора базиса пространства. Поэтому можно говорить о **характеристическом полиноме оператора** $ \mathcal A_{} $.
''Характеристический полином матрицы подробнее исследуется''
☞
((:algebra2:charpoly ЗДЕСЬ)). В частности, в указанном разделе приведен ((:algebra2:charpoly#теорема_гамильтона-кэли результат)), на основании которого (а также на основании пунктов **а)** и **д)** теоремы 7, приведенной в пункте
☞
((#матрица_оператора МАТРИЦА ОПЕРАТОРА)) ) выводится следующее нетривиальное утверждение:
!!Т!! **Теорема [Гамильтон, Кэли].** //Результатом подстановки оператора в собственный характеристический полином будет нулевой оператор.//
!!П!! **Пример.** Для рассмотренного в предыдущих примерах оператора
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$
действующего в $ \mathbb P_3 $,
характеристический полином равен
$$ \lambda^4+5\,\lambda^3+9\,\lambda^2+7\,\lambda+2 \, .$$
Проверим утверждение теоремы Гамильтона-Кэли --- должно быть выполнено условие
$$ \mathcal A^4+5\,\mathcal A^3+9\,\mathcal A^2+7\,\mathcal A +2\, \mathcal E = \mathcal O \ . $$
Степени данного оператора $ \mathcal A_{} $ обсуждались в примере
☞
((#основные_определения ПУНКТА)). Переписанное в терминах остатков, последнее условие превращается в
$$ (x^2-2)^4f(x)+5\,(x^2-2)^3f(x)+9\,(x^2-2)^2f(x)+7\,(x^2-2)f(x) + $$
$$+2\,f(x) \equiv 0 \pmod{x^4-x^3-x^2+x} \ , $$
т.е. полином, стоящий в левой части сравнения, должен делиться нацело на $ x^4-x^3-x^2+x $ __при любом__ выборе полинома $ f_{}(x) $. Проверяем:
$$ (x^2-2)^4+5\,(x^2-2)^3+9\,(x^2-2)^2+7\,(x^2-2)+2 \equiv $$
$$\equiv x^8-3\,x^6+3\,x^4-x^2 \equiv (x^4+x^3-x^2-x)(x^4-x^3-x^2+x) \ , $$
т.е. утверждение оказывается справедливым.
♦
===Диагонализуемость матрицы оператора==
!!Т!! **Теорема 1.** //Собственные векторы оператора, принадлежащие различным собственным числам, линейно независимы.//
**Доказательство**
☞
((:mapping:operator:eigenLI ЗДЕСЬ)).
!!Т!! **Теорема 2.** //Если оператор имеет// $ n=\dim \mathbb V $ //линейно независимых собственных векторов, то в базисе ими образуемом матрица оператора диагональна. Обратно: если матрица оператора в некотором базисе диагональна, то каждый вектор этого базиса является собственным для оператора.//
Базис линейного пространства, состоящий из собственных векторов оператора $ \mathcal A_{} $, называется **каноническим**.
!!=>!! **[Матричная версия теоремы].** Пусть $ A_{} $ --- квадратная матрица. Неособенная матрица
$ C_{} $, удовлетворяющая равенству
$$C^{-1} A C= A_{diag} \quad \mbox{ при матрице } A_{diag} \quad \mbox{ - диагональной} $$
существует тогда и только тогда, когда существует базис пространства $ \mathbb C^{n}_{} $,
состоящий из собственных векторов матрицы $ A_{} $. Тогда матрица $ C_{} $ является матрицей перехода от
стандартного базиса
$$ \bigg\{{\mathfrak e}_j = \big[\underbrace{0,\dots,0,1}_{j},0,\dots,0\big]^{\top} \bigg\}_{j=1}^n $$
к каноническому, а на диагонали $ A_{diag} $ стоят собственные числа матрицы $ A_{} $:
$$
A_{diag}=
\left(
\begin{array}{cccc}
\lambda_1 & 0 & \dots & 0 \\
0 & \lambda_2 & \dots & 0 \\
\vdots & & \ddots & \vdots \\
0 & 0 & \dots & \lambda_n
\end{array}
\right) \ .
$$
**Доказательство.** Проведем формальное доказательство данного конкретного частного случая. Рассмотрим матричное равенство
$$ A C= CA_{diag} $$
при некоторой диагональной матрице $ A_{diag} $.
Легко видеть, что оно эквивалентно системе равенств относительно столбцов матрицы $ C_{} $:
$$
AC_{[1]}=d_1 C_{[1]},\dots, AC_{[n]}=d_n C_{[n]} \, .
$$
Если все столбцы $ \{ C_{[j]} \}_{j=1}^n $ ненулевые, то тогда они являются собственными векторами для матрицы $ A_{} $, а числа $ \{ d_{[j]} \}_{j=1}^n $ --- собственными числами, соответствующими этим собственным векторам. Если матрица $ C_{} $ невырождена, то все ее столбцы линейно независимы. Но тогда они образуют базис пространства $ \mathbb C^n $, состоящий из собственных векторов. Обратное тоже верно.
♦
При выполнении условия предыдущего следствия говорят, что матрица $ A_{} $ **диагонализуема** или **приводится к диагональной форме**[[non-derogatory matrix]].
Теорема позволяет сформулировать достаточное условие диагонализуемости.
!!Т!! **Теорема 3.** //Если характеристический полином оператора не имеет ((:polynomial#основная_теорема_высшей_алгебры кратных корней)), то матрица оператора диагонализуема.//
Для проверки условия теоремы не требуется явного вычисления корней: оно проверяется по коэффициентам характеристического полинома "чисто алгебраически" (т.е. за конечное число элементарных алгебраических операций). Оно эквивалентно отличию от нуля ((:dets:discrim дискриминанта)) характеристического полинома.
Это условие не является необходимым, как показывает пример ((:mapping:operator#основные_определения тождественного оператора)).
Случай существования кратного корня у характеристического полинома является
"пограничным": существуют примеры как диагонализуемых, так и недиагонализуемых матриц. Так, для матриц
$$ A= \left( \begin{array}{rr}
0 &1 \\
-1 &2
\end{array}
\right) \quad \mbox{ или } \quad
A= \left( \begin{array}{cc}
1 &0 \\
1&1
\end{array}
\right)
$$
при попытке подобрать матрицу $ C_{} $, удовлетворяющую равенству
$$AC=C \left( \begin{array}{cc}
\alpha_1 &0 \\
0 & \alpha_2
\end{array}
\right) \qquad npu \ \forall \{\alpha_1 , \alpha_2 \} \subset \mathbb C
$$
получим: $ \det C=0 $.
В случае наличия у характеристического полинома оператора кратного корня, анализ оператора на возможность диагонализуемости его матрицы усложняется.
!!Т!! **Теорема 4.** //Множество собственных векторов оператора, принадлежащих его собственному числу// $ \lambda_{\ast}^{} $ //, дополненное нулевым вектором, образует линейное подпространство пространства// $ \mathbb V_{} $.
Это подпространство
$$ \mathbb V_{\ast} = \mathcal{K}er (\mathcal A- \lambda_{\ast} \mathcal E) $$
пространства $ \mathbb V_{} $ называется **собственным подпространством оператора, соответствующим** $ \lambda_{\ast}^{} $.
Величина
$$ \dim (\mathcal{K}er (\mathcal A- \lambda_{\ast} \mathcal E)) $$
называется **геометрической кратностью собственного числа** $ \lambda_{\ast}^{} $.
Можно доказать, что геометрическая кратность собственного числа не превосходит ((:polynomial#основная_теорема_высшей_алгебры кратности)) собственного числа в характеристическом полиноме. Для акцентирования различий в определениях двух кратностей, кратность собственного числа в характеристическом полиноме называют еще **алгебраической кратностью собственного числа**.
Если оператор (в некотором базисе пространства) задан своей матрицей $ \mathbf A^{} $, то базисные векторы собственного подпространства $ \mathbb V_{\ast} $ вычисляются посредством нахождения фундаментальной системы решений (**ФСР**) системы линейных уравнений
$$ (\mathbf A- \lambda_{\ast} E) X=\mathbb O \ . $$
!!Т!! **Теорема 5.** //Матрица оператора диагонализуема тогда и только тогда,
когда для каждого ее собственного числа алгебраическая кратность равна геометрической кратности://
$$
\operatorname{dfc} ({\mathbf A}-\lambda_{\ast}\, E)= \mbox{ кратность } \ \lambda_{\ast} .
$$
!!?!! Диагонализуема ли матрица оператора
$$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$
рассмотренного в примерах предыдущего пункта?
!!П!! **Пример.** Найти все вещественные значения параметра $ {\color{Red}{ \alpha} } $, при которых матрица
$$
\left( \begin{array}{rcc}
1 &2\, {\color{Red}{ \alpha} } & {\color{Red}{ \alpha} } -2 \\
-1 &2 &1 \\
2 & 0 & -3
\end{array}
\right)
$$
диагонализуема.
**Решение.** Характеристический полином
$ f(\lambda)=-\lambda^3+3\, \lambda-2\,(3\, {\color{Red}{ \alpha} } -1) $
имеет кратные корни только тогда когда его дискриминант $ \mathcal D(f)=-324\, {\color{Red}{ \alpha} }
(3\, {\color{Red}{ \alpha} } -2) $ обращается в нуль. При $ {\color{Red}{ \alpha} } =0 $ корень $ \lambda=-1 $
имеет алгебраическую кратность $ 2_{} $. Найдем дефект матрицы $ A+E $:
$$\left( \begin{array}{rrr}
2 &0 & -2 \\
-1 &3 &1 \\
2 & 0 & -2
\end{array}
\right) \ \longrightarrow \
\left( \begin{array}{rrr}
1 &0 & -1 \\
0 &3 &0 \\
0 & 0 & 0
\end{array}
\right) \ {\color{Red} \Longrightarrow } \ \operatorname{rank} (A+E) =2 \Longrightarrow \operatorname{dfc} (A+E)=1 .
$$
Таким образом, геометрическая кратность собственного числа $ \lambda=-1 $ равна $ 1_{} $ и
условие теоремы $ 5 $ не выполнено. Оно не будет выполнено
и при $ {\color{Red}{ \alpha} } = 2/3 $ (здесь корень $ \lambda=1 $ имеет кратность $ 2_{} $).
**Ответ.** Матрица диагонализуема при всех значениях параметра, за исключением $ {\color{Red}{ \alpha} } = 0 $ и $ {\color{Red}{ \alpha} } = 2/3 $.
==== Диагонализуемость матрицы оператора над полем вещественных чисел==
В предыдущем пункте мы рассматривали операторы, не всегда акцентируя внимания на поле, над которым они были определены --- над $ \mathbb R_{} $ или над $ \mathbb C_{} $. Сама ((:mapping:operator#собственное_число_и_собственный_вектор теорема существования собственного числа)) гарантирует нам только лишь наличие этих чисел в поле $ \mathbb C_{} $. Как следствие, даже если рассматриваются операторы над полем $ \mathbb R_{} $ (что чаще всего и случается на практике), то существование для них __вещественного__ канонического базиса вовсе не гарантировано.
**Задача.** Найти условия диагонализуемости матрицы оператора $ \mathcal A $ над полем вещественных чисел.
Необходимое условие следует из теоремы $ 2 $ предыдущего пункта: все собственные числа
матрицы должны быть вещественными.
Теорема $ 3 $ позволяет сформулировать и достаточный критерий диагонализуемости матрицы оператора $ \mathcal A $ над $ \mathbb R_{} $.
!!Т!! **Теорема.** //Если характеристический полином оператора имеет только простые вещественные корни, то матрица оператора диагонализуема над// $ \mathbb R_{} $.
Условие различности и вещественности корней произвольного полинома $ f(\lambda)=\lambda^n+a_1\lambda^{n-1}+\dots+ a_n \in \mathbb R[x] $
можно проверить по коэффициентам этого полинома "чисто алгебраически", т.е. за конечное число элементарных алгебраических операций над этими коэффициентами. Воспользуемся, например,
теоремой Якоби из раздела
☞
((:polynomial:zero_local#ганкелевы_матрицы_в_теории_локализации_корней ЛОКАЛИЗАЦИЯ КОРНЕЙ ПОЛИНОМА)). По коэффициентам $ a_1,\dots,a_n $ можно определить ((:polynomial:zero_local#ганкелевы_матрицы_в_теории_локализации_корней сумму Ньютона полинома))
$ f(\lambda) $, т.е. величину
$$
s_k=\sum_{1\le j \le n} \lambda_j^k \ .
$$
Далее, после нахождения всех этих сумм для значений $ k \in \{0,\dots,2n-2\} $, из них составляется ганкелева матрица
$$
S=\left[ s_{j+k} \right]_{j,k=0}^{n-1}
$$
и вычисляются ее ((:algebra2:dets#теорема_лапласа главные миноры)) $ S_1,\dots, S_{n} $.
Для различности всех корней полинома необходимо и достаточно выполнение условия $ S_n \ne 0 $ (этот минор совпадает с ((:dets:discrim#представление_дискриминанта_посредством_ганкелевой_матрицы дискриминантом)) $ \mathcal D(f) $ полинома $ f(\lambda) $); для различности и вещественности всех корней необходимо и достаточно, чтобы были выполнены неравенства
$$
S_1\ge 0,\dots,S_{n-1} \ge 0,S_n > 0 \ .
$$
!!П!! **Пример.** Найти все вещественные значения параметра $ {\color{Red}{ \alpha} } $, при которых матрица
$$
\left( \begin{array}{rcc}
1 &2\, {\color{Red}{ \alpha} } & {\color{Red}{ \alpha} } -2 \\
-1 &2 &1 \\
2 & 0 & -3
\end{array}
\right)
$$
диагонализуема над $ \mathbb R_{} $.
**Решение.** На основании теоремы нам нужно установить условия вещественности корней характеристического полинома $ f(\lambda)=-\lambda^3+3\, \lambda-2\,(3\, {\color{Red}{ \alpha} } -1) $.
Вычисляем суммы Ньютона:
$ s_0=3,\ s_1= 0, \ s_2=6, \ s_3=18\, {\color{Red}{ \alpha} } -6, \ s_4=18 $, составляем матрицу:
$$ S=\left(\begin{array}{ccc}
3 & 0 & 6 \\
0 & 6 & 18\, {\color{Red}{ \alpha} } -6 \\
6 & 18\, {\color{Red}{ \alpha} } -6 & 18
\end{array}
\right)
$$
и вычисляем ее главные миноры:
$$S_1=3,\ S_2=18, \ S_3=-324\, {\color{Red}{ \alpha} } \, (3\, {\color{Red}{ \alpha} } -2)=\mathcal D(f) \ . $$
При $ {\color{Red}{ \alpha} } \ne 0 $ и $ {\color{Red}{ \alpha} } \ne 2/3 $ все собственные числа различны,
условие теоремы выполняется при $ {\color{Red}{ \alpha} } \in ]0,\, 2/3[ $. Граничные
точки последнего интервала следовало бы исследовать отдельно: хотя этим
значениям параметра и соответствует случай кратных вещественных корней
характеристического полинома, но матрица $ A_{} $ может оказаться диагонализуемой на
основании теоремы 5 предыдущего пункта. Но при решении примера в предыдущем пункте мы уже установили, что это условие не выполняется.
**Ответ.** Матрица диагонализуема над $ \mathbb R_{} $ при $ {\color{Red}{ \alpha} } \in ]0,\, 2/3[ $.
Примером гарантировано диагонализуемых над $ \mathbb R_{} $ матриц являются вещественные симметричные матрицы. См.
☞
((:algebra2:symmetric#диагонализуемость ЗДЕСЬ)).
=== Жорданова нормальная форма==
Если матрица оператора оказывается недиагонализуемой над $ \mathbb C_{} $, то к какому простейшему виду ее можно привести
?
--- Этим видом является, например,
☞
((:mapping:operator:jordan ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА)).
==Задачи==
☞
((:mapping:operator:problems ЗДЕСЬ)).
==Источники==
[1]. **Гантмахер Ф.Р.** //Теория матриц.// 4-е изд. М.Наука. 1988.
[2]. **Фаддеев Д.К., Фаддеева В.Н.** //Вычислительные методы линейной алгебры.// М.ГИФМЛ.1960
[3]. **Хорн Р.**, **Джонсон Ч.** //Матричный анализ//. М.Мир.1989
[4]. **Мишина А.П., Проскуряков И.В.** //Высшая алгебра.// М.Наука. 1965