Для понимания материалов настоящего раздела крайне желательно ознакомиться с разделом ((:mapping ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ)) ==Линейный оператор== ~~TOC~~ ((:mapping Линейное отображение)) линейного (векторного) пространства $ \mathbb V_{} $ в себя $$ \mathcal A : \mathbb V \longmapsto \mathbb V $$ называется **линейным преобразованием** $ \mathbb V_{} $ или **линейным оператором**[[operator (//лат.//) --- работник, производитель, творец.]] на $ \mathbb V_{} $. В дальнейшем под выражением //оператор// понимается исключительно линейный оператор (и линейное пространство $ \mathbb V_{} $ предполагается конечномерным!). Напомню свойство линейности: $$ \mathcal A (X_1 +X_2)= \mathcal A(X_1) + \mathcal A(X_2),\quad \mathcal A (\alpha_1 X_1)= \alpha_1 \mathcal A (X_1), $$ или, в эквивалентном виде: $$ \mathcal A(\alpha_1 X_1 + \alpha_2 X_2)= \alpha_1 \mathcal A(X_1) + \alpha_2 \mathcal A(X_2) $$ для $ \forall \ \{X_1,X_2\} \subset \mathbb V,\ \forall \ \{\alpha_1,\alpha_2 \} \subset \mathbb R \ \mbox{ или } \ \mathbb C $ (здесь $ \alpha_1,\alpha_ 2 $ --- константы из $ \mathbb R_{} $ если $ \mathbb V_{} $ вещественное пространство, и из $ \mathbb C_{} $, если оно комплексное). ===Примеры линейных операторов== Бóльшую часть примеров пункта ((:mapping#примеры_линейных_отображений ПРИМЕРЫ ЛИНЕЙНЫХ ОТОБРАЖЕНИЙ)) представляют именно линейные операторы. Укажу еще несколько, к которым буду часто обращаться. !!П!! **Пример 1.** В пространстве $ \mathbb R^{3} $ рассмотрим следующие действия над вектором[[Напомню, что векторы пространства считаются заданными только координатами своего конца, а начало считается "привязанным" к $ \mathbb O $.]] $ (x_{},y,z) $: * поворот вокруг прямой $ x=y=2\,z $ на угол $ \pi/3 $; * зеркальное отражение относительно плоскости $ 3\,x-y+z = 0 $; * растяжение в $ 3.14 $ раза. Все это --- примеры линейных операторов. Но вот отображение сдвига $ (x,y,z) \mapsto (x+1,y,z+2) $ оператором не является поскольку $$ {\color{RubineRed} \alpha } (x,y,z) = ( {\color{RubineRed} \alpha } x, {\color{RubineRed} \alpha } y, {\color{RubineRed} \alpha } z) \mapsto ( {\color{RubineRed} \alpha } x+1, {\color{RubineRed} \alpha } y, {\color{RubineRed} \alpha } z+2) \ne {\color{RubineRed} \alpha } (x+1,y,z+2) \ . $$ !!П!! **Пример 2.** В пространстве $ \mathbb R^{3} $ отображение ортогонального проецирования на плоскость $ x+y-7\, z=0 $ будет линейным оператором (а вот на плоскость $ x+y-7\, z=1 $ --- не будет!). Вообще, в произвольном пространстве $ \mathbb V_{} $ разбитом в ((:linear_space#прямая_сумма_линейных_подространств прямую сумму)) нетривиальных подпространств $ \mathbb V= \mathbb V_1 \oplus \mathbb V_2 $ отображение, сопоставляющее вектору $ X_{} $ его проекцию на подпространство $ \mathbb V_1 $ параллельно подпространству $ \mathbb V_2 $, будет оператором. !!П!! **Пример 3.** В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степеней $ \le 3 $ отображение $ \mathcal A_{} $ действует по правилу $$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ т.е. полином $ f_{}(x) $ отображается в ((:polynomial#делимость_полиномов остаток от деления)) произведения $ f(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Это отображение будет оператором в $ \mathbb P_3 $. Действительно, если $$ \begin{array}{l} f_1(x)(x^2-2) \equiv q_1(x)(x^4-x^3-x^2+x)+ r_1(x)\, , \\ f_2(x)(x^2-2) \equiv q_2(x)(x^4-x^3-x^2+x)+ r_2(x) , \end{array} $$ при $ \{q_1(x),q_2(x),r_1(x),r_2(x)\} \subset \mathbb R[x], \deg r_1(x) \le 3, \deg r_2(x) \le 3 $, то $$ (\alpha_1 f_1(x)+\alpha_2 f_2(x)) (x^2-2) \equiv (\alpha_1 q_1(x)+\alpha_2 q_2(x))(x^4-x^3-x^2+x)+ (\alpha_1 r_1(x)+\alpha_2 r_2(x)) ; $$ очевидно, что $ \deg (\alpha_1 r_1(x)+\alpha_2 r_2(x)) \le 3 $. !!П!! **Пример 4.** Задачу ((:interpolation интерполяции)) можно интерпретировать как построение некоторого отображения. В интерполяционной таблице $$ \begin{array}{c|ccccc} x & x_1 & x_2 & \dots & x_n \\ \hline y & y_1 & y_2 &\dots & y_n \end{array} \qquad npu \qquad \{ x_{1}, \dots, x_{n}, y_{1},\dots,y_{n} \} \subset \mathbb C $$ будем считать узлы $ \{ x_j\}_{j=1}^n $ фиксированными, а значения $ \{ y_j\}_{j=1}^n $ --- переменными. Эта таблица однозначно определяет интерполяционный полином $ f(x)=A_{0}+A_1x+\dots+A_{n-1}x^{n-1} $ со свойством $ f(x_j)=y_j $ при $ j \in \{1,\dots,n\} $. При этом $ \{A_{j} \}_{j=0}^{n-1} \subset \mathbb C $. Будет ли получившееся отображение $$ (y_1,\dots,y_n) \mapsto (A_0,A_1,\dots,A_{n-1}) $$ оператором на $ \mathbb C^n $? Покажем, что отображение $$ \mathcal A(y_1,\dots,y_n) = f(x) \in \mathbb C[x] $$ является линейным отображением. Действительно, решением задачи интерполяции для таблицы $$ \begin{array}{c|ccccc} x & x_1 & x_2 & \dots & x_n \\ \hline y & \alpha y_1 & \alpha y_2 &\dots & \alpha y_n \end{array} \qquad npu \qquad \forall \alpha \in \mathbb C $$ является полином $ \alpha f(x) $. Если же, вдобавок, решением задачи интерполяции для таблицы $$ \begin{array}{c|ccccc} x & x_1 & x_2 & \dots & x_n \\ \hline y & z_1 & z_2 &\dots & z_n \end{array} \qquad npu \qquad \{ z_{1},\dots,z_{n} \} \subset \mathbb C $$ является полином $ g(x)\in \mathbb C[x], \deg g(x) \le n-1 $, то решением задачи интерполяции для таблицы $$ \begin{array}{c|ccccc} x & x_1 & x_2 & \dots & x_n \\ \hline y & y_1+z_1 & y_2+z_2 &\dots & y_n+z_n \end{array} \qquad $$ будет полином $ f(x)+g(x) $ и этот полином будет единственным решением среди полиномов степеней $ \le n-1 $. Таким образом, линейность отображения $ \mathcal A $ установлена. Далее, множество $ \mathbb P_{n-1} $ полиномов из $ \mathbb C[x] $ степеней $ \le n-1 $ ((:linear_space#изоморфизм изоморфно)) пространству $ \mathbb C^n $. Следовательно, "сложное" отображение $$ (y_1,\dots,y_n) \mapsto f(x)=A_{0}+A_1x+\dots+A_{n-1}x^{n-1} \mapsto (A_0,A_1,\dots,A_{n-1}) $$ является линейным отображением из $ \mathbb C^n $ в $ \mathbb C^n $, т.е. оператором на $ \mathbb C^n $. По аналогии с задачей алгебраической интерполяции, можно поставить и задачу ((:interpolation#тригонометрическая_интерполяция тригонометрической интерполяции)). Имеем здесь "точку входа" в теорию ((:interpolation:dft дискретного преобразования Фурье)). Этот пример можно "развернуть": ((#основные_определения НИЖЕ)) будет показано, что произвольный оператор, действующий в пространстве размерности $ n_{} $ полностью определяется своими значениями в $ n_{} $ точках пространства. Важное отличие от традиционной, числовой интерполяции: условие __различности__ этих точек не является достаточным для однозначного определения оператора ! !!?!! В пространстве $ \mathbb P_2 $ оператор действует следующим образом: $$ \mathcal A (x^2+x+1) =2\,x+1,\ \mathcal A (x^2-x-1) =2\,x^2-1,\ \mathcal A (x+1) =-x^2+x+1 \ . $$ Вычислить $ \mathcal A (x^2) $ и $ \mathcal A (x^2+1) $. !!П!! **Пример 5.** В пространстве полиномов степени не выше $ n_{} $ с вещественными коэффициентами от $ m_{} $ переменных $ x_1,x_2,\dots,x_{m} $ отображение $$ f(x_1,x_2,\dots,x_m) \mapsto \frac{\partial^2 f}{\partial x_1^2} +\frac{\partial^2 f}{\partial x_2^2}+ \dots+ \frac{\partial^2 f}{\partial x_m^2} $$ яыляется линейным оператором. Этот оператор известен как **оператор Лапласа** и для него используется символьное обозначение $$ \Delta = \frac{\partial^2 }{\partial x_1^2} +\frac{\partial^2 }{\partial x_2^2}+ \dots+ \frac{\partial^2 }{\partial x_m^2} \, . $$ !!П!! **Пример 6.** В линейном пространстве квадратных матриц порядка $ n_{} $ с вещественными элементами рассмотрим **коммутирующее отображение** $$ \mathcal K (X) = AX-XA \ , $$ а также **отображение Ляпунова** $$ \mathcal V (X) = A^{\top}X+XA $$ при произвольной фиксированной квадратной матрице $ A_{} $ и $ {}^{\top} $ означающем ((:algebra2#транспонирование транспонирование)). Легко проверить, что оба отображения $ \mathcal K $ и $ \mathcal V $ являются операторами. ===Основные определения== Все введенные для линейного отображения понятия переносятся на этот частный случай. Например, **ядром оператора** называется множество векторов, отображаемых оператором в нулевой вектор: $$\mathcal{K}er (\mathcal A)= \left\{X\in \mathbb V \big| \mathcal A(X)=\mathbb O \right\} \ ; $$ а **образом оператора** называется множество всех векторов из $ \mathbb V_{} $, для каждого из которых существует прообраз в том же пространстве: $$\mathcal{I}m (\mathcal A)= \left\{Y\in \mathbb V \mid \exists X \in \mathbb V, \ \mathcal A(X)= Y \right\} \ .$$ !!Т!! **Теорема 1**. //Множества// $ \mathcal{K}er (\mathcal A) $ //и// $ \mathcal{I}m (\mathcal A) $ //являются ((:linear_space#определения подпространствами)) пространства// $ \mathbb V_{} $. !!?!! Доказать, что для оператора в $ \mathbb R^4 $ $$ \mathcal A \left(\begin{array}{c} x_1 \\ x_2 \\ x_3 \\ x_4 \end{array} \right)= \left(\begin{array}{c} x_3 \\ x_4 \\ 0 \\ 0 \end{array} \right) $$ имеет место равенство $ \mathcal{K}er (\mathcal A) = \mathcal{I}m (\mathcal A) $. ---- Для оператора $ \mathcal A_{} $ его **дефектом** его называется размерность ядра, а его **рангом** --- размерность образа: $$ \operatorname{dfc}(\mathcal A )=\dim (\mathcal{K}er (\mathcal A )) , \ \operatorname{rank}(\mathcal A )= \dim (\mathcal{I}m (\mathcal A )) \ . $$ Оператор называется **невырожденным** если $ \operatorname{dfc}(\mathcal A )=0 $. ---- !!П!! **Пример.** В пространстве $ \mathbb R^{3} $ оператор проецирования на плоскость: $$ \mathcal A \left(x, y, z\right) \longmapsto \left(x, y, 0 \right) $$ является вырожденным поскольку его ядро нетривиально: $ \mathcal{K}er (\mathcal A)=\{(0,0,z) | z \in \mathbb R \} $. Следующий результат является следствием теоремы $ 4 $ из ((:mapping#ядро_и_образ_линейного_отображения ПУНКТА)). !!Т!! **Теорема 2.** //Имеет место равенство//: $$ \dim \mathbb V=\dim \left( \mathcal{K}er (\mathcal A) \right) + \dim \left( \mathcal{I}m (\mathcal A) \right) = \operatorname{dfc}(\mathcal A )+ \operatorname{rank}(\mathcal A ) \ .$$ В чем смысл свойства вырожденности оператора? --- В том, что такой оператор "схлопывает" пространство, в котором действует: $ \dim \left( \mathcal{I}m (\mathcal A) \right) < \dim \mathbb V $. Происходит уменьшение размерности подобное тому, что описано в предыдущем примере: трехмерное пространство прообразов оператором проецирования отображается в двухмерное пространство всевозможных образов. Отображение $ \mathcal P:\ \mathbb V \longmapsto \mathbb V $ называется **произведением** оператора $ \mathcal A $ на оператор $ \mathcal B $ если $ \mathcal P(X)=\mathcal A (\mathcal B(X)) $ для любого $ X\in \mathbb V_{} $. Записывать этот факт будем в виде $ \mathcal P=\mathcal A \, \mathcal B $. Фактически, произведение операторов --- частный случай понятия сложной функции. !!Т!! **Теорема 3.** //Произведение операторов является оператором на// $ \mathbb V_{} $. //Операция произведения ассоциативна.// **Доказательство.** Имеем на основании свойства линейности $$\mathcal P (\alpha_1X_1+\alpha_2X_2)= \mathcal A (\mathcal B(\alpha_1X_1+\alpha_2X_2))=\mathcal A (\alpha_1\mathcal B(X_1)+ \alpha_2\mathcal B(X_2))=$$ $$=\alpha_1\mathcal A (\mathcal B(X_1))+ \alpha_2\mathcal A (\mathcal B(X_2))=\alpha_1\mathcal P(X_1)+\alpha_2{\mathcal P}(X_2).$$ Далее, для любого вектора $ X_{} $: $$\mathcal A_1(\mathcal A_2\mathcal A_3(X))= \mathcal A_1(\mathcal A_2(\mathcal A_3(X)))=\mathcal A_1\mathcal A_2({\mathcal A}_3(X)) \ ,$$ откуда и следует ассоциативность. ---- Говорят, что операторы $ \mathcal A $ и $ \mathcal B $ ** коммутируют** если $ \mathcal A \, \mathcal B = \mathcal B \, \mathcal A $. ---- !!П!! **Пример.** В плоскости $ \mathbb R^2 $ операторы поворота точек вокруг начала координат на углы $ \varphi $ $$ (x,y) \mapsto (x \cos \varphi -y \sin \varphi, \ x \sin \varphi + y \cos \varphi) $$ и $ \psi $ $$ (x,y) \mapsto (x \cos \psi - y \sin \psi, \ x \sin \psi + y \cos \psi) $$ против часовой стрелки коммутируют. Результатом их произведения является оператор $$ (x,y) \mapsto \left(x \cos (\varphi+\psi) -y \sin (\varphi+\psi), \ x \sin (\varphi+\psi) + y \cos (\varphi+\psi) \right) $$ поворота на угол $\varphi+\psi $. Напротив, в пространстве $ \mathbb R^3 $ оператор поворота точек вокруг оси $ Oz $ на угол $ \pi/2 $ не коммутирует с оператором поворота точек вокруг оси $ Ox $ на угол $ \pi/2 $. !!П!! **Пример.** В пространстве полиномов $ \mathbb P_{n} $ рассмотрим дифференциальный оператор $$\mathcal A = x\frac{d}{d\, x}\times \Box - 1\times \Box \ : \ \mathcal A(p(x)) = x p'(x) - p(x) \ .$$ Этот оператор не коммутирует с обычным оператором дифференцирования $ \displaystyle \mathcal B= \frac{d}{d\, x} $: $$\mathcal A (x^2)=x^2, \quad \mathcal B (\mathcal A(x^2))=2\,x, \quad \mathcal B (x^2)=2\,x, \quad \mathcal A (\mathcal B (x^2))=0 \ .$$ ---- Оператор $ \mathcal E $, отображающий произвольный вектор $ X\in \mathbb V_{} $ в себя : $ \mathcal E(X)= X $, называется **тождественным** на $ \mathbb V_{} $. Оператор $ \mathcal B $ называется (**левым**) **обратным оператору** $ \mathcal A_{} $, если $ \mathcal B\mathcal A=\mathcal E $. В этом случае оператор $ \mathcal A_{} $ называют **обратимым** и записывают: $ \mathcal B=\mathcal A^{-1} $. ---- Не всякий оператор обратим. !!П!! **Пример.** В пространстве $ \mathbb R^{3} $ для оператора проецирования на плоскость: $$ \mathcal A \left(x, y, z\right) \longmapsto \left(x, y, 0 \right) $$ обратного не существует, т.к. $ \mathcal A(0,0,1)=(0,0,0) $ и ни при каком выборе оператора $ \mathcal B $ нельзя добиться выполнения равенства $ \mathcal B(0,0,0)=(0,0,1) $. !!?!! Показать, что обратным для оператора $$\frac{1}{x}\int_0^x \ : p(x) \longmapsto \frac{1}{x}\int_{0}^{x} p(t) d\, t \ ,$$ на $ \mathbb P_{n} $ является оператор $$ \frac{d}{d\,x}\left(x\times \Box \right) \ : p(x) \longmapsto (xp(x))' \ .$$ !!Т!! **Теорема 4.** //Оператор// $ \mathcal A_{} $ //обратим тогда и только тогда, когда когда он невырожден//: $ \operatorname{dfc} (\mathcal A) =0 $. //В этом случае// $ \mathcal A^{-1} $ //единствен и коммутирует с// $ \mathcal A $. Из теоремы следует, что левый обратный оператор к оператору $ \mathcal A_{} $ --- если он существует --- совпадает с правым обратным оператором. Это утверждение не будет справедливым для бесконечномерных пространств. См. задачу 7 ((:mapping:operator:problems ЗДЕСЬ)). При $ K\in \mathbb N $ и $ K>1 $, $ K_{} $-я степень оператора $ \mathcal A $ определяется рекурсивной формулой $$\mathcal A^{\, K}=\mathcal A (\mathcal A^{\, K-1})\ .$$ Если, вдобавок, $ \mathcal A $ невырожден, то отрицательная степень оператора определяется формулой $$\mathcal A^{-K}=\left(\mathcal A^{-1}\right)^K \ . $$ Полагают также $ \mathcal A^{\, 0}= {\mathcal E} $ для любого $ \mathcal A \ne {\mathcal O} $. !!Т!! **Теорема 5.** //Степени оператора// $ \mathcal A $ //коммутируют:// $$\mathcal A^{\, K} \mathcal A^{\, L}=\mathcal A^{\, L}\mathcal A^{\, K}=\mathcal A^{\, K+L} \ .$$ !!П!! **Пример.** $ K_{} $-й степенью оператора дифференцирования в пространстве полиномов $ \mathbb P_{n} $ будет оператор нахождения $ K_{} $-й производной: $$\left( \frac{d}{d\,x} \right)^K = \frac{d^K}{d\,x^K} \ .$$ Очевидно, что при $ K_{}>n $ этот оператор будет нулевым. !!П!! **Пример.** В произвольном пространстве $ \mathbb V_{} $ разбитом в ((:linear_space#прямая_сумма_линейных_подространств прямую сумму)) нетривиальных подпространств $ \mathbb V= \mathbb V_1 \oplus \mathbb V_2 $ оператор проецирования $ \mathcal P $ на подпространство $ \mathbb V_1 $ параллельно подпространству $ \mathbb V_2 $ обладает свойством $ \mathcal P^2 = \mathcal P $ (проецирование проекции оставляет ее на месте). ---- Оператор $ \mathcal A $, обладающий свойством $ \mathcal A^2 = \mathcal A $, называется **идемпотентным**[[idem (//лат.//) тот же, такой же; potentia (//лат.//) сила, политическая власть.]]. ---- !!П!! **Пример.** В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степени $ \le 3 $ отображение $ \mathcal A_{} $ действует по правилу $$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ т.е. полином $ f_{}(x) $ отображается в ((:polynomial#делимость_полиномов остаток от деления)) произведения $ f(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Для этого оператора $ K_{} $-й его степенью является оператор $$ \mathcal B (f(x)) = f(x) (x^2-2)^K \pmod{x^4-x^3-x^2+x} \ . $$ Действительно, если $$ f(x)(x^2-2) \equiv q(x)(x^4-x^3-x^2+x)+ r(x) $$ при $ \{q(x),r(x)\} \subset \mathbb R[x] $ и $ \deg r(x) \le 3 $, то $$ f(x)(x^2-2)^2 \equiv q(x)(x^4-x^3-x^2+x)(x^2-2)+ r(x)(x^2-2) \ . $$ Но тогда $$ \mathcal A^2 (f(x))= \mathcal A (r(x)) = r(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \equiv $$ $$ \equiv f(x)(x^2-2)^2 \pmod{x^4-x^3-x^2+x} \ . $$ Завершает доказательство //((:basics:induction святая индукция))// по степени $ K_{} $... Пусть задан произвольный полином $ g(x)=b_{0}x^m+b_1x^{m-1}+\dots+b_m $ из $ \mathbb R[x] $ или $ \mathbb C[x] $. Выражение $$g(\mathcal A )= b_0\mathcal A^{m}+b_1\mathcal A^{m-1}+\dots+b_m{\mathcal E}$$ будем называть **операторным полиномом**. !!?!! Доказать, что операторные полиномы коммутируют: $ g_1(\mathcal A )g_2(\mathcal A )=g_2(\mathcal A )g_1(\mathcal A ) $. !!?!! Доказать, что для любого $ \mathcal A \in {\mathcal H}om(\mathbb V,\mathbb V) $ всегда найдется полином $ g_{}(x) $, $ \deg g \le n^2+1 $ такой, что $ g(\mathcal A)={\mathcal O} $. Сформулируем еще один результат, являющийся частным случаем приведенного в пункте ((:mapping#свойства_линейных_отображений СВОЙСТВА ЛИНЕЙНЫХ ОТОБРАЖЕНИЙ)). !!Т!! **Теорема 6.** //Пусть// $ \{X_1,X_2,\dots,X_n\} $ --- //произвольный базис// $ \mathbb V_{} $, //а// $ Y_1,Y_2,\dots,Y_n $ --- //произвольные векторы того же пространства. Существует единственный оператор// $ \mathcal A: \mathbb V \longmapsto \mathbb V $ //такой, что// $$ \mathcal A(X_1)=Y_1,\mathcal A(X_2)=Y_2, \dots,\mathcal A(X_n)=Y_n \ .$$ **Доказательство.** Искомый оператор строится следующим образом. Если $ X=x_1X_1+x_2X_2+\dots+x_nX_n $ --- разложение произвольного вектора $ X \in \mathbb V $ по базису, то $$ \mathcal A(X)=x_1 Y_1+x_2Y_2+\dots+ x_nY_n \ . $$ Единственность этого оператора доказывается от противного. Любой другой оператор $ \mathcal B $, удовлетворяющий условиям $ \{\mathcal B(X_j)=Y_j\}_{j=1}^n $, будет действовать на тот же вектор $ X_{} $ с тем же результатом: $$ \mathcal B(X)=x_1 \mathcal B(X_1)+x_2\mathcal B(X_2) +\dots+ x_n\mathcal B(X_n)= x_1 Y_1+x_2Y_2+\dots+ x_nY_n= \mathcal A(X)\ . $$ Таким образом, оператор --- как функция, действующая в $ n_{} $-мерном линейном пространстве, однозначно определяется заданием на $ n_{} $ __линейно независимых__ векторах. В доказательстве теоремы дается и конструктивный способ представления оператора по этим значениям (т.е. строится его ((:interpolation "интерполяционная формула")) ). ===Матрица оператора== Рассмотрим оператор $ \mathcal A $ на $ \mathbb V_{} $ и пусть $ \{X_1,\dots,X_n\} $ --- базис $ \mathbb V_{} $. Являясь частным случаем ((:mapping#_определение линейного отображения)), оператор должен обладать и соответствующей ((:mapping#матрица_линейного_отображения матрицей)). Существенной особенностью, отличающей наш случай от рассмотренного в пункте ((:mapping#матрица_линейного_отображения МАТРИЦА ЛИНЕЙНОГО ОТОБРАЖЕНИЯ)), является невозможность //произвола// при выборе базиса для $ \mathcal{I}m (\mathcal A) $. Поскольку $ \mathcal{I}m (\mathcal A) $ является подпространством $ \mathbb V_{} $, то было бы слишком большой роскошью иметь два разных базиса для одного и того же пространства. Найдем координаты образов базисных векторов $ \mathcal A (X_1),\dots,\mathcal A (X_n) $ в том же базисе $ \{X_1,\dots,X_n\} $: $$ \left\{ \begin{array}{ccc} \mathcal A(X_1)&=&{{\color{RubineRed} \alpha }}_{11}X_1+{{\color{RubineRed} \alpha }}_{21}X_2+\dots+{{\color{RubineRed} \alpha }}_{n1}X_n, \\ \mathcal A(X_2)&=&{{\color{Green} \alpha }}_{12}X_1+{{\color{Green} \alpha }}_{22}X_2+\dots+{{\color{Green} \alpha }}_{n2}X_n, \\ \dots & & \qquad \dots , \\ \mathcal A(X_n)&=&\alpha_{1n}X_1+\alpha_{2n}X_2+\dots+\alpha_{nn}X_n. \end{array} \right. $$ Матрица $$ \mathbf A= \left(\begin{array}{cccc} {{\color{RubineRed} \alpha }}_{11} & {{\color{Green} \alpha }}_{12}& \dots & \alpha_{1n} \\ {{\color{RubineRed} \alpha }}_{21} & {{\color{Green} \alpha }}_{22}& \dots & \alpha_{2n} \\ \dots & & & \dots \\ {{\color{RubineRed} \alpha }}_{n1} & {{\color{Green} \alpha }}_{n2}& \dots & \alpha_{nn} \end{array} \right)_{n\times n}, $$ в столбцах которой стоят координаты образов базисных векторов, называется **матрицей оператора** $ \mathcal A_{} $ **в базисе** $ \{X_1,\dots,X_n\} $. !!П!! **Пример.** Известны образы базисных векторов $ \mathbb R^{3} $ под действием оператора $ \mathcal A_{} $: $$\mathcal A \left( \begin{array}{r} 5 \\ 3 \\ 1 \end{array}\right)= \left( \begin{array}{r} -2 \\ 1 \\ 0 \end{array}\right) ,\ \mathcal A \left( \begin{array}{r} 1 \\ -3 \\ -2 \end{array}\right) = \left( \begin{array}{r} -1 \\ 3 \\ 0 \end{array}\right) ,\ \mathcal A \left( \begin{array}{r} 1\\ 2 \\ 1 \end{array}\right)= \left( \begin{array}{r} -2 \\ -3 \\ 0 \end{array}\right) \ . $$ Найти матрицу этого оператора в исходном базисе. **Решение.** Элементы матрицы $ {\mathbf A} $ ищутся по формулам из определения, которые можно переписать в матричном виде: $$\left[ X_1,\dots,X_n \right] {\mathbf A}=\left[ \mathcal A (X_1),\dots,\mathcal A (X_n) \right] \ .$$ Откуда $${\mathbf A}= \left[ X_1,\dots,X_n \right]^{-1} \left[ \mathcal A (X_1),\dots,\mathcal A (X_n) \right] \ ,$$ и для нашего примера эта формула дает $$ {\mathbf A}= \left(\begin{array}{rrr} 5&1&1 \\ 3&-3&2 \\ 1&-2&1 \end{array}\right)^{-1} \left(\begin{array}{rrr} -2&-1&-2 \\ 1&3&-3 \\ 0&0&0 \end{array}\right) = $$ $$ =\left(\begin{array}{rrr} 1&-3&5\\ -1&4&-7\\ -3&11&-18 \end{array}\right) \left(\begin{array}{rrr} -2&-1&-2 \\ 1&3&-3 \\ 0&0&0 \end{array}\right) = \left(\begin{array}{rrr} -5&-10&7\\ 6&13&-10\\ 17&36&-27 \end{array} \right). $$ !!?!! В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степени $ \le 3 $ оператор $ \mathcal A_{} $ действует по правилу $$ \mathcal A (f(x)) = f(x) (x^3+2\,x^2+1) \pmod{x^4+4} \ , $$ т.е. полином $ f_{}(x) $ отображается в ((:polynomial#делимость_полиномов остаток от деления)) произведения $ f(x) (x^3+2\,x^2+1) $ на $ x^4+4 $. Найти матрицу оператора $ \mathcal A_{} $ в базисе $ \{1,x,x^2,x^3\} $. **Ответ.** $$ \left(\begin{array}{rrrr} 1 & -4 & -8 & 0 \\ 0 & 1 & -4 & -8 \\ 2& 0 & 1 & -4 \\ 1 & 2 & 0 & 1 \end{array} \right) \ . $$ !!Т!! **Теорема 7.** //Координаты произвольного вектора// $ X=x_1X_1+\dots+x_nX_n $ //и его образа// $ Y=\mathcal A(X)=y_1X_1+\dots+y_nX_n $ //связаны формулой// $$ \left(\begin{array}{c} y_1 \\ \vdots \\ y_n \end{array} \right) = {\mathbf A}\left(\begin{array}{c} x_1 \\ \vdots \\ x_n \end{array} \right) \ . $$ Как изменяется матрица оператора при переходе к новому базису? !!Т!! **Теорема 8.** //Если// $ C_{} $ --- //((:linear_space#преобразование_координат_при_замене_базиса матрица перехода от старого базиса к новому)), то матрицы// $ {\mathbf A} $ //и// $ {\mathbf B} $ //оператора в старом и новом базисах связаны формулой//: $$ {\mathbf B}=C^{-1}\cdot {\mathbf A} \cdot C \ . $$ **Доказательство** ((:mapping:operator:vspom1 ЗДЕСЬ)). !!П!! **Пример.** Оператор $ \mathcal A $ в базисе пространства $ \mathbb R^{3} $ $$ \underbrace{\left( \begin{array}{r} 8 \\ -6 \\ 7 \end{array}\right)}_{X_1},\ \underbrace{\left( \begin{array}{r} -16 \\ 7 \\ -13 \end{array}\right)}_{X_2} ,\ \underbrace{\left( \begin{array}{r} 9\\ -3 \\ 7 \end{array}\right)}_{X_3} \qquad \mbox{ имеет матрицу } \qquad \left( \begin{array}{rrr} 1&-18&15\\ -1&-22&20\\ 1&-25 &22 \end{array}\right). $$ Найти его матрицу в базисе $$ \underbrace{\left( \begin{array}{r} 1\\ -2 \\ 1 \end{array}\right)}_{\mathfrak X_1} , \ \underbrace{\left( \begin{array}{r} 3\\ -1 \\ 2 \end{array}\right)}_{\mathfrak X_2} , \ \underbrace{\left( \begin{array}{r} 2\\ 1 \\ 2 \end{array}\right)}_{\mathfrak X_3}. $$ **Решение.** Матрица $ C_{} $ перехода от старого базиса к новому находится по ((:linear_space#преобразование_координат_при_замене_базиса формуле)) $$ C= \left[X_1|X_2|X_3\right]^{-1} \cdot \left[{\mathfrak X}_1|{\mathfrak X}_2|{\mathfrak X}_3\right]= $$ $$ =\left( \begin{array}{rrr} 8&-16&9\\ -6&7&-3\\ 7&-13 &7 \end{array}\right)^{-1} \left( \begin{array}{rrr} 1&3&2\\ -2&-1&1\\ 1&2 &2 \end{array}\right) = $$ $$ =\left (\begin{array}{rrr} 2&-1&-3\\ {\scriptstyle 21}/{\scriptstyle 5}& -{\scriptstyle 7}/{\scriptstyle 5}&-6\\ {\scriptstyle 29}/{\scriptstyle 5}&-{\scriptstyle 8}/{\scriptstyle 5}&-8 \end{array}\right) \left( \begin{array}{rrr} 1&3&2\\ -2&-1&1\\ 1&2 &2 \end{array}\right)= \left(\begin{array}{rrr} 1&1&-3\\ 1&2&-5\\ 1&3&-6 \end{array}\right) \ . $$ По теореме: $$ {\mathbf B}=C^{-1} {\mathbf A} C= \left(\begin{array}{rrr} 3&-3&1\\ 1&-3&2\\ 1&-2&1 \end{array}\right) \left( \begin{array}{rrr} 1&-18&15\\ -1&-22&20\\ 1&-25 &22 \end{array}\right) \left(\begin{array}{rrr} 1&1&-3\\ 1&2&-5\\ 1&3&-6 \end{array}\right)= $$ $$ =\left(\begin{array}{rrr} 7&-13&7\\ 6&-2&-1\\ 4&1&-3 \end{array}\right) \left(\begin{array}{rrr} 1&1&-3\\ 1&2&-5\\ 1&3&-6 \end{array}\right)=\left(\begin{array}{rrr} 1&2&2\\ 3&-1&-2 \\ 2&-3&1 \end{array}\right). $$ Матрицы $ {\mathbf A} $ и $ {\mathbf B} $, связанные соотношением $ {\mathbf B}=C^{-1}\cdot {\mathbf A} \cdot C $ при какой-то неособенной матрице $ C_{} $, называются **подобными**, этот факт будем записывать: $ {\mathbf A}\doteq {\mathbf B} $. !!?!! Доказать, что отношение подобия есть отношение эквивалентности, и если $ {\mathbf A}\doteq {\mathbf B} $ то $ g({\mathbf A})\doteq g({\mathbf B}) $ при любом ((:polynomial полиноме)) $ g_{}(x) $. !!Т!! **Теорема 9.** //Для оператора// $ \mathcal A_{} $ //ранг его матрицы является инвариантом, т.е. не зависит от выбора базиса пространства. Этот ранг совпадает с рангом оператора// $ \mathcal A_{} $. **Доказательство.** Если $ {\mathbf A} $ и $ {\mathbf B} $ --- матрицы оператора в двух разных базисах, то они являются подобными: $ {\mathbf B}=C^{-1}{\mathbf A} C $. По ((:algebra2:rank#неравенства_для_ранга свойству ранга матрицы)) имеем: $ \operatorname{rank}( {\mathbf B})= \operatorname{rank}({\mathbf A}) $. !!=>!! Дефект оператора $ \mathcal A_{} $ совпадает с дефектом его матрицы в произвольном базисе пространства. !!Т!! **Теорема 10.** //Для оператора// $ \mathcal A_{} $ //определитель и ((:algebra2#след след)) его матрицы являются инвариантами, т.е. не зависят от выбора базиса пространства.// **Доказательство.** Действительно, для подобных матриц $ {\mathbf A} $ и $ {\mathbf B} $, на основании ((:algebra/dets/binet_cauchy теоремы Бине-Коши)) имеем: $$ \det ({\mathbf B}) = \det (C^{-1}{\mathbf A} C) = \det (C^{-1}) \cdot \det ({\mathbf A}) \cdot \det (C) =\det ({\mathbf A}) . $$ Далее, по свойству следа матрицы: $$ \operatorname{Sp}({\mathbf B}) = \operatorname{Sp}(C^{-1}{\mathbf A} C)=\operatorname{Sp}({\mathbf A} \cdot C \cdot C^{-1})=\operatorname{Sp}({\mathbf A}) \ . $$ Этот результат позволяет ввести понятие **определителя** и **следа оператора** $ \mathcal A_{} $ --- посредством матрицы этого оператора в произвольном базисе пространства. Такое определение оказывается корректным поскольку оба значения не зависят от выбора базиса. ===Оператор в евклидовом пространстве== Каков "физический" смысл определителя оператора? Начнем с примера. !!П!! **Пример.** Пусть на плоскости $ \mathbb R^2 $ задано ((:euclid_space#opredelenija стандартное скалярное произведение)). Рассмотрим оператор, отображающий векторы по правилу $$ \left(\begin{array}{l} y_1 \\ y_2 \end{array} \right)= \left(\begin{array}{rr} 1 & - 3 \\ 1 & -1 \end{array} \right) \left(\begin{array}{l} x_1 \\ x_2 \end{array} \right) \ . $$ Свойство линейности оператора как отображения плоскости проявляется в том, что параллельные отрезки он отображает в параллельные же отрезки (см. упражнение к теореме 2 из ((:mapping#свойства_линейных_отображений ПУНКТА)) ), и, следовательно, любой параллелограмм отображается им в параллелограмм. {{ mapping:map1.jpg |}} Площади соответствующих параллелограммов оказываются связанными через определитель матрицы --- более точно, через __модуль__ этого определителя. Причем этот результат не зависит от расположения отображаемой фигуры: коэффициент растяжения будет одинаков в любом месте плоскости. В рассмотренном примере это проверяется непосредственно; что касается обобщения на произвольное //евклидово// пространство, в котором понятие объема вводится ((:dets:gram#объемы_параллелепипедов аксиоматически)) то справедлив следующий результат. !!Т!! **Теорема 11.** //Пусть// $ \{X_{1},\dots,X_n \} $ --- //произвольные векторы// $ n_{} $//-мерного евклидова пространства// $ \mathbb E_{} $, //а// $ \mathcal A_{} $ --- //линейный оператор, действующий в этом пространстве. Справедливо равенство// $$ {\mathfrak G}(\mathcal A (X_1),\dots, \mathcal A (X_n))=\left( \det (\mathcal A) \right)^2 \cdot {\mathfrak G}(X_1,\dots, X_n) \ . $$ //Здесь// ${\mathfrak G}$ --- //((:dets/gram#matrica_i_opredelitel_grama определитель Грама))//. **Доказательство** проведем для частного случая пространства столбцов $ \mathbb R^n $ со стандартным скалярным произведением и оператором $$ Y=AX $$ при вещественной матрице $ A_{n\times n} $. Составим матрицу из столбцов $$ \mathbf X=\left[X_1|X_2|\dots|X_n \right] \, . $$ Тогда матрицу Грама этих столбцов можно представить в виде $$ G(X_1,X_2,\dots,X_n) = \mathbf X^{\top} \mathbf X \, , $$ и ее определитель равен $ (\det \mathbf X)^2 $. А матрицу Грама столбцов $ \{ AX_1,AX_2,\dots, AX_n \} $ можно представить в виде $$ G(AX_1,AX_2,\dots,AX_n) = (A\mathbf X)^{\top} (A\mathbf X) = \mathbf X^{\top} A^{\top} A \mathbf X \, . $$ На основании ((:algebra/dets/binet_cauchy теоремы Бине-Коши)) определитель последней матрицы равен $ (\det A)^2 (\det \mathbf X)^2 $. Теперь совмещаем этот результат со следующим, взятым ((:dets/gram#obemy_parallelepipedov ОТСЮДА)) !!Т!! **Теорема.** //Квадрат объема параллелепипеда, построенного на векторах системы// $ \{X_1,X_2,\dots,X_k\} $, //совпадает с величиной определителя Грама от той же системы//: $$[V(X_1,X_2,\dots,X_k)]^2= \mathfrak G (X_1,X_2,\dots,X_k) \ .$$ Где-то в курсе математического анализа есть результат, что внутрь оболочки любого кубируемого тела в $ \mathbb R^3 $ может быть заложен __конечный__ набор параллелепипедов так что суммарный объем этого набора сколь угодно мало будет отличаться от объема тела (см. ((https://dzen.ru/video/watch/65e1062c454d4741b3fbaa9b видео))). За счет этого результата (и его абстрагированием в произвольное евклидово пространство) приходим к умозаключению. "Физический" смысл определителя оператора заключается в том, что модуль его значения представляет коэффициент расширения[[Слово "расширение" следует понимать в обобщенном смысле, т.е. в случае $ |\det (\mathcal A)| <1 $ имеет место сжатие.]]объема (в рассмотренном выше примере --- площади) тела (соответственно, плоской фигуры) под воздействием этого оператора. Подчеркну: рассматриваемое линейное пространство обязано быть евклидовым, т.е. в нем должна быть определена длина любого вектора. Как правило, в дальнейшем будем иметь дело с пространством $ \mathbb R^n $ со стандартным скалярным произведением. !!=>!! Случаю $ |\det (\mathcal A)|=1 $ соответствует оператор, сохраняющий объемы. Примером такого оператора является оператор $$ PX,\ X\in \mathbb R^n , $$ при ((:algebra2/ort_matrix ортогональной матрице)) $ P \in \mathbb R^{n\times n} $. Этот оператор сохраняет не только объемы, но и расстояния между точками пространства, а также углы между векторами. Так, к примеру, $$ \langle PX, PX \rangle = X^{\top} P^{\top}P X = X^{\top} E X= X^{\top} X = \langle X, X \rangle \, . $$ А вот объяснить "физический" смысл __следа__ оператора посложнее будет...:-\ ===Матрица оператора (продолжение)== !!Т!! **Теорема 6.** //Оператор обратим тогда и только тогда, когда когда его определитель отличен от нуля.// !!Т!! **Теорема 7.** //Линейное пространство// $ {\mathcal H}om(\mathbb V,\mathbb V) $ //операторов на// $ \mathbb V_{}, \dim \mathbb V = n $ //изоморфно линейному пространству квадратных матриц порядка// $ n_{} $ (//с элементами из// $ \mathbb R_{} $ //или из// $ \mathbb C_{} $). Это утверждение является простым следствием теоремы 2, приведенной в пункте ((:mapping#матрица_линейного_отображения МАТРИЦА ЛИНЕЙНОГО ОТОБРАЖЕНИЯ)). Однако в случае операторов установленный изоморфизм сохранит не только результат операции сложения, но и результат операции умножения: $$ . \mbox{ если } \mathcal A_1 \leftrightarrow \mathbf A_1,\ \mathcal A_2 \leftrightarrow \mathbf A_2, \mbox{ то } \mathcal A_1+ \mathcal A_2 \leftrightarrow \mathbf A_1 + \mathbf A_2,\ \lambda \mathcal A_1 \leftrightarrow \lambda \mathbf A_1 \ , \ \mathcal A_1 \mathcal A_2 \leftrightarrow \mathbf A_1 \mathbf A_2 \ . $$ Я сформулирую этот "усиленный вариант" изоморфизма в виде набора свойств, которыми буду пользоваться по мере возникновения потребности. !!Т!! **Теорема 8.** //В любом базисе пространства// **а)** //матрица нулевого оператора// $ \mathcal O $ //является нулевой матрицей// $ \mathbb O_{} $, //а матрица тождественного оператора// $ \mathcal E $ //является единичной матрицей// $ E_{} $; //обратно: если матрица оператора в этом базисе --- нулевая (единичная), то оператор является нулевым (соответственно, тождественным);// **б)** //матрица произведения операторов совпадает с произведением матриц этих операторов[[Взятых в том же порядке!]];// **в)** //коммутирующим операторам соответствуют коммутирующие матрицы;// **г)** //если// $ {\mathbf A} $ --- //матрица оператора//, //то// $ {\mathbf A}^{-1} $ --- //матрица обратного оператора;// **д)** //если// $ {\mathbf A} $ --- //матрица оператора// $ \mathcal A $, //то матрицей операторного полинома// $ g (\mathcal A) $ //является матрица// $ g({\mathbf A}) $ . ====Матрица оператора и матрица перехода от базиса к базису== Эти матрицы как-то взаимодействовали между собой в предыдущем пункте, хотя вторая была определена совершенно в другом ((:linear_space#преобразование_координат_при_замене_базиса разделе)). Обе матрицы квадратные, обе имеют в определении "завязку" на базис пространства $ \mathbb V_{} $. У начинающих изучать теорию часто возникает путаница при различении этих определений. "Физический" смысл этих понятий различен. Образно говоря, если рассматривать оператор как //процесс// (точнее: установленную связь между входными и выходными значениями процесса), то выбор базиса можно интерпретировать как выбор //точки зрения// на этот процесс (можно трактовать эти слова как формализацию выражения "рассмотрим этот процесс под другим углом"). Тем не менее, с //чисто формальной точки зрения//, матрица $ C_{} $ перехода от базиса $ \{X_1,X_2,\dots,X_n \} $ пространства $ \mathbb V_{} $ к какому-то другому базису $ \{\mathfrak X_1,\mathfrak X_2,\dots,\mathfrak X_n \} $ того же пространства __может считаться матрицей некоторого оператора__, действующего в этом пространстве. В самом деле, на основании ((#osnovnye_opredelenija теоремы 6)), существует единственный оператор $ \mathcal C $, переводящий старые базисные векторы в новые, взятые в той же последовательности: $$ \mathcal C (X_1)=\mathfrak X_1, \mathcal C (X_2)= \mathfrak X_2, \dots, \mathcal C (X_n)= \mathfrak X_n \ . $$ Но тогда матрица оператора $ \mathcal C $ в базисе $ \{X_1,X_2,\dots,X_n \} $ совпадает с матрицей $ C_{} $ перехода от базиса $ \{X_1,X_2,\dots,X_n \} $ к базису $ \{\mathfrak X_1,\mathfrak X_2,\dots,\mathfrak X_n \} $. Я буду записывать матрицы операторов и матрицы переходов от базиса к базису в разных стилях: $ \mathbf A, \mathbf B,\dots $ и, соответственно, $ C, P, T, \dots $ --- с целью быстрого распознавания их "физической" сущности. ====Матрица оператора проецирования== Настоящий пункт может быть пропущен при первоначальном чтении. !!T!! **Теорема.** //Рассмотрим линейную оболочку линейно независимой системы столбцов// $ \{Y_1,\dots, Y_k \} \subset \mathbb R^n $. $$ \mathbb M =\left\{ \lambda_1 Y_1 + \dots + \lambda_k Y_k \ \big| \ \{\lambda_1,\dots,\lambda_k\} \subset \mathbb R \right\}= \mathcal L (Y_1,\dots,Y_k) \, . $$ //Пусть ((#euclid_space#определения скалярное произведение)) векторов// $ X_{} $ //и// $ Y_{} $ //задается стандартным способом, т.е.// $ \langle X,Y \rangle =x_1y_1+\dots+x_ny_n $. //Ближайшей к точке// $ X_0 \subset \mathbb R^n $ //точкой многообразия (или ортогональной проекцией точки// $ X_0 $ //на многообразие) // $ \mathbb M_{} $ //является// $$ X_{\ast} = \mathbf L (\mathbf L^{\top} \mathbf L )^{-1} \mathbf L^{\top} X_0 \, . $$ //Здесь// $ \mathbf L=[Y_1 |\dots |Y_k]_{n\times k} $. Матрица $ \mathbf L^{\top} \mathbf L $ невырождена, поскольку является ((:euclid_space#свойства_матрицы_грама матрицей Грама)) $$ \mathbf L^{\top} \mathbf L= \left(\begin{array}{cccc} Y_1^{\top} Y_1 & Y_1^{\top} Y_2 & \dots & Y_1^{\top} Y_k \\ Y_2^{\top} Y_1 & Y_2^{\top} Y_2 & \dots & Y_2^{\top} Y_k \\ \dots & & & \dots \\ Y_k^{\top} Y_1 & Y_k^{\top} Y_2 & \dots & Y_k^{\top} Y_k \end{array} \right) $$ системы линейно независимых столбцов $ \{Y_1,\dots, Y_k \} $. **Доказательство.** Пусть $ X_0=X_0^{^{\parallel}}+X_0^{^{\bot}} $, где $ X_0^{^{\parallel}} $ --- ортогональная проекция точки $ X_0 $ на $ \mathbb M $, а $ X_0^{^{\bot}} $ --- ортогональная составляющая. Тогда $$ \mathbf L^{\top} X_0^{^{\bot}}=\mathbb O $$ поскольку $ Y_1^{\top} X_0^{^{\bot}}=0,\dots, Y_k^{\top} X_0^{^{\bot}}=0 $. Далее, $ X_0^{^{\parallel}} $ можно разложить по базису $ \{Y_1,\dots, Y_k \} $: $$ X_0^{^{\parallel}}=\alpha_1 Y_1+\dots+ \alpha_k Y_k \quad npu \quad \{\alpha_1,\dots,\alpha_k\} \subset \mathbb R \, . $$ Следовательно, $$ \mathbf L^{\top} X_0=\mathbf L^{\top} (X_0^{^{\parallel}}+X_0^{^{\bot}})=\mathbf L^{\top} X_0^{^{\parallel}}= \mathbf L^{\top} (\alpha_1 Y_1+\dots+ \alpha_k Y_k)= $$ $$ =\left( \begin{array}{c} \alpha_1 Y_1^{\top} Y_1 +\dots + \alpha_k Y_1^{\top} Y_k \\ \alpha_1 Y_2^{\top} Y_1 +\dots + \alpha_k Y_2^{\top} Y_k \\ \dots \\ \alpha_1 Y_k^{\top} Y_1 +\dots + \alpha_k Y_k^{\top} Y_k \end{array} \right)= \mathbf L^{\top} \mathbf L \left( \begin{array}{c} \alpha_1 \\ \alpha_2 \\ \vdots \\ \alpha_k \end{array} \right)\, . $$ Тогда $$ \mathbf L (\mathbf L^{\top} \mathbf L )^{-1} \mathbf L^{\top} X_0= \mathbf L \left( \begin{array}{c} \alpha_1 \\ \alpha_2 \\ \vdots \\ \alpha_k \end{array} \right) =\alpha_1 Y_1+\dots+ \alpha_k Y_k= X_0^{^{\parallel}} \, . $$ На основании теорем $ 1_{} $ и $ 2_{} $, приведенных ((:euclid_space#вычисление_расстояния ЗДЕСЬ)), точка $ X_0^{^{\parallel}} $ является ближайшей точкой многообразия $ \mathbb M $ к точке $ X_{0} $. Матрица $ P=\mathbf L (\mathbf L^{\top} \mathbf L )^{-1} \mathbf L^{\top} $ является матрицей оператора ортогонального проецирования на многообразие $ \mathbb M_{} $ в стандартном базисе $$ \bigg\{{\mathfrak e}_j = \big[\underbrace{0,\dots,0,1}_{j},0,\dots,0\big]^{\top} \bigg\}_{j=1}^n \, . $$ Она симметрична и ((#основные_определения идемпотентна)), т.е. обладает свойством $ P^2=P $. !!П!! **Пример.** В $ \mathbb R^{3} $ найти матрицу проецирования на плоскость $ x+y+z=0 $. **Решение.** Параметрическое задание плоскости: $$ \mathbb M=\{ \lambda_1 \underbrace{[1,-1,0]^{\top}}_{Y_1} + \lambda_2 \underbrace{[0,1,-1]^{\top}}_{Y_2}\ \big| \{\lambda_1,\lambda_2\} \subset \mathbb R \} \, . $$ Имеем: $$ \mathbf L= \left(\begin{array}{rr} 1 & 0 \\ -1 & 1 \\ 0 & -1 \end{array} \right) \ \Rightarrow \ \mathbf L^{\top} \mathbf L= \left(\begin{array}{rr} 2 & -1 \\ -1 & 2 \end{array} \right) \ \Rightarrow \ (\mathbf L^{\top} \mathbf L )^{-1}= \left(\begin{array}{rr} 2/3 & 1/3 \\ 1/3 & 2/3 \end{array} \right) \ \Rightarrow \ $$ $$ \ \Rightarrow \ \mathbf L (\mathbf L^{\top} \mathbf L )^{-1} \mathbf L^{\top}= \frac{1}{3} \left(\begin{array}{rrr} 2 & -1 & -1 \\ -1& 2 & -1 \\ -1 & -1 & 2 \end{array} \right) \, . $$ В общем случае отображение точки $ X_{0} $ на ближайшую к ней точку __произвольного__ многобразия $$ \mathbb M =\left\{ Y_0+\lambda_1 Y_1 + \dots + \lambda_k Y_k \ \big| \ \{\lambda_1,\dots,\lambda_k\} \subset \mathbb R \right\} \, ,$$ при $ Y_0 $ линейно независимом от $ \{Y_1,\dots,Y_k\} $, не является линейным оператором, а относится к типу ((:algebra2:optimiz:distance#аффинные_отображения аффинных отображений)). Выражение для этого отображения см. в разделе ((:algebra2:optimiz:distance#расстояние_от_точки_до_линейного_многообразия_плоскости ВЫЧИСЛЕНИЕ РАССТОЯНИЙ МЕЖДУ ГЕОМЕТРИЧЕСКИМИ ОБЪЕКТАМИ)). ====Матрица оператора отражения (оператора Хаусхолдера)== Настоящий пункт может быть пропущен при первоначальном чтении. В пространстве $ \mathbb R^n $ со стандартным скалярным произведением рассмотрим плоскость, заданную уравнением $$ C^{\top}X= c_1x_1+c_2x_2+\dots+c_nx_n = 0 $$ при векторе нормали $ C^{\top}=(c_1,c_2,\dots,c_n) $ единичной длины: $ |C|^2= C^{\top}C=1 $. Действие оператора **зеркального отражения** или **оператора Хаусхолдера**[[Householder A.S. (1904-1993) --- американский математик.]] относительно этой плоскости на вектор (точку) $ X \in \mathbb R^n $ определим правилом $$ \mathcal H( X^{^{\parallel}} + X^{^{\bot}})= X^{^{\parallel}} - X^{^{\bot}} \ ; $$ здесь $ X^{^{\parallel}} $ --- ((:euclid_space#вычисление_расстояния ортогональная проекция)) вектора $ X_{} $ на заданную плоскость, а $ X^{^{\bot}} $ --- ((:euclid_space#вычисление_расстояния ортогональная составляющая)) вектора $ X_{} $ относительно этой плоскости. {{ mapping:reflection.png |}} !!Т!! **Теорема.** //Оператор// $ \mathcal H $ //задается уравнением// $$ \mathcal H(X)=X-2\, \langle X,C \rangle C=X-2\, C (C^{\top}X)= X-2\, C^{\top}XC \, . $$ Последний вариант формулы никогда не встречал, но он имеет формальное право на существование! **Доказательство.** $$ \mathcal H( X^{^{\parallel}} + X^{^{\bot}})=X^{^{\parallel}} + X^{^{\bot}}-2\, \langle X^{^{\parallel}},C \rangle C-2\, \langle X^{^{\bot}},C \rangle C = $$ Поскольку $ X^{^{\parallel}} $ ортогонален, а вектор $ X^{^{\bot}} $ коллинеарен вектору $ C $ единичной длины, то $$= X^{^{\parallel}} + X^{^{\bot}} - 2\, X^{^{\bot}} = X^{^{\parallel}} - X^{^{\bot}} \, . $$ !!Т!! **Теорема.** //Матрица оператора// $ \mathcal H $ //в стандартном базисе// $$ \bigg\{{\mathfrak e}_j = \big[\underbrace{0,\dots,0,1}_{j},0,\dots,0\big]^{\top} \bigg\}_{j=1}^n \, . $$ //имеет вид// $$ \mathbf H_{C}= E-2\, C \cdot C^{\top} = \left( \begin{array}{cccc} 1-2c_1^2 & -2\,c_1c_2 & \dots & - 2 c_1 c_n \\ -2\,c_1c_2 & 1-2c_2^2 & \dots & - 2 c_2 c_n \\ \vdots & & & \vdots \\ - 2 c_1 c_n & - 2 c_2 c_n & \dots & 1-2c_n^2 \end{array} \right) \, . $$ !!П!! **Пример.** Найти зеркальное отражение точки $ [3,2,3] $ относительно плоскости $ 2\,x-2\,y+z = 0 $. **Решение.** Здесь $ C^{\top}=[2/3,-2/3,1/3] $ и $$ \mathcal H(X)= \left( \begin{array}{r} 3 \\ 2 \\ 3 \end{array} \right) - 2\langle [3,2,3],[2/3,-2/3,1/3] \rangle \left( \begin{array}{r} 2/3\\ -2/3 \\ 1/3 \end{array} \right)= \left( \begin{array}{r} 7/9 \\ 38/9 \\ 17/9 \end{array} \right) \, . $$ Проверим результат посредством матричного представления: $$ \mathbf H_C= \left( \begin{array}{rrr} 1/9 & 8/9 & -4/9 \\ 8/9 & 1/9 & 4/9 \\ -4/9 & 4/9 & 7/9 \end{array} \right) \quad \Rightarrow \quad \mathbf H \left( \begin{array}{r} 3 \\ 2 \\ 3 \end{array} \right)= \left( \begin{array}{r} 7/9 \\ 38/9 \\ 17/9 \end{array} \right) \, . $$ !!=>!! Матрица $ \mathbf H_{C} $ одновременно симметрична и ((:algebra2:ort_matrix ортогональна)), и $ \det \mathbf H_{C}=-1 $. Следовательно, ей обратная существует и совпадает с ней самой: $$ \mathbf H_{C}^{-1}= \mathbf H_{C} \, . $$ Обобщение оператора отражения на случай нелинейного многообразия см. в пункте ((:dets:discrim:equidist#кривая_зеркального_отражения КРИВАЯ ЗЕРКАЛЬНОГО ОТРАЖЕНИЯ)). ==Инвариантное подпространство== **Задача.** Подобрать базис пространства $ \mathbb V_{} $ так, чтобы матрица заданного оператора $ \mathcal A_{} $ имела наиболее простой вид. Исследуем действие оператора $ \mathcal A $ на произвольное подпространство $ \mathbb V_1 \subset \mathbb V $: $$\mathcal A (\mathbb V_1)= \left\{Y\in \mathbb V \mid Y=\mathcal A (X), \ X \in \mathbb V_1 \right\} \ .$$ Вообще говоря, множества $ \mathbb V_1 $ и $ \mathcal A (\mathbb V_1) $ будут различными, т.е. $ \exists X_1 \in \mathbb V_1 $ такой, что $ \mathcal A (X_1)\notin \mathbb V_1 $. Подпространство $ \mathbb V_1 $ называется **инвариантным подпространством оператора** $ \mathcal A $, если оно отображается этим оператором в себя: $$ \mathcal A(\mathbb V_1)\subset \mathbb V_1 \ .$$ $ \mathbb V_1=\{\mathbb O \} $ и $ \mathbb V_1=\mathbb V $ --- **тривиальные инвариантные подпространства** произвольного оператора $ \mathcal A $. Нас будут интересовать нетривиальные инвариантные подпространства. !!П!! **Пример.** Оператор $$\left(\begin{array}{c} x \\ y \\ z \end{array} \right) \longmapsto \left(\begin{array}{rrr} {\scriptstyle 1}/{\scriptstyle \sqrt 2} & -{\scriptstyle 1}/{\scriptstyle \sqrt 2} & 0 \\ {\scriptstyle 1}/{\scriptstyle \sqrt 2} & {\scriptstyle 1}/{\scriptstyle \sqrt 2} & 0 \\ 0 & 0 & 1 \end{array} \right) \left(\begin{array}{c} x \\ y \\ z \end{array} \right) $$ задает в пространстве поворот вокруг оси $ \mathbb O z $ на угол $ +\pi /4 $. Нетривиальными инвариантными подпространствами будут **а)** ось вращения $ \mathbb V_1=\{(0,0,z)^{^{\top}} \mid z \in \mathbb R\} $, $ \dim \mathbb V_1=1 $ и **б)** плоскость, перпендикулярная оси вращения $ \mathbb V_2=\{(x,y,0)^{^{\top}} \mid \{x,y\} \subset \mathbb R\} $, $ \dim \mathbb V_2= 2 $. !!П!! **Пример.** Оператор $$\left(\begin{array}{c} x \\ y \end{array} \right) \longmapsto \left(\begin{array}{c} \lambda_1 x \\ \lambda_2 y \end{array} \right) $$ задает на плоскости "растяжение": $ x_{} $-компонента увеличивается в $ \lambda_{1} $ раз, а $ y_{} $-компонента --- в $ \lambda_{2} $ раз. При любой комбинации коэффициентов растяжения координатные оси будут инвариантными подпространствами. Однако в частном случае $ \lambda_1=\lambda_2 $ инвариантной будет также любая прямая, проходящая через начало координат. !!П!! **Пример.** Оператор в $ \mathbb R^{n}_{} $ задан блочной матрицей $$X \longmapsto \left( \begin{array}{cc} {\mathbf A}_1 & {\mathbf *}\\ \mathbb O & {\mathbf A}_2 \end{array} \right) X $$ где $ {\mathbf A}_1 $ --- $ n_1\times n_1 $-матрица, $ {\mathbf A}_2 $ --- $ (n-n_1)\times (n-n_1) $-матрица. Множество столбцов $$\mathbb V_1=\left\{X=[x_1,\dots,x_{n_1},0,\dots,0]^{^{\top}} \bigg| \{ x_1, \dots, x_{n_1} \} \subset \mathbb R \right\}$$ образует инвариантное подпространство, $ \dim \mathbb V_1=n_1 $. Если же, вдобавок, матрица, обозначенная $ {\mathbf *} $ --- нулевая, то вторым инвариантным подпространством будет $$ \mathbb V_2=\left\{X=[0,\dots,0,x_{n_1+1},\dots,x_n]^{^{\top}} \bigg| \{x_{n_1+1},\dots, x_n \} \subset \mathbb R \right\} \ .$$ !!Т!! **Теорема.** $ \mathcal{K}er (\mathcal A) $ //и// $ \mathcal{I}m(\mathcal A) $ --- //инвариантные подпространства оператора// $ \mathcal A $. !!?!! Доказать, что сумма двух инвариантных подпространств является инвариантным подпространством. !!Т!! **Теорема.** //Если пространство// $ \mathbb V_{} $ //раскладывается в ((:linear_space#прямая_сумма_линейных_подпространств прямую сумму подпространств)), инвариантных относительно оператора// $ \mathcal A $, //то существует базис пространства, в котором матрица оператора будет блочно-диагональной//. Теорема обобщается очевидным образом на произвольное число слагаемых подпространств: $ \mathbb V=\mathbb V_1\oplus \mathbb V_2 \oplus \dots \oplus \mathbb V_k $. Если при этом $ \dim \mathbb V_1= \dots = \dim \mathbb V_k=1 $, то матрица оператора в базисе, полученном объединением базисных векторов слагаемых подпространств, становится диагональной --- это и является решением задачи, поставленной в начале пункта. ===Собственное число и собственный вектор== **Задача.** Найти одномерные инвариантные подпространства оператора. Вектор $ X_{}\in \mathbb V $ называется **собственным вектором оператора** $ \mathcal A_{} $, если $$ {\mathbf a)} X \ne \mathbb O, \quad u \quad {\mathbf b)}\ \exists \ \lambda \in \mathbb C \qquad \mbox{ такое, что } \qquad \mathcal A(X)=\lambda X \ .$$ В этом случае число $ \lambda_{} $ называется **собственным** или **характеристическим числом оператора**, соответствующим (или принадлежащим) данному собственному вектору; обратно, говорят, что **вектор** $ X_{} $ **принадлежит собственному числу** $ \lambda_{} $. Вопрос существования хотя бы одного собственного числа для произвольного оператора $ \mathcal A_{} $ остается пока открытым. Однако, свойство линейности оператора гарантирует, что если это число существует, то ему соответствует бесконечное множество собственных векторов: $$ \mathcal A(X)=\lambda X \quad \Rightarrow \quad \mathcal A(t\,X)=t \mathcal A(X)= t\lambda\, X \ , $$ т.е. если вектор $ X \in \mathbb V_{} $ является собственным, то и вектор $ t\, X $ будет собственным при любом скаляре $ t\ne 0 $. Заметим, что собственное число разыскивается во множестве комплексных чисел: вопрос о существовании __вещественного__ собственного числа --- даже в случае вещественного пространства $ \mathbb V_{} $ --- остается открытым. Геометрический смысл вещественных собственных чисел и векторов проясняет следующий пример. !!П!! **Пример.** Оператор $$\left(\begin{array}{c} x \\ y \end{array} \right) \longmapsto \left(\begin{array}{rr} 1 & - 5/2 \\ -1/2 & 2 \end{array} \right) \left(\begin{array}{c} x \\ y \end{array} \right) $$ задает отображение плоскости $ \mathbb R^2 $. На рисунке показан результат действия этого отображения на единичную окружность. Все точки плоскости, за исключением начала координат $ \mathbb O_{} $, изменят свое положение --- ни одна не останется на месте. {{ mapping:eigenvect.gif |}} Если рассмотреть эти точки как концы векторов, имеющих начало в $ \mathbb O_{} $, то смещения точек под действием оператора можно представить в виде двух составляющих: растяжения (т.е. увеличения расстояния до начала координат) и поворота вокруг начала координат на некоторый угол. И только по двум направлениям плоскости поворота не происходит. Точки окружности с координатами $$ \pm \left( 0.823, -0.568 \right)^{\top} \quad u \quad \pm \left( 0.960, 0.278 \right)^{\top} $$ будут смещаться без поворота. Эти точки и задают координаты конца собственного вектора. А соответствующие им собственные числа $ 2.725 $ и $ 0.275 $ определяют коэффициенты сдвига. Если вообразить оператор как деформацию физической среды, заполняющей плоскость, то можно сказать, что cобственный вектор задает направление, на котором действие оператора сводится к растяжению, при этом коэффициент растяжения и будет собственным числом. !!А!! Анимация процесса ((:mapping:operator:anim10 ЗДЕСЬ)) (1500 Kb, gif). Пример другого оператора $$ \left(\begin{array}{l} x \\ y \end{array} \right) \longmapsto \left(\begin{array}{rr} 1 & - 3 \\ 1 & -1 \end{array} \right) \left(\begin{array}{l} x \\ y \end{array} \right) $$ показывает, что существование __вещественных__ собственных чисел вовсе не гарантировано даже в случае оператора в вещественном пространстве: в этом примере все точки плоскости повернутся вокруг начала координат. Я "замыливаю" ответ на вопрос какой физический смысл имеют __отрицательные__ собственные числа... !!?!! Доказать, что $ \operatorname{dfc} (\mathcal A) \ne 0 $ тогда и только тогда, когда оператор $ \mathcal A_{} $ имеет собственное число, равное нулю. !!Т!! **Теорема.** //Любой собственный вектор оператора порождает его одномерное инвариантное подпространство, и обратно: любой ненулевой вектор одномерного инвариантного подпространства оператора является собственным вектором.// !!П!! **Пример.** В пространстве $ \mathbb P_3 $ полиномов с вещественными коэффициентами степени $ \le 3 $ оператор $ \mathcal A_{} $ действует по правилу $$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ т.е. полином $ f_{}(x) $ отображается в ((:polynomial#делимость_полиномов остаток от деления)) произведения $ f(x) (x^2-2) $ на $ x^4-x^3-x^2+x $. Найти собственные векторы этого оператора. **Решение.** В пространстве $ \mathbb P_3 $ векторами являются полиномы, а условие того, что полином $ f_{}(x) $ является собственным, принадлежащим числу $ \lambda_{} $, записывается в виде: $$ f(x)(x^2-2)\equiv \lambda f(x) \pmod{x^4-x^3-x^2+x} \quad \iff $$ $$ \iff \quad f(x)(x^2-2-\lambda)\equiv 0 \pmod{x^4-x^3-x^2+x} \ . $$ Поскольку $ \deg f \le 3 $, то последнее может выполняться тогда и только тогда, когда полином $ x^2-2-\lambda $ имеет общие корни с $ x^4-x^3-x^2+x \equiv x(x+1)(x-1)^2 $. Из этого условия вытекает, что число $ \lambda_{} $ может принимать только два значения: $ \lambda_1=-2 $ и $ \lambda_2=-1 $. Если $ \lambda_1=-2 $ является собственным числом, то ему соответствующий собственный вектор --- полином степени $ \le 3 $ --- должен определяться из условия делимости $ f(x)x^2 $ на $ x(x+1)(x-1)^2 $. Такой полином имеет вид $ t(x+1)(x-1)^2 $ при произвольной константе $ t_{} $. Следовательно множество $$ \{ t(x^3-x^2-x+1)= t(x+1)(x-1)^2 \ \mid \ t\ne 0 \} $$ является множеством собственных векторов, принадлежащих $ \lambda_1=-2 $. С числом $ \lambda_2=-1 $ поступаем аналогично. Условие делимости полинома $ f(x)(x^2-1) $ на $ x(x+1)(x-1)^2 $ дает также бесконечное множество: $$ \{ (t_1x+t_2)x(x-1) \ \mid \ \{t_1,t_2\} \subset \mathbb R \} \ . $$ Однако в этом случае бесконечность множества качественно иная, чем в предыдущем случае; она --- "двумерная". **Задача.** Для произвольного оператора выяснить условия существования его собственного числа и разработать конструктивный метод его нахождения. !!Т!! **Теорема.** //В комплексном линейном пространстве любой оператор имеет по крайней мере один собственный вектор.// **Доказательство.** Пусть $ \{X_1,\dots,X_{n} \} $ --- произвольный базис пространства $ \mathbb V_{} $ и $ \mathbf A_{} $ --- ((#матрица_оператора матрица оператора)) $ \mathcal A_{} $ в этом базисе. Тогда для того чтобы вектор $ X=x_1X_1+\cdots+x_nX_n \ne \mathbb O $ был собственным, принадлежащим собственному числу $ \lambda_{} $, необходимо и достаточно чтобы выполнялось равенство $$ {\mathbf A}\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array} \right) = \lambda \left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array} \right) \quad \Longleftrightarrow \quad \left(\begin{array}{cccc} \alpha_{11} - \lambda & \alpha_{12}& \dots & \alpha_{1n} \\ \alpha_{21} & \alpha_{22}- \lambda& \dots & \alpha_{2n} \\ \dots & & & \dots \\ \alpha_{n1} & \alpha_{n2}& \dots & \alpha_{nn}- \lambda \end{array} \right) \left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array} \right) = \mathbb O_{n\times 1} $$ Покажем, что существуют комплексные числа $ \lambda_{} $ и не все нулевые $ x_1,\dots,x_{n} $, удовлетворяющие этой системе. Необходимым и достаточным условием существования нетривиального решения у однородной системы линейных уравнений с квадратной матрицей ((:algebra2:linearsystems#система_однородных_уравнений является)) равенство нулю определителя этой матрицы: $$ \det ({\mathbf A}-\lambda E)=\left|\begin{array}{cccc} \alpha_{11} - \lambda & \alpha_{12}& \dots & \alpha_{1n} \\ \alpha_{21} & \alpha_{22}- \lambda& \dots & \alpha_{2n} \\ \dots & & & \dots \\ \alpha_{n1} & \alpha_{n2}& \dots & \alpha_{nn}- \lambda \end{array} \right|=0 \ . $$ Этот определитель является полиномом степени $ n_{} $ по $ \lambda_{} $. По ((:polynomial#основная_теорема_высшей_алгебры основной теореме высшей алгебры)) этот полином имеет по крайней мере один комплексный корень $ \lambda=\lambda_{\ast} $. Подставив его в систему, получаем однородную систему уравнений с нулевым определителем. Находим нетривиальное решение этой системы: $$ x_1=x_{1}^{\ast},\dots,x_n=x_{n}^{\ast}, \quad \exists x_{j}^{\ast} \ne 0 ; $$ но тогда вектор $ {\mathfrak X}_{\ast}= x_{1}^{\ast}X_1+\cdots+x_{n}^{\ast}X_n $ будет собственным вектором оператора $ \mathcal A_{} $, принадлежащим $ \lambda_{\ast}^{} $. Уравнение $ \det ({\mathbf A}-\lambda E)= 0 $ называется **характеристическим** или **вековым уравнением**, а полином в левой его части --- **характеристическим полиномом матрицы** $ {\mathbf A} $. Любой корень характеристического полинома матрицы называется собственным числом этой матрицы. Набор всех собственных чисел матрицы (корней характеристического полинома __с учетом кратностей__) называется **спектром матрицы**. Ненулевой вектор $ X \in \mathbb C^n $, удовлетворяющий условию $ {\mathbf A} X= \lambda X $, где $ \lambda $ --- собственное число матрицы, называется собственным вектором матрицы, соответствующим (или принадлежащим) данному собственному числу. !!П!! **Пример.** Применим полученный результат для получения альтернативного решения предыдущего примера. **Решение.** Базисом в пространстве $ \mathbb P_3 $ выберем $ \{1,\,x,\,x^2,\, x^3\} $. Образы базисных векторов под действием оператора $ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} $: $$ \left\{\begin{array}{lrrrr} \mathcal A (1) =&-2& &+x^2& ,\\ \mathcal A (x) =&&-2\,x &&+x^3 ,\\ \mathcal A (x^2) =& &-x &-x^2 &+x^3, \\ \mathcal A (x^2) =& &-x & & , \end{array} \right. \qquad \Rightarrow \qquad {\mathbf A}= \left(\begin{array}{rrrr} -2 & 0 & 0 & 0 \\ 0 & -2 & -1 & -1 \\ 1& 0 & -1 & 0 \\ 0 & 1 & 1 & 0 \end{array} \right) \ . $$ Характеристический полином матрицы $ {\mathbf A} $: $$ \left|\begin{array}{cccc} -2-\lambda & 0 & 0 & 0 \\ 0 & -2-\lambda & -1 & -1 \\ 1& 0 & -1-\lambda & 0 \\ 0 & 1 & 1 & -\lambda \end{array} \right|\equiv (\lambda+2)(\lambda^3+3\,\lambda^2+3\,\lambda+1)\equiv (\lambda+2)(\lambda+1)^3 \ . $$ Собственные числа $ \lambda_1=-2 $ и $ \lambda_2=-1 $, спектр матрицы $ \{-1,-1,-1,-2\} $. Подставляем каждое из собственных чисел в матрицу $ {\mathbf A}-\lambda E $ и решаем получившиеся системы однородных уравнений. Поскольку каждая из них должна иметь бесконечное множество решений, то мы строим ((:algebra2:linearsystems#система_однородных_уравнений фундаментальные системы решений)) (**ФСР**) $$ \begin{array}{ccc} & ({\mathbf A}-\lambda E)X=\mathbb O & \\ {\color{Red} \swarrow } & & {\color{Red} \searrow } \\ \lambda_1=-2 & & \lambda_2=-1 \\ \Downarrow & & \Downarrow \\ \left(\begin{array}{rrrr} 0 & 0 & 0 & 0 \\ 0 & 0 & -1 & -1 \\ 1& 0 & 1 & 0 \\ 0 & 1 & 1 & 2 \end{array} \right) \left(\begin{array}{l} x_1 \\ x_2 \\ x_3 \\ x_4 \end{array} \right)= \mathbb O & & \left(\begin{array}{rrrr} -1 & 0 & 0 & 0 \\ 0 & -1 & -1 & -1 \\ 1& 0 & 0 & 0 \\ 0 & 1 & 1 & 1 \end{array} \right) \left(\begin{array}{l} x_1 \\ x_2 \\ x_3 \\ x_4 \end{array} \right)= \mathbb O \ . \\ {\color{Red} \Downarrow } & & {\color{Red} \Downarrow } \\ x_1=1,x_2=-1,x_3=-1,x_4=1 & & \left\{\begin{array}{c} x_1=0,x_2=-1,x_3=1,x_4=0 \\ x_1=0,x_2=-1,x_3=0,x_4=1 \end{array} \right\} \end{array} $$ Таким образом, собственному числу $ \lambda_1=-2 $ соответствует собственнный вектор --- полином $ 1-x-x^2+x^3 $, и он полностью совпадает с полученным при решении предыдущего примера. В то же время собственному числу $ \lambda_2=-1 $ соответствует два линейно независимых собственнных вектора --- полиномы $ -x+x^2 $ и $ -x+x^3 $. Любой (не тождественно нулевой) полином множества $$ \{ \tau_1(-x+x^2) +\tau_2(-x+x^3) \mid \{\tau_1,\tau_2 \} \subset \mathbb R \} $$ будет также являться собственным, принадлежащим $ \lambda_2=-1 $. Это множество также совпадает с полученным при решении предыдущего примера. Итак, два формально различных подхода к решению одного и того же примера не привели к противоречию. Хотелось бы, однако, гарантировать глобальную непротиворечивость определения собственных чисел и векторов --- т.е. независимость (инвариантность) этих объектов относительно способов их нахождения, и, в частности, от выбора базиса пространства $ \mathbb V_{} $. !!Т!! **Теорема.** //Характеристические полиномы подобных матриц одинаковы.// **Доказательство.** $ {\mathbf A}\doteq {\mathbf B} {\color{Red} \iff } \exists $ неособенная матрица $ C_{} $, такая что $ {\mathbf B}=C^{-1} {\mathbf A} C $. Имеем: $$\det ({\mathbf B}-\lambda E)=\det (C^{-1} {\mathbf A} C-\lambda E)=$$ $$= \det (C^{-1} {\mathbf A} C-\lambda C^{-1}EC)=\det \left[ C^{-1} ({\mathbf A} -\lambda E)C \right] = \det ({\mathbf A}-\lambda E) \ .$$ Иначе говоря, для оператора $ \mathcal A_{} $ характеристический полином его матрицы не зависит от выбора базиса пространства. Поэтому можно говорить о **характеристическом полиноме оператора** $ \mathcal A_{} $. ''Характеристический полином матрицы подробнее исследуется'' ((:algebra2:charpoly ЗДЕСЬ)). В частности, в указанном разделе приведен ((:algebra2:charpoly#теорема_гамильтона-кэли результат)), на основании которого (а также на основании пунктов **а)** и **д)** теоремы 7, приведенной в пункте ((#матрица_оператора МАТРИЦА ОПЕРАТОРА)) ) выводится следующее нетривиальное утверждение: !!Т!! **Теорема [Гамильтон, Кэли].** //Результатом подстановки оператора в собственный характеристический полином будет нулевой оператор.// !!П!! **Пример.** Для рассмотренного в предыдущих примерах оператора $$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ действующего в $ \mathbb P_3 $, характеристический полином равен $$ \lambda^4+5\,\lambda^3+9\,\lambda^2+7\,\lambda+2 \, .$$ Проверим утверждение теоремы Гамильтона-Кэли --- должно быть выполнено условие $$ \mathcal A^4+5\,\mathcal A^3+9\,\mathcal A^2+7\,\mathcal A +2\, \mathcal E = \mathcal O \ . $$ Степени данного оператора $ \mathcal A_{} $ обсуждались в примере ((#основные_определения ПУНКТА)). Переписанное в терминах остатков, последнее условие превращается в $$ (x^2-2)^4f(x)+5\,(x^2-2)^3f(x)+9\,(x^2-2)^2f(x)+7\,(x^2-2)f(x) + $$ $$+2\,f(x) \equiv 0 \pmod{x^4-x^3-x^2+x} \ , $$ т.е. полином, стоящий в левой части сравнения, должен делиться нацело на $ x^4-x^3-x^2+x $ __при любом__ выборе полинома $ f_{}(x) $. Проверяем: $$ (x^2-2)^4+5\,(x^2-2)^3+9\,(x^2-2)^2+7\,(x^2-2)+2 \equiv $$ $$\equiv x^8-3\,x^6+3\,x^4-x^2 \equiv (x^4+x^3-x^2-x)(x^4-x^3-x^2+x) \ , $$ т.е. утверждение оказывается справедливым. ===Диагонализуемость матрицы оператора== !!Т!! **Теорема 1.** //Собственные векторы оператора, принадлежащие различным собственным числам, линейно независимы.// **Доказательство** ((:mapping:operator:eigenLI ЗДЕСЬ)). !!Т!! **Теорема 2.** //Если оператор имеет// $ n=\dim \mathbb V $ //линейно независимых собственных векторов, то в базисе ими образуемом матрица оператора диагональна. Обратно: если матрица оператора в некотором базисе диагональна, то каждый вектор этого базиса является собственным для оператора.// Базис линейного пространства, состоящий из собственных векторов оператора $ \mathcal A_{} $, называется **каноническим**. !!=>!! **[Матричная версия теоремы].** Пусть $ A_{} $ --- квадратная матрица. Неособенная матрица $ C_{} $, удовлетворяющая равенству $$C^{-1} A C= A_{diag} \quad \mbox{ при матрице } A_{diag} \quad \mbox{ - диагональной} $$ существует тогда и только тогда, когда существует базис пространства $ \mathbb C^{n}_{} $, состоящий из собственных векторов матрицы $ A_{} $. Тогда матрица $ C_{} $ является матрицей перехода от стандартного базиса $$ \bigg\{{\mathfrak e}_j = \big[\underbrace{0,\dots,0,1}_{j},0,\dots,0\big]^{\top} \bigg\}_{j=1}^n $$ к каноническому, а на диагонали $ A_{diag} $ стоят собственные числа матрицы $ A_{} $: $$ A_{diag}= \left( \begin{array}{cccc} \lambda_1 & 0 & \dots & 0 \\ 0 & \lambda_2 & \dots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \dots & \lambda_n \end{array} \right) \ . $$ **Доказательство.** Проведем формальное доказательство данного конкретного частного случая. Рассмотрим матричное равенство $$ A C= CA_{diag} $$ при некоторой диагональной матрице $ A_{diag} $. Легко видеть, что оно эквивалентно системе равенств относительно столбцов матрицы $ C_{} $: $$ AC_{[1]}=d_1 C_{[1]},\dots, AC_{[n]}=d_n C_{[n]} \, . $$ Если все столбцы $ \{ C_{[j]} \}_{j=1}^n $ ненулевые, то тогда они являются собственными векторами для матрицы $ A_{} $, а числа $ \{ d_{[j]} \}_{j=1}^n $ --- собственными числами, соответствующими этим собственным векторам. Если матрица $ C_{} $ невырождена, то все ее столбцы линейно независимы. Но тогда они образуют базис пространства $ \mathbb C^n $, состоящий из собственных векторов. Обратное тоже верно. При выполнении условия предыдущего следствия говорят, что матрица $ A_{} $ **диагонализуема** или **приводится к диагональной форме**[[non-derogatory matrix]]. Теорема позволяет сформулировать достаточное условие диагонализуемости. !!Т!! **Теорема 3.** //Если характеристический полином оператора не имеет ((:polynomial#основная_теорема_высшей_алгебры кратных корней)), то матрица оператора диагонализуема.// Для проверки условия теоремы не требуется явного вычисления корней: оно проверяется по коэффициентам характеристического полинома "чисто алгебраически" (т.е. за конечное число элементарных алгебраических операций). Оно эквивалентно отличию от нуля ((:dets:discrim дискриминанта)) характеристического полинома. Это условие не является необходимым, как показывает пример ((:mapping:operator#основные_определения тождественного оператора)). Случай существования кратного корня у характеристического полинома является "пограничным": существуют примеры как диагонализуемых, так и недиагонализуемых матриц. Так, для матриц $$ A= \left( \begin{array}{rr} 0 &1 \\ -1 &2 \end{array} \right) \quad \mbox{ или } \quad A= \left( \begin{array}{cc} 1 &0 \\ 1&1 \end{array} \right) $$ при попытке подобрать матрицу $ C_{} $, удовлетворяющую равенству $$AC=C \left( \begin{array}{cc} \alpha_1 &0 \\ 0 & \alpha_2 \end{array} \right) \qquad npu \ \forall \{\alpha_1 , \alpha_2 \} \subset \mathbb C $$ получим: $ \det C=0 $. В случае наличия у характеристического полинома оператора кратного корня, анализ оператора на возможность диагонализуемости его матрицы усложняется. !!Т!! **Теорема 4.** //Множество собственных векторов оператора, принадлежащих его собственному числу// $ \lambda_{\ast}^{} $ //, дополненное нулевым вектором, образует линейное подпространство пространства// $ \mathbb V_{} $. Это подпространство $$ \mathbb V_{\ast} = \mathcal{K}er (\mathcal A- \lambda_{\ast} \mathcal E) $$ пространства $ \mathbb V_{} $ называется **собственным подпространством оператора, соответствующим** $ \lambda_{\ast}^{} $. Величина $$ \dim (\mathcal{K}er (\mathcal A- \lambda_{\ast} \mathcal E)) $$ называется **геометрической кратностью собственного числа** $ \lambda_{\ast}^{} $. Можно доказать, что геометрическая кратность собственного числа не превосходит ((:polynomial#основная_теорема_высшей_алгебры кратности)) собственного числа в характеристическом полиноме. Для акцентирования различий в определениях двух кратностей, кратность собственного числа в характеристическом полиноме называют еще **алгебраической кратностью собственного числа**. Если оператор (в некотором базисе пространства) задан своей матрицей $ \mathbf A^{} $, то базисные векторы собственного подпространства $ \mathbb V_{\ast} $ вычисляются посредством нахождения фундаментальной системы решений (**ФСР**) системы линейных уравнений $$ (\mathbf A- \lambda_{\ast} E) X=\mathbb O \ . $$ !!Т!! **Теорема 5.** //Матрица оператора диагонализуема тогда и только тогда, когда для каждого ее собственного числа алгебраическая кратность равна геометрической кратности:// $$ \operatorname{dfc} ({\mathbf A}-\lambda_{\ast}\, E)= \mbox{ кратность } \ \lambda_{\ast} . $$ !!?!! Диагонализуема ли матрица оператора $$ \mathcal A (f(x)) = f(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ , $$ рассмотренного в примерах предыдущего пункта? !!П!! **Пример.** Найти все вещественные значения параметра $ {\color{Red}{ \alpha} } $, при которых матрица $$ \left( \begin{array}{rcc} 1 &2\, {\color{Red}{ \alpha} } & {\color{Red}{ \alpha} } -2 \\ -1 &2 &1 \\ 2 & 0 & -3 \end{array} \right) $$ диагонализуема. **Решение.** Характеристический полином $ f(\lambda)=-\lambda^3+3\, \lambda-2\,(3\, {\color{Red}{ \alpha} } -1) $ имеет кратные корни только тогда когда его дискриминант $ \mathcal D(f)=-324\, {\color{Red}{ \alpha} } (3\, {\color{Red}{ \alpha} } -2) $ обращается в нуль. При $ {\color{Red}{ \alpha} } =0 $ корень $ \lambda=-1 $ имеет алгебраическую кратность $ 2_{} $. Найдем дефект матрицы $ A+E $: $$\left( \begin{array}{rrr} 2 &0 & -2 \\ -1 &3 &1 \\ 2 & 0 & -2 \end{array} \right) \ \longrightarrow \ \left( \begin{array}{rrr} 1 &0 & -1 \\ 0 &3 &0 \\ 0 & 0 & 0 \end{array} \right) \ {\color{Red} \Longrightarrow } \ \operatorname{rank} (A+E) =2 \Longrightarrow \operatorname{dfc} (A+E)=1 . $$ Таким образом, геометрическая кратность собственного числа $ \lambda=-1 $ равна $ 1_{} $ и условие теоремы $ 5 $ не выполнено. Оно не будет выполнено и при $ {\color{Red}{ \alpha} } = 2/3 $ (здесь корень $ \lambda=1 $ имеет кратность $ 2_{} $). **Ответ.** Матрица диагонализуема при всех значениях параметра, за исключением $ {\color{Red}{ \alpha} } = 0 $ и $ {\color{Red}{ \alpha} } = 2/3 $. ==== Диагонализуемость матрицы оператора над полем вещественных чисел== В предыдущем пункте мы рассматривали операторы, не всегда акцентируя внимания на поле, над которым они были определены --- над $ \mathbb R_{} $ или над $ \mathbb C_{} $. Сама ((:mapping:operator#собственное_число_и_собственный_вектор теорема существования собственного числа)) гарантирует нам только лишь наличие этих чисел в поле $ \mathbb C_{} $. Как следствие, даже если рассматриваются операторы над полем $ \mathbb R_{} $ (что чаще всего и случается на практике), то существование для них __вещественного__ канонического базиса вовсе не гарантировано. **Задача.** Найти условия диагонализуемости матрицы оператора $ \mathcal A $ над полем вещественных чисел. Необходимое условие следует из теоремы $ 2 $ предыдущего пункта: все собственные числа матрицы должны быть вещественными. Теорема $ 3 $ позволяет сформулировать и достаточный критерий диагонализуемости матрицы оператора $ \mathcal A $ над $ \mathbb R_{} $. !!Т!! **Теорема.** //Если характеристический полином оператора имеет только простые вещественные корни, то матрица оператора диагонализуема над// $ \mathbb R_{} $. Условие различности и вещественности корней произвольного полинома $ f(\lambda)=\lambda^n+a_1\lambda^{n-1}+\dots+ a_n \in \mathbb R[x] $ можно проверить по коэффициентам этого полинома "чисто алгебраически", т.е. за конечное число элементарных алгебраических операций над этими коэффициентами. Воспользуемся, например, теоремой Якоби из раздела ((:polynomial:zero_local#ганкелевы_матрицы_в_теории_локализации_корней ЛОКАЛИЗАЦИЯ КОРНЕЙ ПОЛИНОМА)). По коэффициентам $ a_1,\dots,a_n $ можно определить ((:polynomial:zero_local#ганкелевы_матрицы_в_теории_локализации_корней сумму Ньютона полинома)) $ f(\lambda) $, т.е. величину $$ s_k=\sum_{1\le j \le n} \lambda_j^k \ . $$ Далее, после нахождения всех этих сумм для значений $ k \in \{0,\dots,2n-2\} $, из них составляется ганкелева матрица $$ S=\left[ s_{j+k} \right]_{j,k=0}^{n-1} $$ и вычисляются ее ((:algebra2:dets#теорема_лапласа главные миноры)) $ S_1,\dots, S_{n} $. Для различности всех корней полинома необходимо и достаточно выполнение условия $ S_n \ne 0 $ (этот минор совпадает с ((:dets:discrim#представление_дискриминанта_посредством_ганкелевой_матрицы дискриминантом)) $ \mathcal D(f) $ полинома $ f(\lambda) $); для различности и вещественности всех корней необходимо и достаточно, чтобы были выполнены неравенства $$ S_1\ge 0,\dots,S_{n-1} \ge 0,S_n > 0 \ . $$ !!П!! **Пример.** Найти все вещественные значения параметра $ {\color{Red}{ \alpha} } $, при которых матрица $$ \left( \begin{array}{rcc} 1 &2\, {\color{Red}{ \alpha} } & {\color{Red}{ \alpha} } -2 \\ -1 &2 &1 \\ 2 & 0 & -3 \end{array} \right) $$ диагонализуема над $ \mathbb R_{} $. **Решение.** На основании теоремы нам нужно установить условия вещественности корней характеристического полинома $ f(\lambda)=-\lambda^3+3\, \lambda-2\,(3\, {\color{Red}{ \alpha} } -1) $. Вычисляем суммы Ньютона: $ s_0=3,\ s_1= 0, \ s_2=6, \ s_3=18\, {\color{Red}{ \alpha} } -6, \ s_4=18 $, составляем матрицу: $$ S=\left(\begin{array}{ccc} 3 & 0 & 6 \\ 0 & 6 & 18\, {\color{Red}{ \alpha} } -6 \\ 6 & 18\, {\color{Red}{ \alpha} } -6 & 18 \end{array} \right) $$ и вычисляем ее главные миноры: $$S_1=3,\ S_2=18, \ S_3=-324\, {\color{Red}{ \alpha} } \, (3\, {\color{Red}{ \alpha} } -2)=\mathcal D(f) \ . $$ При $ {\color{Red}{ \alpha} } \ne 0 $ и $ {\color{Red}{ \alpha} } \ne 2/3 $ все собственные числа различны, условие теоремы выполняется при $ {\color{Red}{ \alpha} } \in ]0,\, 2/3[ $. Граничные точки последнего интервала следовало бы исследовать отдельно: хотя этим значениям параметра и соответствует случай кратных вещественных корней характеристического полинома, но матрица $ A_{} $ может оказаться диагонализуемой на основании теоремы 5 предыдущего пункта. Но при решении примера в предыдущем пункте мы уже установили, что это условие не выполняется. **Ответ.** Матрица диагонализуема над $ \mathbb R_{} $ при $ {\color{Red}{ \alpha} } \in ]0,\, 2/3[ $. Примером гарантировано диагонализуемых над $ \mathbb R_{} $ матриц являются вещественные симметричные матрицы. См. ((:algebra2:symmetric#диагонализуемость ЗДЕСЬ)). === Жорданова нормальная форма== Если матрица оператора оказывается недиагонализуемой над $ \mathbb C_{} $, то к какому простейшему виду ее можно привести ? --- Этим видом является, например, ((:mapping:operator:jordan ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА)). ==Задачи== ((:mapping:operator:problems ЗДЕСЬ)). ==Источники== [1]. **Гантмахер Ф.Р.** //Теория матриц.// 4-е изд. М.Наука. 1988. [2]. **Фаддеев Д.К., Фаддеева В.Н.** //Вычислительные методы линейной алгебры.// М.ГИФМЛ.1960 [3]. **Хорн Р.**, **Джонсон Ч.** //Матричный анализ//. М.Мир.1989 [4]. **Мишина А.П., Проскуряков И.В.** //Высшая алгебра.// М.Наука. 1965