==Псевдообратная матрица==
В настоящем разделе все матрицы предполагаются вещественными.
===Происхождение==
Рассмотрим систему линейных уравнений относительно неизвестных $ x_1,\dots, x_n $ ((:algebra2/linearsystems#matrichnaja_forma_zapisi в матричной форме записи)):
$$ AX= \mathcal B ; $$
здесь $ A\in \mathbb R^{m\times n}, \mathcal B \in \mathbb R^{m\times 1}, X=(x_1,\dots,x_n)^{\top} $. При $ m > n $
система является переопределенной: число уравнений превышает число неизвестных. Такая система, как правило, ((:algebra2/linearsystems#teorema_kronekera-kapelli несовместна)). Однако если домножить ее слева на матрицу $ A^{\top} $, то новая система
$$ A^{\top}X= A^{\top} \mathcal B $$
становится совместной, и, как правило, имеет единственное решение. Доказательство последнего факта основано на свойстве матрицы $ A^{\top} A $. Эта симметричная матрица имеет неотрицательный определитель
$$ \det ( A^{\top} A) \ge 0 \, , $$
(см. теорему $ 2 $ в пункте
☞
((:algebra:dets:binet_cauchy ТЕОРЕМА БИНЕ-КОШИ))).
При дополнительном условии $ \operatorname{rank} (A) =n $ (которое при случайном выборе матрицы $ A $ выполняется с вероятностью $ 1 $, см. комментарий в пункте ((:algebra2/linearsystems#teorema_kronekera-kapelli Теорема Кронекера-Капелли))), этот определитель строго больше нуля. И в этом последнем случае единственное решение новой системы можно представить в виде
$$
X_{\ast}=\left(A^{\top}A\right)^{-1} A^{\top} \mathcal B \, .
$$
Это решение известно как ((:interpolation/mnk#psevdoreshenie_sistemy_linejnyx_uravnenij псевдорешение)) системы $ AX= \mathcal B $ и оно является решением задачи
$$
\min_
{X\in \mathbb R^n} \| AX-\mathcal B \|^2 \, .
$$
Грубо говоря: если уж исходная система не имеет решения в традиционном смысле, то будем искать вектор $ X_{\ast} $, который "минимизирует ошибку", т.е. отклонение вектора $ AX $ от $ \mathcal B $. Матрица, участвующая в записи псевдорешения называется **псевдообратной матрицей (Мура-Пенроуза)**[[(//англ.)// pseudoinverse или Moore-Penrose inverse]] к матрице $ A_{} $, она обозначается $ A^{+} $:
$$ A^{+}=(A^{\top}A)^{-1} A^{\top} \quad \mbox{при} \ A\in \mathbb R^{m\times n}, \ m>n=
\operatorname{rank} (A) \, .
$$
Очевидно, что эта матрица является ((:algebra2/inverse#obratnaja_matrica левой обратной матрицей)) к матрице $ A $:
$$
A^{+}A=E_{n} \, ,
$$
где $ E_n $ --- единичная матрица порядка $ n $.
!!П!! **Пример.** Найти $ A^{+} $ для
$$ A= \left( \begin{array}{cc}
1 & 0 \\
0 & 1 \\
1 & 1
\end{array}
\right) \ .
$$
**Решение.**
$$
A^{\top}= \left( \begin{array}{ccc}
1 & 0 & 1 \\
0 & 1 & 1
\end{array}
\right) \quad \Rightarrow \quad A^{\top} \cdot A =
\left( \begin{array}{cc}
2 & 1 \\
1 & 2
\end{array}
\right) \quad \Rightarrow
\quad (A^{\top} \cdot A)^{-1} =
\left( \begin{array}{cc}
2/3 & -1/3 \\
-1/3 & 2/3
\end{array}
\right)
\ \Rightarrow
$$
$$
\Rightarrow \ A^{+} = (A^{\top} \cdot A)^{-1} A^{\top} =
\left( \begin{array}{rrr}
2/3 & -1/3 & 1/3 \\
-1/3 & 2/3 & 1/3
\end{array}
\right) \ .
$$
При этом
$$
A^{+} \cdot A =
\left( \begin{array}{cc}
1 & 0 \\
0 & 1
\end{array}
\right),\quad A \cdot A^{+} =
\left( \begin{array}{rrr}
2/3 & -1/3 & 1/3 \\
-1/3 & 2/3 & 1/3 \\
1/3 & 1/3 & 2/3
\end{array}
\right) \ ,
$$
т.е. матрица $ A^{+} $ не является ((:algebra2/inverse#obratnaja_matrica правой обратной)) для матрицы $ A_{} $.
♦
Рассмотрим теперь противоположный случай: количество столбцов матрицы $ A $ больше количества ее строк, т.е. $ n > m $. Система $ AX= \mathcal B $ с такой матрицей, как правило, совместна и имеет бесконечное множество решений. Действительно, ранг случайно выбранной матрицы такого порядка равен $ m $ с вероятностью $ 1 $, но тогда, в соответствии с теоремой
((:algebra2/linearsystems#teorema_kronekera-kapelli Кронекера-Капелли)), система $ AX=\mathcal B $ имеет бесконечное множество решений. Одно, частное, решение может быть представлено в виде
$$
X_{\ast}= A^{\top} \left(A\cdot A^{\top}\right )^{-1} \mathcal B \, .
$$
Действительно, $ \det \left(A\cdot A^{\top}\right ) > 0 $ (снова см. теорему $ 2 $ в пункте
☞
((:algebra:dets:binet_cauchy ТЕОРЕМА БИНЕ-КОШИ))). Поэтому обратная матрица в формуле существует. Подстановка $ X=X_{\ast} $ в систему приводит к верному равенству. Матрица
$$
A^{+}=A^{\top} \left(A\cdot A^{\top}\right )^{-1} \quad \mbox{при} \ A\in \mathbb R^{m\times n}, \ n>m=
\operatorname{rank} (A)
$$
называется **псевдообратной матрицей (Мура-Пенроуза)** к матрице $ A $. Очевидно, что эта матрица является ((:algebra2/inverse#obratnaja_matrica правой обратной матрицей)) к матрице $ A $:
$$
A \cdot A^{+} =E_{m} \, ,
$$
где $ E_m $ --- единичная матрица порядка $ m $.
!!П!! **Пример 2.** Найти $ A^{+}({\color{Red}{ \alpha} }) $ для
$$
A({\color{Red}{ \alpha} })=\left[ \begin {array}{cccc} 1&-2&1&2\\ 1&1&-2&2
\\ 2&{\color{Red}{ \alpha} } &-1&4\end {array} \right] \quad \mbox{где} \ {\color{Red}{ \alpha} } \in \mathbb R \, .
$$
**Решение.**
$$
A^{+}({\color{Red}{ \alpha} })=A^{\top}({\color{Red}{ \alpha} }) \left(A({\color{Red}{ \alpha} })\cdot A^{\top}({\color{Red}{ \alpha} })\right )^{-1}=\frac{1}{{\color{Red}{ \alpha} }+1}
\left[ \begin {array}{ccc} \frac{2}{15}\,{\color{Red}{ \alpha} }-\frac{1}{15} &\frac{1}{15}{\color{Red}{ \alpha} }-\frac{2}{15}&\frac{1}{5}
\\ -1&-1&1\\ \frac{1}{3}{\color{Red}{ \alpha} }-\frac{2}{3}&-\frac{1}{3}{\color{Red}{ \alpha} }
-\frac{4}{3}&1\\ \frac {4}{15}\,{\color{Red}{ \alpha} }-\frac{2}{15}&\frac{2}{15}\,{\color{Red}{ \alpha} }-
\frac{4}{15}&\frac{2}{5}\end {array} \right] \quad \mbox{при} \ {\color{Red}{ \alpha} }\ne -1 \, .
$$
Но вот случай $ {\color{Red}{ \alpha} }= -1 $ не покрывается полученной формулой.
♦
Наконец, в случае квадратной матрицы $ A\in \mathbb R^{n\times n} $ ранга $ n $ (что эквивалентно $ \det A \ne 0 $) псевдообратная матрица определяется любой из двух указанных формул, и, легко видеть, что в этом случае она совпадает с обратной к матрице $ A $:
$$
A^{+}=A^{-1} \quad \mbox{при} \ A\in \mathbb R^{n\times n}, \ n=
\operatorname{rank} (A) \, .
$$
Рассмотренные выше определения относятся к случаю матрицы $ A $ **полного ранга**, т.е. матрицы, удовлетворяющей условию
$$
\operatorname{rank} (A) = \min \{m,n\} \, .
$$
Осталось рассмотреть случай когда это условие нарушается.
===Существование==
!!Т!! **Теорема 1.**// Для любой матрицы// $ A \in \mathbb R^{m\times n} $ //существует единственная псевдообратная матрица// $ A^{+}\in \mathbb R^{n\times m} $, т.е. матрица, удовлетворяющая следующим условиям
1.
$ A\cdot A^{+} \cdot A = A $;
2.
$ A^{+} \cdot A \cdot A^{+} = A^{+} $;
3.
матрица $ A\cdot A^{+} $ симметрична: $ (A\cdot A^{+})^{\top} = A \cdot A^{+} $.
4.
матрица $ A^{+} A $ симметрична: $ (A^{+} A )^{\top} =A^{+} A $.
===Вычисление==
!!Т!! **Теорема 2.** //Пусть матрица// $ A\in \mathbb R^{m\times n} $ //имеет ранг// $ \mathfrak r $ //и ее ((:algebra2/rank#rangovaja_faktorizacija ранговое разложение)) имеет вид//
$$ A=CF \quad \mbox{при} \ C\in \mathbb R^{m \times \mathfrak r},\ F\in \mathbb R^{\mathfrak r \times n}, \operatorname{rank} (C)= \operatorname{rank} (F) = \mathfrak r \, .$$
//Тогда//
$$
A^{+}=F^{+}C^{+}=F^{\top} \left( F \cdot F^{\top} \right)^{-1} \left(C^{\top} C \right)^{-1} C^{\top}
$$
Фактически эта теорема сводит вычисление псевдообращения к случаю матриц полного ранга --- тех, что рассмотрены ((#proisxozhdenie ВЫШЕ)).
!!П!! **Пример 3.** Найти $ A^{+} ({\color{Red}{ \alpha} }) $ для матрицы примера 2 в случае ${\color{Red}{ \alpha} }=-1 $.
**Решение.** Ранговое разложение матрицы $ A(-1) $ имеет вид (см.решение
☞
((:algebra2/rank#rangovaja_faktorizacija ПРИМЕРА )))
$$
A(-1)=CF \quad \mbox{при} \
C=
\left[ \begin {array}{rr} 1&-2\\1&1
\\ 2&-1\end {array} \right],\ F=\left[ \begin {array}{cccc} 1&0&-1&2\\ 0&1&-1&0
\end {array} \right] \, .
$$
Теперь применяем теорему
$$
C^{\top} C =\left[ \begin{array}{rr} 6 & -3 \\ -3 & 6 \end{array} \right] \ \Rightarrow \ (C^{\top} C)^{-1}=\frac{1}{9}
\left[ \begin{array}{rr} 2 & 1 \\ 1 & 2 \end{array} \right] \ \Rightarrow \ С^{+}= \left(C^{\top} C \right)^{-1} C^{\top}
=\frac{1}{3}
\left[ \begin{array}{rr} 0 & 1 & 1 \\ -1 & 1 & 0 \end{array} \right]
$$
Аналогично
$$
F^{+}=F^{\top} \left( F \cdot F^{\top} \right)^{-1}=\frac{1}{11}
\left[ \begin {array}{rr} 2&-1\\ -1 &6\\ -1&-5
\\ 4&-2\end {array} \right]
$$
и
$$
A^{+}(-1) =
\frac{1}{33}
\left[ \begin {array}{rrr}
1&1&2\\
-6&5&-1\\
5&-6&-1\\
2&2&4
\end{array}
\right]
$$
♦
===Вычисление посредством сингулярного разложения==
Псевдообратная к произвольной матрице $ A \in \mathbb R^{m\times n} $ (без ограничения на ее ранг) может быть вычислена с помощью ((:algebra2/svd#singuljarnoe_razlozhenie сингулярного разложения)). Обозначим ненулевые сингулярные числа матрицы $ A $ ранга $ \mathfrak r $ через $ \{\sigma_j\}_{j=1}^{\mathfrak r} $, а соответствующие левые и правые сингулярные векторы через $ \{U_{[j]}\}_{j=1}^{\mathfrak r} $ и $ \{V_{[j]}\}_{j=1}^{\mathfrak r} $. Вектора каждой из систем предполагаются ортонормированными. Тогда
сингулярное разложение матрицы имеет вид
$$
A=\sum_{j=1}^{\mathfrak r} \sigma_j U_{[j]} V_{[j]}^{\top} \, .
$$
а
$$
A^{+}=\sum_{j=1}^{\mathfrak r} \frac{1}{\sigma_j} V_{[j]} U_{[j]}^{\top} \, .
$$
Проверим этим методом ответ в примере предыдущего пункта.
!!П!! **Пример 4.** Найти $ A^{+} ({\color{Red}{ \alpha} }) $ для матрицы примера 2 в случае ${\color{Red}{ \alpha} }=-1 $.
**Решение.** Будем записывать матрицу $ A(-1) $ без указания аргумента
$$
A=\left[ \begin {array}{cccc} 1&-2&1&2\\ 1&1&-2&2
\\ 2&-1&-1&4\end {array} \right] \, .
$$
$$
A\cdot A^{\top} =
\left[ \begin {array}{rrr} 10&1&11\\ 1&10&11
\\ 11&11&22\end {array} \right]
$$
$$
\det(A\cdot A^{\top}-\lambda E)\equiv - \lambda (\lambda-9)(\lambda - 33) \ ;
$$
таким образом $ \sigma_1=\sqrt{33}, \sigma_2=3, \sigma_3=0 $. Левые сингулярные векторы --- собственные для матрицы $ A\cdot A^{\top} $:
$$
U_{[1]}=\left[
\begin{array}{c}
1/\sqrt{6} \\
1/\sqrt{6} \\
2/\sqrt{6}
\end{array}
\right], \
U_{[2]}=\left[
\begin{array}{r}
-1/\sqrt{2} \\
1/\sqrt{2} \\
0
\end{array}
\right] ;
$$
правые получаются из них по правилу $ V_{[j]}=A^{\top} U_{[j]}/\sigma_j $
$$
V_{[1]}=\left[
\begin{array}{r}
2/\sqrt{22} \\
-1/\sqrt{22} \\
-1/\sqrt{22} \\
4/\sqrt{22} \\
\end{array}
\right], \
V_{[2]}=\left[
\begin{array}{r}
0 \\
1/\sqrt{2} \\
-1/\sqrt{2} \\
0 \\
\end{array}
\right] \, .
$$
Таким образом,
$$
A^{+}=\frac{1}{\sigma_1} V_{[1]}U_{[1]}^{\top}+ \frac{1}{\sigma_2} V_{[2]}U_{[2]}^{\top} =
\frac{1}{33}
\left[ \begin {array}{rrr} 1&1&2\\ -6&5&-1
\\ 5&-6&-1\\ 2&2&4\end {array}
\right]
$$
♦
Способ вычисления псевдообращения, основанный на сингулярном разложении матрицы, в некоторых источниках упоминается как вычислительно эффективный. Лично у меня это утверждение вызывает сомнения. Сравним решения примеров 3 и 4. Псевдообратная матрица является "рациональной функцией" матрицы $ A $ (т.е. элементы $ A^{+} $ являются рациональными функциями элементов матрицы $ A $), причем рациональной функцией с целочисленными коэффициентами. Вместе с тем, решение примера 4 выводит в область иррациональных чисел. И это еще не самый плохой случай: для матриц порядков $ > 4 $ с элементами рациональными не приходится ожидать представления сингулярных чисел хотя бы и в радикалах... Придется ограничиваться приближенными их значениями --- и это при том, что конечный ответ обязан быть представим в рациональных числах! А уж о случаях, когда матрица зависит от параметров ужасает даже сама мысль о сингулярных числах! m(
===Применения==
====Решение систем линейных уравнений==
!!Т!! **Теорема 3.** //Для системы линейных уравнений//
$$AX=\mathcal B , \ A\in \mathbb R^{m\times n}, \ \mathcal B \in \mathbb R^m $$
//относительно столбца неизвестных// $ X=(x_1,\dots x_n)^{\top} $ //столбец//
$$ X_{\ast} =A^{+} \mathcal B $$
//является ((:interpolation/mnk#psevdoreshenie_sistemy_linejnyx_uravnenij псевдорешением)). Система// $AX=\mathcal B $ //совместна (в ((:algebra2/linearsystems#sistemy_linejnyx_uravnenij традиционном смысле))) тогда и только тогда, когда//
$$ A \cdot A^{+} \mathcal B = \mathcal B \, . $$
//При выполнении этого условия, общее решение системы записывается в виде//
$$
X=A^{+} \mathcal B + (E_n-A^{+}A)Y \quad \mbox{при произвольном столбце } \ Y\in \mathbb R^n \, .
$$
**Доказательство** первой части теоремы производится прямой подстановкой $ X=X_{\ast} $ в нормальную систему
$$
\left[A^{\top}A \right]X=A^{\top} {\mathcal B}
$$
и проверкой равенства $ A^{\top} A \cdot A^{+} = A^{\top} $ с помощью теоремы 2.
♦
!!П!!** Пример 5.** Найти общее решение системы уравнений
$$
\left\{\begin{array}{rrrr}
x_1 & + 2\,x_2 & +3\, x_3 &=3, \\
-x_1 & + x_2 & &=5.
\end{array}
\right.
$$
**Решение.** Здесь
$$
A=\left( \begin{array}{rrr}
1 & 2 & 3 \\
-1 & 1 & 0
\end{array}
\right) \ \Rightarrow \ A\cdot A^{\top}=
\left( \begin{array}{rr}
14 & 1 \\
1 & 2
\end{array}
\right)
\ \Rightarrow \ \left(A\cdot A^{\top}\right)^{-1} =
\left( \begin{array}{rr}
2/27 & -1/27 \\
-1/27 & 14/27
\end{array}
\right) \ \Rightarrow
$$
$$
\ \Rightarrow
A^{+}= A^{\top} (A\cdot A^{\top})^{-1}=
\left( \begin{array}{rr}
1/9 & -5/9 \\
1/9 & 4/9 \\
2/9 &-1/9
\end{array}
\right) \ \Rightarrow \
$$
$$
\ \Rightarrow
A^{+}\mathcal B = \left( \begin{array}{r}
-22/9 \\
23/9 \\
1/9
\end{array}
\right) \ ,
A^{+}A=
\left( \begin{array}{rrr}
2/3 & -1/3 & 1/3 \\
-1/3 & 2/3 & 1/3 \\
1/3 & 1/3 & 2/3
\end{array}
\right) \ \Rightarrow
$$
$$
X= \left( \begin{array}{r}
-22/9 \\
23/9 \\
1/9
\end{array}
\right) + \frac{1}{3} (y_1+y_2-y_3) \left( \begin{array}{r}
1 \\
1 \\
-1
\end{array}
\right)
$$
Столбец $ [1,1,-1]^{\top} $ составляет ((:algebra2/linearsystems#sistema_odnorodnyx_uravnenij фундаментальную систему решений)) однородной системы
$$
\left\{\begin{array}{rrrr}
x_1 & + 2\,x_2 & +3\, x_3 &=0, \\
-x_1 & + x_2 & &=0.
\end{array}
\right.
$$
♦
====Расстояние до линейных многообразий==
!!Т!! **Теорема.** //Ближайшая (в стандартной евклидовой метрике) к точке// $ X_{0} \in \mathbb R^n $// точка многообразия//
$$
\mathbb M= \{ Y_0+\lambda_1 Y_1+\dots+\lambda_k Y_k \quad \mid \quad
\{\lambda_1,\dots,\lambda_k\} \subset {\mathbb R} \}
$$
//при фиксированных линейно независимых столбцах//
$$ \{Y_0,Y_1,\dots,Y_k \}\subset {\mathbb R}^n$$
//определяется по формуле//
$$
X_{\ast}=Y_0+ L\cdot L^{+} (X_0-Y_0) \, .
$$
//Здесь//
$$
L=\left[ Y_1|\dots|Y_k \right]_{n\times k} \, ,
$$
//а// $ |_{} $ //означает ((:algebra2#конкатенация конкатенацию))//.
**Доказательство**
☞
((:algebra2/optimiz/distance/vspom6 ЗДЕСЬ)).
===Свойства==
====Непрерывность==
Хотя псевдообратная матрица $ A^{+} $ существует всегда, и зависит от элементов матрицы $ A $ посредством рациональных функций, непрерывность этой зависимости не гарантирована. См. решение примеров 2 и 3. Матрица
$A^{+} ({\color{Red}{ \alpha} }) $ существует при всех значениях параметра, но
$$ \lim_{ {\color{Red}{ \alpha} } \to -1} A^{+} ({\color{Red}{ \alpha} }) $$
не существует.
====Оптимизационная задача==
Оба произведения $ A \cdot A^{+} $ и $ A^{+} A $ определены, но при этом может случиться, что ни одно не совпадает с единичной матрицей. Иными словами, $ A^{+} $ может не оказаться ни левой обратной матрицей, ни правой обратной для матрицы $ A $. Тем не менее,
$ A^{+} $ оказывается, образно говоря, "наилучшим приближением" обратной матрицы: если уж невозможно найти обратную матрицу для матрицы $ A \in \mathbb R^{m\times n} $, давайте найдем хотя бы такую матрицу $ X_{n\times m} $, чтобы отклонение произведения $ A\cdot X $ от единичной матрицы $ E_m $, вычисленное как квадрат расстояния между матрицами $ A\cdot X $ и $ E_m $, было бы минимальным.
!!Т!! **Теорема.** //Псевдообратная матрица// $ A^{+} $ //является решением двух задач минимизации//
$$ \mbox{(a)} \quad \min_{X\in \mathbb R^{n\times m}} ||AX-E_m||^2 $$
$$ \mbox{(b)} \quad \min_{Y\in \mathbb R^{n\times m}} ||YA-E_n||^2 \, . $$
//где// $ || \cdot || $ //означает ((:norm_space#норма_матрицы евклидову норму)) (норму Фробениуса) матрицы//.
**Доказательство** может быть произведено с использованием сингулярных разложений матриц $ A $ и $ A^{+} $. В обозначения
☞
((#vychislenie_posredstvom_singuljarnogo_razlozhenija ПУНКТА)):
$$
A=\sum_{j=1}^{\mathfrak r} \sigma_j U_{[j]} V_{[j]}^{\top} \, , \
A^{+}=\sum_{j=1}^{\mathfrak r} \frac{1}{\sigma_j} V_{[j]} U_{[j]}^{\top}
$$
Тогда
$$ A\cdot A^{+} - E_m = - \sum_{j=\mathfrak r +1}^m U_{[j]} U_{[j]}^{\top} \ ; $$
здесь столбцы $ \{U_{[j]}\}_{j=\mathfrak r +1}^m $ --- произвольные такие, чтобы система $ \{U_{[j]}\}_{j=1}^m $ составляла ортнонормированный базиc $ \mathbb R^m $. И, вдобавок, воспользовались решением
☞
((:algebra2/ort_matrix/problems#zadachi УПРАЖНЕНИЯ)).
Тогда
$$ \operatorname{Sp} \left[ \left( A\cdot A^{+} - E_m \right)^{\top} \left( A\cdot A^{+} - E_m \right) \right] = m-\mathfrak r
$$
и $ \| A\cdot A^{+} - E_m \| = \sqrt{m-\mathfrak r} $.
Аналогично доказывается, что $ \| A^{+} A - E_n \| = \sqrt{n-\mathfrak r} $.
♦