Вспомогательная страница к пункту ☞ РАССТОЯНИЕ ОТ ТОЧКИ ДО ЛИНЕЙНОГО МНОГООБРАЗИЯ
Теорема [1]. Расстояние от точки $ X_{0} \in {\mathbb R}^{n} $ до линейного многообразия в $ {\mathbb R}_{}^{n} $, заданного системой уравнений
$$ \left\{ \begin{array}{ccc} c_{11}x_1+c_{12}x_2+\dots+c_{1n}x_n &=& h_1 \\ \dots & & \dots \\ c_{m1}x_1+c_{m2}x_2+\dots+c_{mn}x_n &=& h_m \end{array} \right. \quad \iff $$ $$ \iff \quad CX={\mathcal H} \quad npu \quad C=\left( \begin{array}{cccc} c_{11}& c_{12} & \dots & c_{1n} \\ \dots & & & \dots \\ c_{m1}& c_{m2} & \dots & c_{mn} \end{array} \right)_{m\times n} ,\ {\mathcal H} =\left( \begin{array}{c} h_1 \\ \vdots \\ h_m \end{array} \right),\ X=\left( \begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array} \right) $$ вычисляется по формуле $$ d= \sqrt{-\frac{\det \left( \begin{array}{cc} C\cdot C^{\top} & CX_0- {\mathcal H} \\ (CX_0- {\mathcal H})^{\top} & 0 \end{array} \right) }{\det(C\cdot C^{\top})}} \ . $$ Здесь предполагается, что $ \operatorname{rank}(C)=m<n $.
Доказательство формально коррелирует с приведенным в [1], но я даю ему геометрическую интерпретацию1). Согласно общему результату о расстоянии от точки евклидова пространства до линейного многообразия, минимум расстояний от $ X_{0} $ до точек многообразия $ CX= {\mathcal H} $ равен длине ортогональной составляющей вектора $ X_0-Y $ относительно подпространства $ CX= \mathbb O $; здесь $ Y_{} $ означает произвольную точку многообразия, т.е. частное решение системы линейных уравнений: $ CY= {\mathcal H} $. Обозначим эту ортогональную составляющую через $ (X_0-Y)^{\bot} $. По определению, ортогональная составляющая вектора относительно подпространства ортогональна любому вектору этого подпространства, т.е. принадлежит ортогональному дополнению этого подпространства в пространстве $ \mathbb R_{}^n $. Каждое уравнение $$ c_{j1}x_1+c_{j2}x_2+\dots+c_{jn}x_n = 0 \ ,$$ задающее это подпространство, можно рассматривать как скалярное произведение $ j_{} $-й строки матрицы $ C_{} $ на вектор пространства: $$\langle\left[C^{[j]}\right]^{\top},X \rangle=0 \ . $$ Здесь приходится навешивать знак транспонирования, чтобы иметь согласование в пространстве векторов $ \mathbb R_{}^n $ — мы договорились рассматривать их $ n_{} $-компонентными столбцами. Получается, что ортогональное дополнение нашего подпространства получается как линейная оболочка транспонированных строк матрицы $ C_{} $: $ \mathcal L(\left[C^{[1]}\right]^{\top},\left[C^{[2]}\right]^{\top},\dots,\left[C^{[m]}\right]^{\top}) $. Любой вектор из этого ортогонального дополнения должен линейно выражаться через образующие эту оболочку векторы; это утверждение справедливо и для вектора $ (X_0-Y)^{\bot} $: $$ (X_0-Y)^{\bot} =\lambda_1 \left[C^{[1]}\right]^{\top}+\lambda_2 \left[C^{[2]}\right]^{\top}+\dots+ \lambda_m \left[C^{[m]}\right]^{\top} \ npu \ \{\lambda_1,\lambda_2,\dots,\lambda_m\} \subset \mathbb R \ . $$ Переписываем в матричном виде: $$ (X_0-Y)^{\bot} = C^{\top} \left[\begin{array}{c} \lambda_1 \\ \lambda_2 \\ \vdots \\ \lambda_m \end{array} \right] \ . $$ Домножаем обе части скалярно на $ \left[C^{[j]}\right]^{\top} $. В левой части получаем: $$ \langle \left[C^{[j]}\right]^{\top}, (X_0-Y)^{\bot} \rangle =C^{[j]}(X_0-Y)^{\bot} = C^{[j]}(X_0-Y) \quad npu \quad j\in \{1,\dots,m \} \ . $$ Последнее равенство следует из того, что $ X_0-Y=(X_0-Y)^{\bot}+(X_0-Y)^{^{\parallel}} $ при векторе $ (X_0-Y)^{^{\parallel}} $ означающем ортогональную проекцию вектора $ X_0-Y $ на многообразие; эта проекция ортогональна векторам $ \left[C^{[j]}\right]^{\top} $. Объединяем получившиеся равенства в одно матричное: $$ C(X_0-Y) =C \cdot C^{\top} \left[\begin{array}{c} \lambda_1 \\ \lambda_2 \\ \vdots \\ \lambda_m \end{array} \right] \ \quad \iff \quad CX_0- \mathcal H = C \cdot C^{\top} \left[\begin{array}{c} \lambda_1 \\ \lambda_2 \\ \vdots \\ \lambda_m \end{array} \right] . $$ На основании свойств определителя Грама при сделанном предположении относительно ранга матрицы $ C_{} $ имеем: $$ \det ( C\cdot C^{\top}) \ne 0 \ $$ и, следовательно, в правой части последнего равенства стоит неособенная матрица. Выражаем из этого равенства столбец параметров: $$ \left[\begin{array}{c} \lambda_1 \\ \lambda_2 \\ \vdots \\ \lambda_m \end{array} \right]=( C\cdot C^{\top})^{-1} (CX_0-\mathcal H) $$ и подставляем в выражение для квадрата длины вектора $ (X_0-Y)^{\bot} $: $$ |(X_0-Y)^{\bot} |^2=\langle (X_0-Y)^{\bot} ,(X_0-Y)^{\bot} \rangle= ((X_0-Y)^{\bot})^{\top}(X_0-Y)^{\bot} = [\lambda_1,\lambda_2,\dots,\lambda_m] C \cdot C^{\top} \left[\begin{array}{c} \lambda_1 \\ \lambda_2 \\ \vdots \\ \lambda_m \end{array} \right]= $$ (матрица $ C\cdot C^{\top} $ — симметричная) $$ =(CX_0-\mathcal H)^{\top} (C \cdot C^{\top})^{-1} C \cdot C^{\top} (C \cdot C^{\top})^{-1} (CX_0-\mathcal H)=(CX_0-\mathcal H)^{\top} (C \cdot C^{\top})^{-1} (CX_0-\mathcal H) \ . $$ Таким образом, $$ d=|(X_0-Y)^{\bot} |=\sqrt{(CX_0-\mathcal H)^{\top} (C \cdot C^{\top})^{-1} (CX_0-\mathcal H)} \ . $$ Осталось дело за малым: показать эквивалентность полученного представления для расстояния тому, что заявлено в утверждении теоремы. Для этого воспользуемся формулой вычисления окаймленного определителя: $$ \left| \begin{array}{cc} C\cdot C^{\top} & CX_0- {\mathcal H} \\ (CX_0- {\mathcal H})^{\top} & 0 \end{array} \right|_{(m+1)\times(m+1)}= \left\{0-(CX_0- {\mathcal H})^{\top} \left( C\cdot C^{\top} \right)^{-1} (CX_0- {\mathcal H}) \right\} \det \left( C\cdot C^{\top} \right) \ . $$ Отдельно надо бы проверить, что подкоренное выражение неотрицательно — так, на всякий случай. На основании свойств определителя Грама, матрица $ C_{}\cdot C^{\top} $ — положительно определенная. Тогда $ \left( C\cdot C^{\top} \right)^{-1} $ — тоже положительно определенная2). Но тогда выражение $ Z^{\top} \left( C\cdot C^{\top} \right)^{-1} Z $ положительно для всех ненулевых столбцов $ Z\in \mathbb R^n $. ♦
[1]. Чезаро Э. Элементарный учебник алгебраического анализа и исчисления бесконечно малых. c.360-361