== Квадратичная форма ==
$ \mathbb A_{} $ означает одно из множеств: $ \mathbb Q_{} $ рациональных, или $ \mathbb R_{} $ вещественных, или $ \mathbb C_{} $ ((:complex_num комплексных)) чисел.
~~TOC~~
===Определение==
**Квадратичной формой над множеством** $ \mathbb A_{} $ называют ((:polynomialm#однородный_полином однородный полином)) второй степени с коэффициентами из $ \mathbb A_{} $; если переменные обозначить
$ x_1,\dots,x_{n} $, то общий вид квадратичной формы от этих переменных:
$$
f(x_1,\dots,x_{n} )= \sum_{1\le j \le k \le n} f_{jk}x_jx_k=
$$
$$\begin{array}{llll}
\displaystyle=
f_{11}x_1^2&+f_{12}x_1x_2&+ \dots & +f_{1n}x_1x_n+ \\
&+f_{22}x_2^2 &+ \dots & +f_{2n}x_2x_n+ \\
&+\dots & & +\dots + \\
& & +f_{jk}x_jx_k & + \dots+ \\
& & &+f_{nn}x_n^2.
\end{array}
$$
!!П!! **Пример.** Функции
$$x_1^2-x_1x_2+x_3^2 \, , \quad \sqrt{3}\, x_2^2 - \pi\, x_3^2
\, , \quad -x_1x_2 \, , \quad \mathbf i \, x_1^2$$
являются квадратичными формами. Функции
$$x_1^2-3\, x_1+1 \, , \quad 5\, x_1^2x_2^2 \, , \quad \frac{x_1x_3^2}{x_2}
\, , \quad \sqrt{x_1x_2x_3x_4} $$
не являются квадратичными формами.
Заметим, что в выражении для квадратичной формы присутствуют как квадраты переменных $ x_1^2,\dots,x_n^2 $ так и их смешанные произведения $ x_j x_k $. Говорят, что квадратичная форма $ f(x_1,\dots,x_{n} ) $ имеет **канонический вид** если
$$f(x_1,\dots,x_{n} )\equiv f_{11}x_1^2+f_{22}x_2^2+\dots+f_{nn}x_n^2 \quad npu \quad \left\{f_{jj}\right\}_{j=1}^n \subset \mathbb A \ , $$
т.е. все коэффициенты при смешанных произведениях переменных равны нулю; в этом случае говорят также, что форма является "суммой квадратов"[[На самом деле эти квадраты еще домножены на
константы, но ..., словом, говорят так, как говорят!]].
Оказывается, что в __любой__ квадратичной форме можно так сгруппировать входящие в нее одночлены, что в результате получится ее (эквивалентное) представление в виде суммы квадратов.
!!П!! **Пример.**
$$ 2\, x_1^2+4\, x_1x_2 +x_2^2 \equiv 2\, (x_1+x_2)^2-x_2^2 \equiv -2\,x_1^2 + (2\,x_1+x_2)^2 \ ; $$
$$ x_1^2+2 \mathbf i x_1x_2 - x_2^2 \equiv (x_1+ \mathbf i x_2)^2 \ ; $$
$$-x_1^2+6\,x_1x_2+6\,x_1x_3+2\,x_2^2+4\,x_2x_3+2\,x_3^2\equiv $$
$$
\equiv (x_1+x_2+x_3)^2-2\,(x_1-x_2-x_3)^2+3\,(x_2+x_3)^2 \equiv
$$
$$\equiv -(x_1+3\,x_2+3\,x_3)^2+11\,(x_2+x_3)^2 \ ; $$
$$ x_1x_2 \equiv \frac{1}{4} (x_1+x_2)^2- \frac{1}{4} (x_1-x_2)^2 \ . $$
А в общем случае:
$$ f(x_1,\dots,x_{n} )\equiv $$
$$
\begin{array}{l}
\equiv a_1(c_{11}x_1+c_{12}x_2+\dots+c_{1n}x_n)^2 +\\
+a_2(c_{21}x_1+c_{22}x_2+\dots+c_{2n}x_n)^2+ \\
+\dots+ \\
+a_n(c_{n1}x_1+c_{n2}x_2+\dots+c_{nn}x_n)^2
\end{array}
$$
при $ \{a_j\}_{j=1}^n,\{c_{jk}\}_{j,k=1}^n $ --- константах. Такое представление оказывается достаточно удобным для анализа квадратичной формы --- например, в случае вещественных форм, при проверке выполнимости неравенства вида $ f(x_1,\dots,x_{n} ) \ge 0 $. Приведенные выше примеры показывают неоднозначность представления в виде суммы квадратов: вид квадратов и даже их количество для одной и той же формы могут быть различными. С целью обеспечения частичной унификации установим некоторое дополнительное ограничение, а именно, потребуем, чтобы линейные однородные формы
$$ c_{11}x_1+c_{12}x_2+\dots+c_{1n}x_n, \ c_{21}x_1+c_{22}x_2+\dots+c_{2n}x_n,\dots, c_{n1}x_1+c_{n2}x_2+\dots+c_{nn}x_n $$
были ((:linear_space#линейная_зависимость_базис_координаты линейно независимыми)). При таком ограничении любое представление квадратичной формы в виде суммы квадратов называется **каноническим видом квадратичной формы**.
**Задача.** Для произвольной квадратичной формы $ f(x_1,\dots,x_{n} ) $ построить (хотя бы один) ее канонический вид.
Поставленная задача имеет существенное значение для анализа
* произвольного полинома [[И других функций, которые в настоящем ресурсе не рассматриваются.]] нескольких переменных на ((:polynomialm#экстремумы_полинома максимумы и минимумы));
* геометрии линий второго порядка на плоскости и поверхностей второго порядка в пространстве; например, по набору коэффициентов уравнения, задающего кривую
$$ x^2 -2\,xy+3\,y^2+x-4\,y-15=0 $$
определить к какому типу (эллипс, гипербола, парабола,...) она относится.
=== Метод Лагранжа приведения квадратичной формы к каноническому виду==
Существует универсальный алгоритм, приводящий произвольную квадратичную форму к каноническому виду.
----
Метод Лагранжа
1.
Пусть $ f_{11}\ne 0 $. Выделим в $ f(x_1,\dots, x_n)_{} $ все слагаемые, содержащие $ x_{1} $:
$$
f_{11}x_1^2+f_{12}x_1x_2+ \dots +f_{1n}x_1x_n+ \sum_{2\le j\le k \le n} f_{jk}x_jx_k
=
$$
$$
= f_{11}\left(x_1^2+\frac{f_{12}}{f_{11}}x_1x_2+\dots+
\frac{f_{1n}}{f_{11}}x_1x_n \right)+\dots=
$$
$$
=f_{11}\left[ \left(x_1+\frac{f_{12}}{2f_{11}}x_2+\dots+
\frac{f_{1n}}{2f_{11}}x_n \right)^2-\left(\frac{f_{12}}{2f_{11}}x_2+\dots+
\frac{f_{1n}}{2f_{11}}x_n \right)^2 \right]+\dots=
$$
$$
=f_{11} \left(x_1+\frac{f_{12}}{2f_{11}}x_2+\dots+ \frac{f_{1n}}{2f_{11}}x_n\
\right)^2 -
f_{11}\left(\frac{f_{12}}{2f_{11}}x_2+\dots+
\frac{f_{1n}}{2f_{11}}x_n \right)^2 +\dots
$$
В последнем представлении первое слагаемое представляет собой квадрат линейной формы по переменным $ x_{1},x_2,\dots,x_n $; все оставшиеся слагаемые не зависят от $ x_{1} $, т.е. составляют квадратичную форму от переменных $ x_{2},\dots,x_n $. Таким образом, исходная задача для формы $ n_{} $ переменных оказывается сведенной к случаю формы $ (n-1)_{} $-й переменной; последняя преобразуется по аналогичному принципу.
2.
Если $ f_{11}=0 $, но $ \exists k:\ f_{kk}\ne 0 $, т.е. при хотя бы одном квадрате переменной коэффициент отличен от нуля. Алгоритм модифицируется таким образом, чтобы выделение полного квадрата начиналось с переменной $ x_{k} $ вместо $ x_{1} $ --- первая ничем не лучше (и не хуже) $ k_{} $-й!
3.
Совсем исключительный случай: квадраты переменных вообще отсутствуют, т.е. $ f_{11}=\dots=f_{nn}=0 $. Выбираем один из ненулевых коэффициентов при смешанных произведениях переменных: пусть $ f_{jk}\ne 0 $. Представляем $ x_k=(x_j+x_k)-x_j $ и заменяем все вхождения переменной $ x_{k} $ на $ X_k-x_j $ при вспомогательной переменной $ X_k=x_j+x_k $. В новой квадратичной форме уже присутствует квадрат переменной $ x_{j} $ с ненулевым коэффициентом. Тем самым этот случай сводится к предыдущему. После приведения новой формы к сумме квадратов возвращаемся к "старой" переменной $ x_{k} $.
----
!!П!! **Пример.** Привести форму
$$ f=4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$
к каноническому виду.
**Решение.**
$$
\begin{array}{ccl}
f&=&4\left(x_1^2-x_1x_2-x_1x_3+x_1x_4\right)+2x_2^2+x_3^2+x_4^2+4x_2x_3-4x_3x_4=\\
&=&4\bigg[
\left(x_1-\frac{1}{2}\, x_2-\frac{1}{2}\,x_3+ \frac{1}{2}\,x_4\, \right)^2-
\left(-\frac{1}{2}\, x_2-\frac{1}{2}\, x_3+\frac{1}{2}\, x_4\right)^2 \bigg] + \\
&+&2\,x_2^2+x_3^2+x_4^2+4\,x_2x_3-4\,x_3x_4= \\
&=&4\,\left(x_1-\frac{1}{2}\, x_2-\frac{1}{2}\,x_3+ \frac{1}{2}\,x_4\, \right)^2+\\
& & + \Big[\left(x_2+x_3+x_4\, \right)^2- \left(x_3+x_4 \right)^2\Big]-2\,x_3x_4 = \\
&=&4\,\left(x_1-\frac{1}{2}\, x_2-\frac{1}{2}\,x_3+ \frac{1}{2}\,x_4\, \right)^2+
\left(x_2+x_3+x_4\, \right)^2- \\
&&-x_3^2-4\,x_3x_4-x_4^2= \\
&& 4\,\left(x_1-\frac{1}{2}\, x_2-\frac{1}{2}\,x_3+ \frac{1}{2}\,x_4\, \right)^2+
\left(x_2+x_3+x_4\, \right)^2- \\
&&-\Big[
\left(x_3+ 2\, x_4\, \right)^2-4\, x_4^2\Big] -x_4^2 = \\
&=&4\,\left(x_1-\frac{1}{2}\, x_2-\frac{1}{2}\,x_3+ \frac{1}{2}\,x_4\, \right)^2+
\left(x_2+x_3+x_4\, \right)^2-\left(x_3+ 2\, x_4\, \right)^2+3\,x_4^2
\end{array}
$$
**Ответ.** $ f\equiv 4\,\left(x_1-\frac{1}{2}\, x_2-\frac{1}{2}\,x_3+ \frac{1}{2}\,x_4\, \right)^2+
\left(x_2+x_3+x_4\, \right)^2-\left(x_3+ 2\, x_4\, \right)^2+3\,x_4^2 $.
!!П!! **Пример.** Привести форму
$$ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$
к каноническому виду.
**Решение.**
$$
f\equiv (x_1+x_2+3\,x_3)^2-(x_2+3\,x_3)^2+x_2^2-4\,x_3^2+4\,x_2x_3 \equiv
$$
$$
\equiv (x_1+x_2+3\,x_3)^2-2\,x_2x_3 -13\,x_3^2 \equiv
$$
В соответствии с алгоритмом, на следующем шаге нужно выделять слагаемые, содержащие переменную $ x_{2} $, но коэффициент при $ x_2^2 $ в правой части формулы обратился в нуль. Поэтому --- в соответствии с пунктом
2
метода ---
приходится выделять квадрат на основе переменной $ x_{3} $:
$$ (x_1+x_2+3\,x_3)^2-13\, \left(x_3-\frac{1}{13}x_2\right)^2+13\cdot \frac{1}{13^2}x_2^2 \ . $$
**Ответ.** $ (x_1+x_2+3\,x_3)^2-13\, \left(x_3-\frac{1}{13}x_2\right)^2+ \frac{1}{13}x_2^2 $.
!!П!! **Пример.** Привести форму
$$ f=x_1x_2-3\,x_1x_3+2\,x_2x_3 $$
к каноническому виду.
**Решение.** Коэффициенты при квадратах переменных все равны нулю. Действуем в соответствии с пунктом
3
метода Лагранжа. Поскольку коэффициент при $ x_1x_2 $ отличен от нуля, делаем замену переменной $ x_2=X_2-x_1 $ при $ X_2=x_1+x_2 $:
$$ f\equiv -x_1^2+x_1X_2-5\,x_1x_3+2\,X_2x_3 \ . $$
Дальнейший ход решения --- в соответствии с пунктом
1
метода Лагранжа:
$$
-\left(x_1-\frac{1}{2}X_2+\frac{5}{2}x_3\right)^2+\left(-\frac{1}{2}X_2+\frac{5}{2}x_3\right)^2+2\,X_2x_3 \equiv
$$
$$
\equiv -\left(x_1-\frac{1}{2}X_2+\frac{5}{2}x_3\right)^2+\frac{1}{4}X_2^2-\frac{1}{2}X_2x_3+\frac{25}{4}x_3^2 \equiv
$$
$$
\equiv -\left(x_1-\frac{1}{2}X_2+\frac{5}{2}x_3\right)^2+\frac{1}{4}\left(X_2-x_3 \right)^2+6\,x_3^2 \
$$
Получили сумму квадратов форм от переменных $ x_1,X_2,x_3 $. Возвращаемся к переменной $ x_{2} $:
**Ответ.** $ -(\frac{1}{2}x_1-\frac{1}{2}x_2+\frac{5}{2}x_3)^2+\frac{1}{4}(x_1+x_2-x_3)^2+6\,x_3^2 $.
Метод Лагранжа позволяет получить канонический вид квадратичной формы над тем же множеством $ \mathbb A_{} $, над которым рассматривается исходная форма --- например, если коэффициенты формы $ f_{} $ являются рациональными, то и коэффициенты ее канонического вида (т.е. числа $ \{a_j\}_{j=1}^n,\{c_{jk}\}_{j,k=1}^n $) будут также рациональными.
=== Матричная форма записи квадратичной формы==
В этом и последующих пунктах существенно потребуется знание ключевых понятий ((:algebra2 ТЕОРИИ МАТРИЦ)) и ((:algebra2:dets ОПРЕДЕЛИТЕЛЕЙ)).
**Задача.** Установить правило формирования коэффициентов канонического вида квадратичной формы, получающегося применением ((#метод_лагранжа_приведения_квадратичной_формы_к_каноническому_виду метода Лагранжа)).
Прежде всего, соберем все переменные в один вектор, а вернее --- в два вектора:
$$
{}_{.} \mbox{ столбец переменных } X=
\left(\begin{array}{l} x_1 \\ \vdots \\ x_n \end{array} \right) \quad \mbox{ и строку переменных }
X^{\top} = (x_1,\dots,x_n) \ ;
$$
здесь $ {}^{\top} $ означает ((:algebra2#транспонирование транспонирование)). Не очень принципиально, что обозначать через $ X_{} $ --- столбец или строку; и хотя сокращение $ f(x_1,\dots,x_n)=f(X) $ кажется не вполне корректным с точки зрения только что введенного обозначения, тем не менее не будем навешивать в правую часть дополнительные
значки...
Если определить ((:algebra2#треугольная верхнетреугольную матрицу)) $ \mathbf F $ равенством:
$$
{\mathbf F}= \left(
\begin{array}{cccc}
f_{11}&f_{12}&\dots &f_{1n} \\
&f_{22}& \dots & f_{2n} \\
\mathbb O & &\ddots & \vdots \\
& & & f_{nn}
\end{array} \right),
$$
то квадратичную форму можно записать в виде ((:algebra2#умножение_матриц произведения)) трех матриц
$$ {}_{.} \mbox{ строка переменных } \times \mbox{ матрица } \times \mbox{ столбец переменных } $$
$$ f(X)=X^{\top} {\mathbf F}X \ .$$
Более того, можно написать бесконечно много подобных представлений для одной и той же квадратичной формы $ f_{} $, подбирая разные матрицы
!!П!! **Пример.** $ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 \equiv $
$$
\equiv (x_1,x_2,x_3)
\left(
\begin{array}{rrr}
1 & 2 & 6 \\
0 & 1 & 4 \\
0 & 0 & -4
\end{array}
\right)
\left(
\begin{array}{l}
x_1 \\ x_2 \\ x_3
\end{array}
\right)
\equiv (x_1,x_2,x_3)
\left(
\begin{array}{rrr}
1 & 0 & 3 \\
2 & 1 & 4 \\
3 & 0 & -4
\end{array}
\right)
\left(
\begin{array}{l}
x_1 \\ x_2 \\ x_3
\end{array}
\right)\equiv
$$
$$
\equiv (x_1,x_2,x_3)
\left(
\begin{array}{rrr}
1 & 1 & 3 \\
1 & 1 & 2 \\
3 & 2 & -4
\end{array}
\right)
\left(
\begin{array}{l}
x_1 \\ x_2 \\ x_3
\end{array}
\right)\equiv \dots
$$
♦
Из всего этого бесконечного множества представлений выделим одно. Рассмотрим матрицу
$${\mathbf A}=\frac{{\mathbf F}+{\mathbf F}^{\top}}{2}=
\left(
\begin{array}{cccc}
f_{11}& \frac{1}{2} f_{12}&\dots & \frac{1}{2} f_{1n} \\
\frac{1}{2} f_{12} &f_{22}& \dots & \frac{1}{2} f_{2n} \\
\dots & & & \dots \\
\frac{1}{2} f_{1n} & \frac{1}{2} f_{2n} & \dots & f_{nn}
\end{array} \right),
$$
которая, очевидно, ((:algebra2#симметричная симметрична)): $ {\mathbf A}^{\top}={\mathbf A} $. Тогда
$$
f(X)=\sum_{1\le j,k \le n} a_{jk}x_jx_k=X^{\top}{\mathbf A}X \ .
$$
Это представление называют **правильной записью квадратичной формы**; матрицу $ {\mathbf A} $ называют **матрицей квадратичной формы** $ f_{} $, а $ \det \mathbf A $ --- **дискриминантом квадратичной формы**:
$$ \det A = {\mathcal D} (f) \ . $$
В случае равенства дискриминанта нулю квадратичная форма называется **вырожденной**, в противном случае --- **невырожденной**.
!!П!! **Пример.** Для приведенной выше квадратичной формы
$$ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$
ее правильной записью будет именно последняя:
$$
f\equiv
(x_1,x_2,x_3)
\left(
\begin{array}{rrr}
1 & 1 & 3 \\
1 & 1 & 2 \\
3 & 2 & -4
\end{array}
\right)
\left(
\begin{array}{l}
x_1 \\ x_2 \\ x_3
\end{array}
\right)
$$
Правило формирования матрицы довольно просты: на диагонали ставятся коэффициенты при квадратах, а внедиагональные элементы получаются располовиниванием коэффициентов при смешанных произведениях переменных.
^ ^ $ x_{1} $ ^ $ x_{2} $ ^ $ x_{3} $ |
^ $ x_{1} $ | $ f_{11} $ | $ \frac{1}{2}f_{12} $ | $ \frac{1}{2}f_{13} $ |
^ $ x_{2} $ | $ \frac{1}{2}f_{12} $ | $ f_{22} $ | $ \frac{1}{2}f_{23} $ |
^ $ x_{3} $ | $ \frac{1}{2}f_{13} $ | $ \frac{1}{2}f_{23} $ | $ f_{33} $ |
!!П!! **Пример.** Для
$$ f(x_1,x_2)=a_{11}x_1^2+2\, a_{12}x_1x_2+a_{22}x_2^2 $$
имеем:
$$ {\mathbf A} =
\left(
\begin{array}{ll}
a_{11} & a_{12} \\
a_{12} & a_{22}
\end{array}
\right) \ ; \ {\mathcal D} (f)=a_{11}a_{22}-a_{12}^2 \ ; $$
последнее выражение вполне напоминает дискриминант квадратного трехчлена $ a_{11}x^2+2\, a_{12}x+a_{22} $ и это обстоятельство оправдывает использование слова //дискриминант// для нового объекта...
Матрица квадратичной формы совпадает с половиной ((:polynomialm#формула_тейлора матрицы Гессе)) этой формы: $ \mathbf A = 1/2 H(f) $.
Причина, по которой из бесконечного многообразия матричных представлений квадратичной формы выделяется именно то, что использует симметричную матрицу, остается пока непонятной. Отложив ненадолго обсуждение этой причины, попробуем переписать в матричных терминах приведение квадратичной формы к каноническому виду.
Рассмотрим замены переменных в квадратичной форме, т.е. переход от переменных $ x_{1},\dots,x_{n} $ к новым переменным $ y_{1},\dots,y_{n} $. Ограничимся только линейными заменами вида
$$
\left\{ \begin{array}{ccc}
x_1&=&c_{11}y_1+c_{12}y_2+\dots+c_{1n}y_n, \\
x_2&=&c_{21}y_1+c_{22}y_2+\dots+c_{2n}y_n, \\
\dots & & \dots \\
x_n&=&c_{n1}y_1+c_{n2}y_2+\dots+c_{nn}y_n.
\end{array}
\right.
$$
Результатом такой замены переменных будет новая квадратичная форма относительно новых переменных. Установим по какому закону формируются ее коэффициенты. С этой целью введем в рассмотрение матрицу замены переменных
$$
C=
\left( \begin{array}{llcl}
c_{11} & c_{12} & \dots & c_{1n} \\
c_{21} & c_{22} & \dots & c_{2n} \\
\dots & & & \dots \\
c_{n1} & c_{n2} & \dots & c_{nn} \\
\end{array}
\right) ;
$$
которая позволяет переписать саму замену переменных в матричном виде
$$
\left(\begin{array}{l} x_1 \\ x_2 \\ \vdots \\ x_n \end{array} \right)=
\left( \begin{array}{llcl}
c_{11} & c_{12} & \dots & c_{1n} \\
c_{21} & c_{22} & \dots & c_{2n} \\
\dots & & & \dots \\
c_{n1} & c_{n2} & \dots & c_{nn} \\
\end{array}
\right)
\left(\begin{array}{l} y_1 \\ y_2 \\ \vdots \\ y_n \end{array} \right) \qquad \iff \qquad
X=CY \ .
$$
Тогда формальная подстановка последнего варианта в правильную запись квадратичной формы приведет к следующей цепочке
$$
f(X)=X^{\top}{\mathbf A}X= (CY)^{\top}{\mathbf A} (CY)=Y^{\top} C^{\top}{\mathbf A}C Y=\tilde f (Y) \ ,
$$
(здесь использовались некоторые свойства операции ((:algebra2#транспонирование транспонирования)) ) и, если обозначить матрицу
$$
\mathbf B =C^{\top}{\mathbf A}C \ ,
$$
то мы получаем правило формирования матрицы квадратичной формы, получившейся в результате замены переменных, с помощью операции ((:algebra2#умножение_матриц произведения матриц)). Обратим внимание на еще один факт --- матрица $ \mathbf B $ является симметричной:
$$
\mathbf B^{\top} =(C^{\top}{\mathbf A}C)^{\top}= C^{\top}{\mathbf A}^{\top}\left(C^{\top} \right)^{\top} =
C^{\top}{\mathbf A}C= \mathbf B \ ,
$$
т.е. выбор в качестве матричной записи квадратичной формы именно варианта c симметричной матрицей позволяет сохранить это свойство при __любой__ линейной замене переменных.
Задача о нахождении ((#определение канонического вида)) квадратичной формы $ X^{\top}{\mathbf A}X $ может быть также переформулирована в терминах замены переменных: требуется найти такую матрицу $ C_{} $, чтобы матрица
$ \mathbf B= C^{\top}{\mathbf A}C $ оказалась ((algebra2#симметричная диагональной)):
$$
\mathbf B=
\left(
\begin{array}{cccc}
a_{1} & & & \\
& a_{2} & & {\mathbb O} \\
{\mathbb O} & & \ddots & \\
& & & a_{n}
\end{array}
\right) \ ;
$$
при этом дополнительным условием ставится ((:algebra2:inverse#обратная_матрица невырожденность (неособенность))) матрицы $ C_{} $:
$$ \det C \ne 0 \ . $$
Пока не вполне понятна существенность последнего условия: почему оно накладывается? С одной стороны, оно обеспечивает обратимость замены переменных $ (x_1,\dots,x_n) \leftrightarrow
(y_1,\dots,y_n) $ --- не происходит "потери информации". В самом деле, наличие какого-то ограничения на все возможные замены переменных, довольно очевидно: если бы разрешалось использовать, например, нулевую матрицу $ C = {\mathbb O}_{n} $, то канонический вид у любой квадратичной формы был бы нулевым.. . Геометрический смысл условия $ \det C \ne 0 $ обсудим
☟
((#геометрия_замен_переменных НИЖЕ)).
!!Т!! **Теорема.** //Для любой квадратичной формы над// $ \mathbb A $ //существует невырожденная линейная замена
переменных// $ X=CY $ //такая, что преобразованная квадратичная форма// $ \widetilde f(Y) $ //имеет канонический вид.
//
Вернемся к примерам предыдущего пункта, перепишем их на матричном языке.
!!П!! **Пример.** Для формы
$$ f(x_1,x_2,x_3,x_4)= $$
$$=4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$
замена переменных осуществляется формулами
$$
\begin{array}{crrrr}
y_1=& x_1 &-\frac{1}{2}\, x_2&-\frac{1}{2}\,x_3&+ \frac{1}{2}\,x_4, \\
y_2=& & x_2&+x_3&+x_4, \\
y_3=& & & x_3 &+ 2\, x_4,\\
y_4=& &&& x_4,
\end{array}
$$
т.е. матрица замены переменных
$$
C=
\left(
\begin{array}{cccc}
1 & -\frac{1}{2} & -\frac{1}{2} & \frac{1}{2} \\
0 & 1 & 1 & 1 \\
0 & 0 & 1 & 2 \\
0 & 0 & 0 & 1
\end{array}
\right)
$$
имеет ((:algebra2#треугольная верхнетреугольный вид)). Канонический вид в новых переменных записывается
$$ f(x_1,x_2,x_3,x_4) \equiv 4\,y_1^2+y_2^2-y_3^2+3\,y_4^2 \ . $$
Для формы
$$ f(x_1,x_2,x_3)=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$
замена переменных уже не имеет треугольного вида:
$$
\begin{array}{crrr}
y_1=& x_1 &+ x_2&+3\,x_3 \\
y_2=& & -\frac{1}{13}x_2&+x_3 \\
y_3=& & \frac{1}{13}x_2 &
\end{array}
\qquad \iff \qquad
C=
\left(
\begin{array}{rrr}
1 & 1 & 3 \\
0 & -\frac{1}{13} & 1 \\
0 & \frac{1}{13} & 0
\end{array}
\right) \ .
$$
Для формы
$$ f(x_1,x_2,x_3)=x_1x_2-3\,x_1x_3+2\,x_2x_3 $$
получили:
$$
\begin{array}{crrr}
y_1=& \frac{1}{2}x_1 &-\frac{1}{2}x_2&+\frac{5}{2}x_3 \\
y_2=& x_1&+x_2&-x_3 \\
y_3=& & & x_3
\end{array}
\qquad \iff \qquad
C=
\left(
\begin{array}{rrr}
\frac{1}{2} & -\frac{1}{2} & \frac{5}{2} \\
1 & 1 & -1 \\
0 & 1 & 1
\end{array}
\right) \ ,
$$
т.е. замена переменных также не имеет треугольного вида.
♦
Поставленную в начале пункта задачу об установлении структуры канонического вида квадратичной формы попытаемся решить сначала для случая когда замену переменных можно подобрать именно в треугольном виде.
===Метод Лагранжа и метод Гаусса==
В этом и последующих пунктах существенно потребуется знание ((:algebra2:linearsystems:matrix_for МЕТОДА ГАУССА)) преобразования систем линейных уравнений.
!!П!! **Пример.** Рассмотрим матрицу квадратичной формы
$$ f(x_1,x_2,x_3,x_4)=$$
$$ =4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$
из предыдущих пунктов, и, временно выходя из
круга поставленных в настоящем разделе задач, попробуем применить к ней метод Гаусса
приведения к треугольному виду:
$$
\left(
\begin{array}{rrrr}
4 & -2 & -2 & 2 \\
-2 & 2 & 2 & 0 \\
-2 & 2 & 1 & -2 \\
2 & 0 & -2 & 1
\end{array}
\right)
\ \rightarrow \
\left(
\begin{array}{rrrr}
4 & -2 & -2 & 2 \\
0 & 1 & 1 & 1 \\
0 & 1 & 0 & -1 \\
0 & 1 & -1 & 0
\end{array}
\right)
\ \rightarrow \
$$
$$
\rightarrow \
\left(
\begin{array}{rrrr}
4 & -2 & -2 & 2 \\
0 & 1 & 1 & 1 \\
0 & 0 & -1 & -2 \\
0 & 0 & -2 & -1
\end{array}
\right)
\ \rightarrow \
\left(
\begin{array}{rrrr}
4 & -2 & -2 & 2 \\
0 & 1 & 1 & 1 \\
0 & 0 & -1 & -2 \\
0 & 0 & 0 & 3
\end{array}
\right) \ .
$$
Обратим внимание на два обстоятельства: диагональные элементы последней матрицы
совпадают с коэффициентами канонического вида квадратичной формы, а коэффициенты
замены переменных, приводящей к этому каноническому виду, совпадают с
элементами строк этой матрицы, если их разделить на соответствующие диагональные
элементы. Возникает подозрение :-?, что метод Лагранжа является "замаскированной"
версией метода Гаусса.
♦
Для того, чтобы выяснить аналитический смысл преобразований по методу Лагранжа найдем
правило формирования коэффициентов в первом шаге приведения квадратичной формы к каноническому виду.
Пусть исходная квадратичная форма записана в виде
$$
f(x_1,\dots,x_{n} )=\sum_{1\le j,k \le n} a_{jk}x_jx_k=
$$
$$
\begin{array}{llll}
=
a_{11}x_1^2&+2a_{12}x_1x_2&+ \dots & +2a_{1n}x_1x_n+ \\
&+a_{22}x_2^2 &+ \dots & +2a_{2n}x_2x_n+ \\
& & +\dots & + \\
& & &+a_{nn}x_n^2,
\end{array}
$$
т.е. коэффициенты при смешанных произведениях переменных записаны с выделением множителя $ 2_{} $.
После выделения полного квадрата, содержащего переменные $ x_1,x_2,\dots,x_n $:
$$ f(x_1,x_2,\dots,x_n)\equiv a_{11}
\left(x_1+\frac{a_{12}}{a_{11}}x_2+\dots+ \frac{a_{1n}}{a_{11}}x_n\
\right)^2 + f_2(x_2,\dots,x_n)
$$
в правой части тождества образовалась квадратичная форма $ f_{2} $, не содержащая $ x_{1} $. Она равна
$$
f_2 =\sum_{2\le j,k \le n} a_{jk}x_jx_k-
a_{11}\left(\frac{a_{12}}{a_{11}}x_2+\dots+
\frac{a_{1n}}{a_{11}}x_n \right)^2=
$$
$$
=\sum_{2\le j,k \le n} a_{jk}x_jx_k-a_{11}\sum_{2\le j,k \le n}
\frac{a_{1j}a_{1k}}{a_{11}^2}x_jx_k=
\sum_{2\le j,k \le n}\left( a_{jk}-\frac{a_{1j}}{a_{11}}a_{1k} \right)
x_jx_k \ .
$$
Если теперь выписать матрицу этой квадратичной формы (она имеет порядок $ n_{}-1 $), то ее элементы образуются по точно такому же правилу, как и коэффициенты матрицы, получающейся из матрицы $ \mathbf A_{} $ в результате ((:algebra2:linearsystems#исключение_переменных первого шага метода Гаусса)).
!!Т!! **Теорема.** //Метод Лагранжа приведения квадратичной формы// $ X^{\top}{\mathbf A}X $ к //каноническому виду эквивалентен методу Гаусса приведения матрицы// $ {\mathbf A} $ //к треугольному виду//.
**Доказательство.** Действительно, первый шаг прямого хода метода исключения переменных
Гаусса преобразует матрицу $ \mathbf A $ следующим образом:
$$
\left( \begin{array}{ccccc}
a_{11}& a_{12}& a_{13}& \dots & a_{1n} \\
a_{12}& a_{22}& a_{23}& \dots & a_{2n} \\
& \dots & & \dots & \\
a_{1n}& a_{2n}& a_{3n}& \dots & a_{nn}
\end{array}
\right)
\rightarrow
\left(\begin{array}{llll}
a_{11}&a_{12}&\dots&a_{1n}\\
0&a_{22}^{[1]}& \dots &a_{2n}^{[1]}\\
&\dots & & \dots \\
0&a_{n2}^{[1]}&\dots &a_{nn}^{[1]}
\end{array} \right) \ ;
$$
здесь
$$a_{jk}^{[1]} = a_{jk} - \frac{a_{j1}a_{1k}}{a_{11}} \ ,$$
и предполагается, что $ a_{11}\ne 0 $. Видим, что формула формирования
элементов матрицы
$$
\left(\begin{array}{llll}
a_{22}^{[1]}& \dots&a_{2n}^{[1]}\\
\dots & & \dots & \\
a_{n2}^{[1]}&\dots &a_{nn}^{[1]}
\end{array} \right)_{(n-1)\times (n-1)}
$$
точно такая же, как и матрицы квадратичной формы $ f_2 $. Более того,
поскольку матрица $ {\mathbf A} $ симметрична ($ a_{jk}=a_{kj} $), то
и только что полученная матрица оказывается симметричной.
Если $ a_{22}^{[1]} \ne 0 $, то к этой новой матрице можно снова применить
ту же процедуру, и т.д., и в конце концов придем к матрице первого порядка.
Собирая все промежуточные результаты в одну матрицу, получим ее в треугольном
виде
$$
\left(\begin{array}{lllll}
a_{11}&a_{12}&\dots&a_{1,n-1} &a_{1n}\\
0&a_{22}^{[1]}& \dots&a_{2,n-1}^{[1]} &a_{2n}^{[1]}\\
& & \ddots & & \dots \\
0 &0 & &a_{n-1,n-1}^{[n-2]}&a_{n-1,n}^{[n-2]} \\
0 &0 &\dots & 0 &a_{nn}^{[n-1]}
\end{array} \right)
$$
при условии, что ни одно из чисел на диагонали не обратилось в нуль:
$$a_{11} \ne 0,\ a_{22}^{[1]} \ne 0, \dots,\ a_{n-1,n-1}^{[n-2]} \ne 0,\ a_{nn}^{[n-1]} \ne 0
\ .$$
Если теперь обратиться к методу Лагранжа, то увидим, что полученная матрица как раз и определяет
замену переменных
$$
\left\{\begin{array}{lrrrrr}
y_1=&\displaystyle x_1+&\frac{a_{12}}{a_{11}}x_2+&\dots+&\frac{a_{1,n-1}}{a_{11}}x_{n-1}+&
\frac{a_{1n}}{a_{11}}x_n \\
y_2=&\displaystyle &x_2+&\dots + &\frac{a_{2,n-1}^{[1]}}{a_{22}^{[1]}}x_{n-1}+&
\frac{a_{2n}^{[1]}}{a_{22}^{[1]}}x_{n} \\
\vdots & & & \ddots & \dots & \\
y_{n-1}=&\displaystyle & & &x_{n-1}+ &\frac{a_{n-1,n}^{[n-2]}}{a_{n-1,n-1}^{[n-2]}}x_n \\
y_n=&&&&&x_n
\end{array} \right. \ ,
$$
приводящую квадратичную форму к каноническому виду:
$$
a_{11}y_1^2 + a_{22}^{[1]} y_2^2 + \dots +a_{n-1,n-1}^{[n-2]} y_{n-1}^2 +
a_{nn}^{[n-1]} y_n^2 \ .
$$
♦
Именно выбор представления квадратичной формы посредством симметричной матрицы позволил установить взаимосвязь между двумя такими разными задачами как решение системы линейных уравнений и представление квадратичной формы в каноническом виде. Фактически весь дальнейший анализ квадратичной формы сведется к исследованию свойств ее матрицы $ \mathbf A $. В теории ((:linear_space линейных пространств)) для подобных соответствий, устанавливаемых между объектами разной природы, вводится понятие ((:linear_space#изоморфизм изоморфизма)).
Явное выражение коэффициентов из последних формул, а также необходимые и достаточные условия существования такой
замены --- в терминах миноров матрицы $ \mathbf A $ --- даются в следующем
☟
((#формула_якоби ПУНКТЕ))
===Формула Якоби==
!!Т!! **Теорема [Якоби].** //Квадратичная форма// $ f(X)=X^{\top}{\mathbf A}X $ //с симметричной матрицей// $ {\mathbf A} $, //ранг которой равен// $ \mathfrak r_{} $, // а ((:algebra2:dets#миноры_и_алгебраические_дополнения главные миноры))// $ \{\det \mathbf A_j \}_{j=1}^{\mathfrak r} $ // отличны от нуля, приводится к следующему каноническому виду (формула Якоби[[Якóби Карл Густав Якоб (Jacobi Carl Gustav Jacob, 1804-1851) --- выдающийся немецкий математик, брат российского физика Бориса Семёновича Якоби. Замечательные результаты в теории чисел, алгебре, анализе и механике.]])//:
$$
\frac{z_1^2}{1 \cdot \det \mathbf A_1} +\frac{z_2^2}{\det \mathbf A_1 \cdot \det \mathbf A_2}
+\frac{z_3^2}{\det \mathbf A_2 \cdot \det \mathbf A_3} +\dots+\frac{z_{\mathfrak r}^2}{\det \mathbf A_{{\mathfrak r}-1} \cdot \det \mathbf A_{\mathfrak r}}
$$
Здесь
$$
z_1 =\frac{1}{2} \partial f / \partial x_1,\ z_2=
\frac{1}{2}
\left|
\begin{array}{ll}
a_{11} & \partial f / \partial x_1 \\
a_{12} & \partial f / \partial x_2
\end{array}
\right|, \
z_3=
\frac{1}{2}
\left|
\begin{array}{lll}
a_{11} & a_{12} & \partial f / \partial x_1 \\
a_{12} & a_{22} & \partial f / \partial x_2 \\
a_{13} & a_{23} & \partial f / \partial x_3
\end{array}
\right|, \ \dots \ ,
$$
$$
\qquad \qquad
z_{\mathfrak r}=
\frac{1}{2}
\left|
\begin{array}{lllll}
a_{11} & a_{12} & \dots & a_{1,\mathfrak r-1} & \partial f / \partial x_1 \\
a_{12} & a_{22} & \dots & a_{2,\mathfrak r-1} & \partial f / \partial x_2 \\
\dots & & & \dots & \dots \\
a_{1,\mathfrak r } & a_{2,\mathfrak r } & \dots & a_{\mathfrak r-1,\mathfrak r } & \partial f / \partial x_{\mathfrak r}
\end{array}
\right|
$$
Доказательство
☞
((./2form/jacobi ЗДЕСЬ)).
!!П!! **Пример.** Для квадратичной формы
$$ f(x_1,x_2,x_3,x_4)=
$$
$$
=4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4
$$
имеем:
$$
\mathbf A=
\left(
\begin{array}{rrrr}
4 & -2 & -2 & 2 \\
-2 & 2 & 2 & 0 \\
-2 & 2 & 1 & -2 \\
2 & 0 & -2 & 1
\end{array}
\right) \quad , \left\{\det \mathbf A_j\right\}_{j=1}^4=\left\{4,4,-4,-12\right\}
$$
и
$$z_1=\frac{1}{2} (8\,x_1-4\,x_2-4\,x_3+4\,x_4)=4\,x_1-2\,x_2-2\,x_3+2\,x_4 \ ; $$
$$z_2=\frac{1}{2}
\left|
\begin{array}{rl}
4 & 8\,x_1-4\,x_2-4\,x_3+4\,x_4 \\
-2 & -4\,x_1+4\,x_2+4\,x_3
\end{array}
\right|=4\,x_2+4\,x_3+4\,x_4 ;
$$
$$
z_3=
\frac{1}{2} \left|
\begin{array}{rrl}
4 & -2 & 8\,x_1-4\,x_2-4\,x_3+4\,x_4 \\
-2 & 2 & -4\,x_1+4\,x_2+4\,x_3
\\
-2 & 2 & -4\,x_1+4\,x_2+2\,x_3-4\,x_4
\end{array}
\right|=-4\,x_3-8\,x_4 ;
$$
$$
z_4=
\frac{1}{2}
\left|
\begin{array}{rrrl}
4 & -2 & -2 & 8\,x_1-4\,x_2-4\,x_3+4\,x_4 \\
-2 & 2 & 2 & -4\,x_1+4\,x_2+4\,x_3 \\
-2 & 2 & 1 & -4\,x_1+4\,x_2+2\,x_3-4\,x_4
\\
2 & 0 & -2 & 4\,x_1-4\,x_3+2\,x_4
\end{array}
\right|= -12\,x_4 \ .
$$
$$ f\equiv \frac{(4\,x_1-2\,x_2-2\,x_3+2\,x_4)^2 }{1\cdot 4}+\frac{(4\,x_2+4\,x_3+4\,x_4)^2 }{4\cdot 4}+\frac{(-4\,x_3-8\,x_4)^2 }{4\cdot (-4)}+
$$
$$
+\frac{(-12\,x_4 )^2 }{(-4)\cdot (-12)} \ .
$$
Обратим внимание, что замена переменных в настоящем примере имеет треугольный вид:
$$
\left(
\begin{array}{l}
z_1 \\ z_2 \\ z_3 \\ z_4
\end{array}
\right)
=
\left(\begin{array}{rrrr}
4 & -2 & -2 & 2 \\
& 4 & 4 & 4 \\
& & -4 & -8 \\
& & & -12
\end{array}
\right)
\left(
\begin{array}{l}
x_1 \\ x_2 \\ x_3 \\ x_4
\end{array}
\right) \, .
$$
♦
Легко убедиться, что это --- проявление общего правила. Выражение для
$$
z_{k}=
\frac{1}{2}
\left|
\begin{array}{lllll}
a_{11} & a_{12} & \dots & a_{1,k-1} & \partial f / \partial x_1 \\
a_{12} & a_{22} & \dots & a_{2,k-1} & \partial f / \partial x_2 \\
\dots & & & \dots & \dots \\
a_{k1 } & a_{k2 } & \dots & a_{k,k-1 } & \partial f / \partial x_{k}
\end{array}
\right|
$$
при $ k \in \{1,\dots, \mathfrak r\} $ преобразуем следующим образом: из последнего столбца определителя
$$
=
\left|
\begin{array}{lllll}
a_{11} & a_{12} & \dots & a_{1,k-1} & a_{11}x_1+a_{12}x_2+\dots+ a_{1,k-1} x_{k-1}+a_{1k}x_k+\dots+a_{1n}x_n \\
a_{12} & a_{22} & \dots & a_{2,k-1} & a_{21}x_1+a_{22}x_2+\dots+ a_{2,k-1} x_{k-1}+a_{2k}x_k+\dots+a_{2n}x_n \\
\dots & & & \dots & \dots \\
a_{k1 } & a_{k2 } & \dots & a_{k,k-1 } & a_{k1}x_1+a_{k2}x_2+\dots+ a_{k,k-1} x_{k-1}+a_{kk}x_k+\dots+a_{kn}x_n
\end{array}
\right|
$$
вычтем первый, домноженный на $ x_1 $, второй, домноженный на $ x_2 $, и т.д., $ (k-1) $-й, домноженный на $ x_{k-1} $. В результате получим линейную форму
$$
z_k=
\left|
\begin{array}{lllll}
a_{11} & a_{12} & \dots & a_{1,k-1} & a_{1k} \\
a_{12} & a_{22} & \dots & a_{2,k-1} & a_{2k} \\
\dots & & & \dots & \dots \\
a_{k1 } & a_{k2 } & \dots & a_{k,k-1 } & a_{kk}
\end{array}
\right|x_k + \dots +
\left|
\begin{array}{lllll}
a_{11} & a_{12} & \dots & a_{1,k-1} & a_{1n} \\
a_{12} & a_{22} & \dots & a_{2,k-1} & a_{2n} \\
\dots & & & \dots & \dots \\
a_{k1 } & a_{k2 } & \dots & a_{k,k-1 } & a_{kn}
\end{array}
\right|x_n \, ,
$$
не зависящую от $ x_1,\dots, x_{k-1} $. Коэффициент же при $ x_k $ равен $ \det \mathbf A_k $ и отличен от нуля по условию теоремы. Если его вынести за пределы формы, то получим еще альтернативный вариант формулы Якоби.
!!=>!! //Квадратичная форма// $ f(X)=X^{\top}{\mathbf A}X $ //с симметричной матрицей// $ {\mathbf A} $, //ранг которой равен// $ \mathfrak r_{} $, // а ((:algebra2:dets#миноры_и_алгебраические_дополнения главные миноры))// $ \{\det \mathbf A_j \}_{j=1}^{\mathfrak r} $ // отличны от нуля, приводится к следующему каноническому виду//:
$$
y_1^2 \det \mathbf A_1 + y_2^2\frac{\det \mathbf A_2}{ \det \mathbf A_1}
+y_3^2\frac{\det \mathbf A_3}{\det \mathbf A_2} +\dots+y_{\mathfrak r}^2 \frac{\det \mathbf A_{\mathfrak r}}{\det \mathbf A_{\mathfrak r-1}} \ ;
$$
при этом линейные относительно переменных $ x_1,\dots,x_n $ формы $ \{y_j \}_{j=1}^{\mathfrak r} $ выражаются по формулам
$$
\left\{
\begin{array}{lrrrrrr}
y_1=&\displaystyle x_1+&\tilde c_{12}x_2& &+\dots+&\tilde c_{1,n-1}x_{n-1}+&\tilde c_{1n}x_n \\
y_2=&\displaystyle &x_2+& & \dots + &\tilde c_{2,n-1}x_{n-1}+&\tilde c_{2n}x_{n} \\
\vdots & & & \ddots & & \dots & \\
y_{\mathfrak r}=&\displaystyle & & &x_{\mathfrak r}+ & \dots + & \tilde c_{\mathfrak r n}x_n
\end{array}
\right.
$$
Здесь
$$
\tilde c_{1j}=a_{1j}/a_{11},\ \tilde c_{kj}=\left|
\begin{array}{lllll}
a_{11} & a_{12} & \dots & a_{1,k-1} & a_{1j} \\
a_{12} & a_{22} & \dots & a_{2,k-1} & a_{2j} \\
\dots & & & \dots & \dots \\
a_{k1 } & a_{k2 } & \dots & a_{k,k-1 } & a_{kj}
\end{array}
\right| \Bigg/ \det \mathbf A_j \, .
$$
При $ \mathfrak r = n $ матрица $ \tilde C_{} $ из предыдущей формулы становится верхнетреугольной:
$$
Y=\tilde C X \, ;
$$
при этом на главной диагонали будут стоять $ 1 $. Обратная к матрице такого вида имеет ту же структуру --- и матрица $ C=\tilde C^{-1} $ является матрицей, которая встретилась нам в предыдущем ((#метод_лагранжа_и_метод_гаусса ПУНКТЕ)).
!!T!! **Теорема.** //Квадратичная форма// $ f(X)=X^{\top}{\mathbf A}X $ //при симметричной неособенной матрице// $ {\mathbf A} $ //приводится к каноническому виду заменой переменных, задаваемой верхней унитреугольной матрицей//
$$
X=CY \quad npu \ C=
\left(
\begin{array}{llll}
1& c_{12}& \dots & c_{1n} \\
& 1& \dots & c_{2n} \\
\mathbb O & & \ddots & \vdots \\
& & & 1
\end{array}
\right)
$$
//тогда и только тогда, когда все ((:algebra2:dets#теорема_лапласа главные миноры)) матрицы// $ {\mathbf A} $ //отличны от нуля. Этот канонический вид представлен формулой Якоби//
$$
y_1^2 \det \mathbf A_1 + y_2^2\frac{\det \mathbf A_2}{ \det \mathbf A_1}
+\dots+y_{n}^2 \frac{\det \mathbf A_{n}}{\det \mathbf A_{n-1}} \ .
$$
**
Доказательство** достаточности условия теоремы уже произведено, необходимость доказывается в пункте
☞
((:algebra2:linearsystems:matrix_for#ldu-разложение_матрицы LDU-разложение матрицы)).
==Закон инерции для квадратичных форм==
Для заданной квадратичной формы канонические виды, т.е. представления
в виде сумм квадратов, можно построить разными способами. Выясним, какие характеристики являются общими (инвариантными) для этих представлений.
===Ранг квадратичной формы==
Предположим, что с помощью какой-либо невырожденной замены переменных мы привели квадратичную форму к каноническому виду:
$$\widetilde f(Y)=\alpha_1y_1^2+\dots+\alpha_n y_n^2 \ .$$
Может так случиться, что часть коэффициентов $ \{\alpha_j \}_{j=1}^n $ обратится в нуль.
**Рангом квадратичной формы** называется ранг ее матрицы:
$$\operatorname{rank} ( f ) = \operatorname{rank} ( {\mathbf A} ) \ .$$
!!Т!! **Теорема.** //Ранг квадратичной формы не меняется при невырожденных заменах переменных//:
$$ \operatorname{rank} (f) = \operatorname{rank}( C^{\top}{\mathbf A}C ) \quad npu \quad \forall C,\
\det C \ne 0 \ .$$
**Доказательство** основано на следствии к теореме $ 2 $, приведенной
☞
((:algebra2:rank#неравенства_для_ранга ЗДЕСЬ)): ранг матрицы не меняется при домножении ее на произвольную неособенную.
!!=>!! Ранг квадратичной формы равен числу ненулевых коэффициентов в ее каноническом виде.
===Закон инерции==
Начиная с этого момента рассматриваем только вещественные квадратичные формы.
Число положительных (или отрицательных) коэффициентов в каноническом виде квадратичной формы $ f_{}(X) $ называется ее **положительным** (соответственно, **отрицательным**) **индексом инерции**. Буду обозначать эти индексы[[Мое "изобретение", в литературе нет единого стиля обозначения.]]
$$n_{+}(f) \quad \mbox{ и } \quad n_{-}(f) \ . $$
**Разность**[[А вот следующее обозначение --- традиционно.]]
$$\sigma (f) = n_{+}(f)-n_{-}(f)$$
называется **сигнатурой квадратичной формы** (а также **сигнатурой** соответствующей ей **симметричной матрицы**).
!!Т!! **Теорема [закон инерции]**. //Индексы инерции не зависят от способа приведения квадратичной формы к каноническому виду.//
Эта теорема часто формулируется в виде: "ранг и сигнатура квадратичной формы не зависят...". Эквивалентность этой формулировки исходной очевидно следует из формул
$$ \operatorname{rank} (f) = n_{+}(f)+n_{-}(f), \ \sigma (f) = n_{+}(f)-n_{-}(f) \ . $$
**Доказательство**
☞
((./2form/inertia ЗДЕСЬ)).
!!П!! **Пример.** Найти ранг и сигнатуру квадратичной формы
$$ f(x_1,x_2,x_3)=x_1x_2-x_2x_3 \, .$$
**Решение.** Приводим квадратичную форму к каноническому виду по ((#метод_лагранжа_приведения_квадратичной_формы_к_каноническому_виду методу Лагранжа)):
$$f=\frac{1}{4} \,(x_1+x_2-x_3)^2 - \frac{1}{4} \,(x_1-x_2-x_3)^2 \ .$$
**Ответ.** $ \operatorname{rank} (f) = 2,\, \sigma (f)=0 $.
!!=>!! В предположении, что ранг матрицы $ \mathbf A_{} $ равен $ \mathfrak r_{} $, а ее главные миноры $ \{ \det {\mathbf A}_j \}_{j=1}^{\mathfrak r} $ отличны от нуля, имеем:
$$
n_{+}(f)={\mathcal P}(1,\det {\mathbf A}_1,\dots, \det {\mathbf A}_{\mathfrak r}),\
n_{-}(f)={\mathcal V}(1,\det {\mathbf A}_1,\dots, \det {\mathbf A}_{\mathfrak r})\ .
$$
Здесь $ {\mathcal P}_{} $ --- ((:algebra2:notations#число_знакопостоянств_знакоперемен число знакопостоянств)), а $ {\mathcal V}_{} $ --- число ((:algebra2:notations#число_знакопостоянств_знакоперемен число знакоперемен)) в последовательности.
Для сигнатуры квадратичой формы также справедлива и формула
$$ \sigma (f)= \sum_{j=1}^{\mathfrak r} \operatorname{sign} (\det (\mathbf A_{j-1}) \cdot \det (\mathbf A_{j}) ) \quad npu \quad \det (\mathbf A_{0})=1 $$
и операции $ \operatorname{sign} $ определения знака, введенной
☞
((:algebra2:notations#знак_числа ЗДЕСЬ)).
**Доказательство** следует из ((#формула_якоби формулы Якоби)).
!!§!! Правило вычисления сигнатуры из предыдущей теоремы остается справедливым и в случае, если в последовательности главных миноров $ \{ \det {\mathbf A}_j \}_{j=1}^{\mathfrak r} $ имеются нулевые, но не подряд идущие, и $ \det {\mathbf A}_{\mathfrak r} \ne 0 $. Если, например,
$$ \det (\mathbf A_{j}) = 0,\ \det (\mathbf A_{j-1}) \ne 0,\ \det (\mathbf A_{j+1}) \ne 0 \quad npu \quad j\in\{1,\dots, {\mathfrak r}-1\} ,$$
то сумма
$$ \operatorname{sign} (\det (\mathbf A_{j-1}) \cdot \det (\mathbf A_{j}) )+ \operatorname{sign} (\det (\mathbf A_{j}) \cdot \det (\mathbf A_{j+1}) ) $$
считается равной нулю. (Можно также доказать, что в этом случае главные миноры $ \det (\mathbf A_{j-1}) $ и $ \det (\mathbf A_{j+1}) $ имеют противоположные знаки.)
!!П!! **Пример.** Найти ранг и сигнатуру квадратичной формы
$$f_{{\color{Red} \alpha }}(x_1,x_2,x_3)=3\,x_1^2 -4\,x_1x_2-2\,x_1x_3 + {\color{Red} \alpha } \, x_2^2 +6\, x_2x_3 $$
в зависимости от значений параметра $ {\color{Red} \alpha } $.
**Решение.** Сначала пробуем применить формулу из последнего следствия:
$$\det {\mathbf A}_1=3,\ \det {\mathbf A}_2=3\, {\color{Red} \alpha } -4,\ \det {\mathbf A}_3=
\det {\mathbf A}=- {\color{Red} \alpha } -15 \ .$$
При $ {\color{Red} \alpha } \not\in \{4/3,\, -15 \} $ формула применима при
$ {\mathfrak r}=3 $:
$$n_{+}(f)=\left\{ \begin{array}{llr}
2 & npu & {\color{Red} \alpha } >4/3 ;\\
2 & npu & -15<{\color{Red} \alpha } <4/3 ;\\
1 & npu & {\color{Red} \alpha } < -15 .
\end{array} \right.
$$
При $ {\color{Red} \alpha }=4/3 $, по-прежнему, $ {\mathfrak r}=3 $, но формула следствия к закону инерции
неприменима. В этом случае приходится действовать по методу Лагранжа:
$$f_{4/3}(x_1,x_2,x_3)=3\, \left(x_1-\frac{2}{3}\, x_2 -\frac{1}{3}\, x_3\right)^2-
\frac{1}{3}\, (x_3-7\, x_2)^2+\frac{49}{3}x_2^2 \ .$$
Следовательно, $ n_{+}(f)=2 $. Осталось рассмотреть случай $ {\color{Red} \alpha } =-15 $,
когда $ {\mathfrak r}=2 $. Поскольку условия следствия выполняются, то формула из него применима: $ n_{+}(f)=1 $.
Во всех случаях отрицательный индекс инерции вычисляется по формуле $ n_{-}(f)={\mathfrak r}-n_{+}(f) $.
**Ответ.**
$$
\begin{array}{c|c|c}
{\color{Red} \alpha } & \operatorname{rank} (f) & \sigma (f) \\
\hline
< -15 & 3 & -1 \\
\hline
=-15 & 2 & 0 \\
\hline
> -15 & 3 & 1
\end{array}
$$
Рассмотренный только что пример относится к общей задаче оценки влияния параметров на характеристики квадратичной формы:
Как меняются ранг и сигнатура при непрерывном изменении параметров?
Пусть квадратичная форма зависит от параметров $ \alpha, \beta, \dots $, причем эта зависимость --- полиномиальная. Пусть при некотором наборе вещественных значений параметров все главные миноры матрицы квадратичной формы отличны от нуля. Тогда ранг и сигнатура квадратичной формы могут быть вполне определены знаками этих миноров посредством формулы из следствия к закону инерции. Поскольку элементы миноров полиномиально зависят от параметров, то мы получаем систему неравенств, которую (при необходимости домножением некоторых неравенств на $ (-1) $) можно переписать в виде
$$ G_1(\alpha,\beta,\dots) > 0, \dots, G_n(\alpha,\beta,\dots) > 0 \ . $$
Здесь $ G_1,\dots, G_n $ --- полиномы от $ \alpha,\beta,\dots $. Если при некотором наборе значений $ \alpha=\alpha_0, \beta=\beta_0, \dots $ эта система удовлетворена, при непрерывной вариации этих параметров $ \alpha_0+\delta_{\alpha}, \beta_0 + \delta_{\beta},\dots $ какое из неравенств системы нарушится в первую очередь, т.е. раньше остальных? Иными словами: __какое из неравенств системы самое важное__? --- Оказывается, последнее.
!!Т!! **Теорема**((#источники [2])). //Пусть// $ f_{{\color{Red} \alpha }}(x_1,\dots,x_n) $ --- //квадратичная форма, зависящая от параметра// $ {\color{Red} \alpha } $ //линейным образом//:
$$ f_{{\color{Red} \alpha }}(x_1,\dots,x_n) \equiv (1-{\color{Red} \alpha }) f_{0}(x_1,\dots,x_n)+ {\color{Red} \alpha } f_{1}(x_1,\dots,x_n) \ . $$
//Если// $ \operatorname{rank} (f_{{\color{Red} \alpha }})=n $ //при// $ 0 \le {\color{Red} \alpha } \le 1 $, //то// $ n_{+} (f_{0})= n_{+} (f_{1}) $.
Справедливо и более общее утверждение.
!!Т!! **Теорема**((#источники [1,5])). //Если при непрерывном изменении коэффициентов формы// $ f_{} $ //ее ранг// $ {\mathfrak r}_{} $ //остается неизменным, то не изменяется и ее сигнатура// $ \sigma_{}(f) $.
В случае, когда главные миноры матрицы $ \mathbf A $ обращаются в нуль, к анализу канонического вида квадратичной формы приходится привлекать "тяжелую артиллерию" в виде ((:algebra2:dets#миноры_и_алгебраические_дополнения ведущих миноров)). Но, по крайней мере, один теоретический результат можно сформулировать немедленно.
!!Т!! **Теорема.** //В произвольной квадратичной форме// $ f(X) $ //ранга// $ \mathfrak r\ge 1 $ //можно так перенумеровать переменные, чтобы в матрице получившейся квадратичной формы// $ \tilde f(Y) $ //в последовательности главных миноров//
$$ \det \widetilde{\mathbf A}_1, \dots, \det \widetilde{\mathbf A}_{ \mathfrak r} $$
//не было двух подряд идущих нулевых и// $ \det \widetilde{\mathbf A}_{ \mathfrak r} \ne 0 $.
====Конгруэнтность квадратичных форм==
Матрицы $ {\mathbf A} $ и $ {\mathbf B} $, связанные соотношением
$ {\mathbf B}=C^{\top}{\mathbf A}C $ при некоторой неособенной матрице $ C $, называются
**конгруэнтными**: $ {\mathbf A} \cong {\mathbf B} $. Если, вдобавок, матрицы
$ {\mathbf A} $ и $ {\mathbf B} $ симметричны, то конгруэнтными называются
и соответствующие им квадратичные формы $ X^{\top}{\mathbf A}X $ и $ X^{\top}{\mathbf B}X $.
!!Т!!** Теорема.** //Квадратичные формы// $ X^{\top}{\mathbf A}X $ //и// $ X^{\top}{\mathbf B}X $
//конгруэнтны тогда и только тогда, когда совпадают их индексы инерции, или, что то же, равны их ранги и сигнатуры.//
Из всего разнообразия канонических видов квадратичной формы
выберем самый простой, именно тот, коэффициенты которого равны $ +1 $ или $ (-1) $. Например, если квадратичная форма $ f(X) $ уже приведена к каноническому виду
$$\widetilde f(Y)=\alpha_1y_1^2+\dots+\alpha_{\mathfrak r} y_{\mathfrak r}^2 \ .$$
то преобразование
$$y_j=\frac{z_j}{\sqrt{\alpha_j}}\ npu \ j\in \{1,\dots, {\mathfrak r}\} \ , \
y_j=z_j \ npu \ j\in \{{\mathfrak r}+1,\dots, n \}
$$
приводит эту форму к виду
$$
z_1^2+\dots + z_{n_{+}(A)}^2 -z_{n_{+}(A)+1}^2 - \dots - z_{{\mathfrak r}}^2
\ ,
$$
который называется **нормальным видом квадратичной формы**.
Множество всех квадратичных форм с вещественными коэффициентами можно разбить на классы эквивалентности,
в каждом из которых будут находиться только конгруэнтные между собой формы.
Каждый из классов полностью описывается каким-то из своих представителей. Таким
представителем можно взять нормальный вид.
Какое преобразование квадратичной формы оставляет ее инвариантной?
!!Т!! **Теорема [Эрмит].** //Квадратичная форма// $ X^{\top}{\mathbf A}X $ //переходит в себя при преобразовании//
$$ X= ({\mathbf A}+S)^{-1}({\mathbf A}-S) Y $$
//где// $ S $ //означает произвольную ((:algebra2:skewsym кососимметричную матрицу)) порядка// $ n $.
**Доказательство.** Обозначим
$$ R=({\mathbf A}+S)^{-1}({\mathbf A}-S) $$
и докажем, что $ R^{\top}{\mathbf A}R= {\mathbf A} $. Используя равенства $ {\mathbf A}^{\top}={\mathbf A} $ ,
$ S^{\top}=-S $, получим:
$$ R^{\top}{\mathbf A}R=({\mathbf A}-S)^{\top} \left(({\mathbf A}+S)^{-1}\right)^{\top}{\mathbf A} ({\mathbf A}+S)^{-1}({\mathbf A}-S)=
$$
$$
=({\mathbf A}+S)\left(({\mathbf A}+S)^{\top}\right)^{-1} {\mathbf A}
({\mathbf A}+S)^{-1}({\mathbf A}-S)=
$$
$$
=({\mathbf A}+S)({\mathbf A}-S)^{-1}\left[\frac{1}{2}({\mathbf A}-S)+ \frac{1}{2}({\mathbf A}+S)\right]({\mathbf A}+S)^{-1}({\mathbf A}-S)=
$$
$$
=\frac{1}{2}({\mathbf A}+S)({\mathbf A}-S)^{-1}({\mathbf A}-S)({\mathbf A}+S)^{-1}({\mathbf A}-S)+
$$
$$
+\frac{1}{2}({\mathbf A}+S)({\mathbf A}-S)^{-1}({\mathbf A}+S)({\mathbf A}+S)^{-1}({\mathbf A}-S)=
$$
$$
=\frac{1}{2}({\mathbf A}-S)+
\frac{1}{2}({\mathbf A}+S)={\mathbf A} \, .
$$
♦
===Знакоопределенность==
Здесь рассматриваются только вещественные квадратичные формы.
Квадратичная форма $ f_{}(X) $ называется
**а)** **неотрицательной** если $ f(X)\ge 0 $ для любого $ X\in \mathbb R^n $;
**б)** **положительно определенной**, если она неотрицательна и $ f(X)= 0 $ только при $ X=\mathbb O_{} $;
**в)** **неопределенной** или **знакопеременной**, если существуют $ \{X_1,X_2\} \subset \mathbb R^n $ такие что числа $ f(X_1) $ и $ f(X_2) $ имеют разные знаки: $ f(X_1)f(X_2)<0 $.
По аналогии с пунктами **а)** и **б)** определяются неположительные и отрицательно определенные квадратичные формы. Иногда неотрицательные или неположительные формы называют **полуопределенными**.
!!П!! **Пример.** При $ n_{}=3 $ квадратичная форма
**а)** $ x_1^2+3x_2^2+4x_3^2 $ является положительно определенной;
**б)** $ x_1^2+x_3^{2} $ (или $ (x_1+{\sqrt 2} x_2-x_3)^{2} $) является неотрицательной, но не положительно определенной;
**в)** $ -x_1^2 $ является неположительной, но не отрицательно определенной;
**г)** $ -x_1^2-2\,x_2^2-4\,x_3^{2} $ является отрицательно определенной;
**д)** $ x_1x_{2}+x_2x_3 $ является неопределенной.
Какой смысл имеет свойство неотрицательности и положительной определенности с точки зрения математического анализа? --- Неотрицательность формы $ f_{}(X) $ означает, что в точке $ X=\mathbb O $ эта функция достигает своего ((:polynomialm#экстремумы_полинома минимального значения)): $ f(X)\ge 0 = f(\mathbb O) $; подчеркнем, что этот минимум будет __глобальным__. В случае положительной определенности точка $ X=\mathbb O $ будет __единственной__ точкой пространства $ \mathbb R^{n} $, в которой $ f_{}(X) $ достигает своего минимального значения. Однако если свойство положительной определенности будет нарушено: $ f(X_1) =0 $ при $ X_1 \ne \mathbb O $, то вследствие ((:polynomialm#однородный_полином однородности)) формы $ f_{}(X) $ будет выполнено
$$ f(tX_1)=t^2f(X_1)= 0 \quad npu \quad \forall t \in \mathbb R \ . $$
Иными словами, свое минимальное значение $ 0_{} $ неотрицательная, но не положительно определенная, форма $ f_{} (X) $ будет принимать на всей прямой, проходящей через точки $ \mathbb O $ и $ \mathbb X_1 $. Точка $ X=\mathbb O $ перестает быть //изолированной// точкой минимума: в любой ее окрестности находятся другие точки минимума. С точки зрения здравого смысла, подобная ситуация может считаться исключительным, вырожденным случаем. Интуиция подтверждается аналитикой: как увидим впоследствии вероятность того, что случайным образом выбранная квадратичная форма, обладающая свойством неотрицательности, не будет, вдобавок, положительно определенной, равна $ 0_{} $.
Событие теоретически возможно, но практически немыслимо.
Какой смысл имеет свойство положительной определенности с точки зрения геометрии? --- Рассмотрим вещественную квадратичную форму от трех переменных: $ f(x,y,z) $. Поставим задачу определения типа поверхности второго порядка
$$ f(x,y,z)=C $$
при произвольной константе $ C\in \mathbb R $. Если $ f $ положительно определена, то это уравнение не имеет вещественных решений при $ C<0 $. При $ C=0 $ уравнение определяет единственную точку в $ \mathbb R^3 $, а именно --- начало координат. При $ C>0 $
уравнение определяет эллипсоид с центром в начале координат. От всех остальных поверхностей второго порядка эллипсоид отличает его замкнутость (и, как следствие, ограниченность).
Оказывается условие положительной определенности формы $ f $ является необходимым и достаточным для обеспечения подобного свойства в произвольном пространстве $ \mathbb R^n $. И это утверждение верно не только для квадратичной формы, но и для ((:polynomialm#odnorodnyj_polinom однородного полинома)) (формы) произвольного порядка.
!!§!! Задача об условных экстремумах квадратичной формы $ f_{}(X) $ на сфере $ x_1^2+\dots+x_n^2 =1 $ решается
☞
((:algebra2:symmetric#Экстремальное_свойство_собственных_чисел ЗДЕСЬ)).
!!П!! **Пример.** В произвольном евклидовом пространстве $ \mathbb E $ квадратичная форма с ((:euclid_space#определения матрицей Грама)) произвольной системы векторов $ \{X_1,\dots,X_m\} \subset \mathbb E $
$$ G(X_1,\dots,X_m)=
\left(
\begin{array}{cccc}
\langle X_1,X_1 \rangle & \langle X_1,X_2 \rangle & \dots & \langle X_1,X_m \rangle \\
\langle X_2,X_1 \rangle & \langle X_2,X_2 \rangle & \dots & \langle X_2,X_m \rangle \\
\dots & & & \dots \\
\langle X_m,X_1 \rangle & \langle X_m,X_2 \rangle & \dots & \langle X_m,X_m \rangle
\end{array}
\right)
$$
будет неотрицательной; эта квадратичная форма будет положительно определенной тогда и только тогда, когда система $ \{X_1,\dots,X_m\} $ линейно независима.
Задача.
Найти условия неотрицательности и положительной определенности квадратичной формы в терминах ее коэффициентов.
Очевидны необходимые условия неотрицательности квадратичной формы
$$ f(X)=\displaystyle \sum_{1\le j \le k \le n} f_{jk}x_jx_k \ : $$
все коэффициенты при квадратах переменных должны быть неотрицательными:
$$ f_{11}\ge 0, \dots , f_{nn}\ge 0 . $$
Также очевидно, что эти условия будут и достаточными, если все остальные коэффициенты $ f_{jk}^{} $ при $ j\ne k $
равны нулю. Если же последнее условие не выполняется, то имеет смысл предварительно преобразовать квадратичную форму к сумме квадратов, т.е.
исследовать ее канонический вид.
!!Т!! **Теорема.** //Ненулевая квадратичная форма, представленная в ((#матричная_форма_записи_квадратичной_формы правильном виде))//
$$ f(X)=X^{\top}{\mathbf A}X \, , $$
//будет неотрицательной тогда и только тогда, когда ее ((#закон_инерции отрицательный индекс инерции)) равен нулю://
$$ n_{-} ({\mathbf A})=0 \qquad \iff \qquad \qquad \sigma (
{\mathbf A})=\operatorname{rank} {\mathbf A} \ .$$
//Если это условие выполнено, то для положительной определенности формы необходимо и достаточно чтобы она была невырождена:// $ \det {\mathbf A} \ne 0 $.
**Доказательство**
☞
((./2form/sylv_crit ЗДЕСЬ)).
К счастью, явное представление канонического вида квадратичной формы уже имеется --- как правило, он задается ((#формула_якоби формулой Якоби)). Индексы инерции
((#закон_инерции вычисляются)) через знаки главных миноров матрицы квадратичной формы.
!!Т!! **Теорема [Сильвестр].** //Квадратичная форма//
$$
f(X)=X^{\top}{\mathbf A}X
$$
//будет положительно определенной тогда и только тогда, когда все ((:algebra2:dets#миноры_и_алгебраические_дополнения главные миноры)) ее матрицы положительны//:
$$
a_{11}>0, \ \left| \begin{array}{cc}
a_{11} & a_{12} \\
a_{12} & a_{22}
\end{array} \right| >0, \ \left| \begin{array}{ccc}
a_{11} & a_{12} & a_{13} \\
a_{12} & a_{22} & a_{23} \\
a_{13} & a_{23} & a_{33}
\end{array} \right| >0, \dots, \det {\mathbf A} >0 \ .
$$
**Доказательство**
☞
((./2form/sylv_crit ЗДЕСЬ)).
!!=>!! Квадратичная форма будет отрицательно определенной тогда и только тогда, когда знаки главных миноров ее матрицы будут чередоваться следующим образом:
$$
a_{11}<0, \ \left| \begin{array}{cc}
a_{11} & a_{12} \\
a_{12} & a_{22}
\end{array} \right| >0, \ \left| \begin{array}{ccc}
a_{11} & a_{12} & a_{13} \\
a_{12} & a_{22} & a_{23} \\
a_{13} & a_{23} & a_{33}
\end{array} \right| <0, \dots, (-1)^n\det {\mathbf A} >0 \ .
$$
В настоящем ресурсе я буду часто говорить об **определенности** или **неопределенности** вещественной **симметричной матрицы**, имея в виду соответствующее свойство порождаемой ею квадратичной формы. Имеется одна особенность в определении симметричной матрицы, задающей неотрицательную квадратичную форму, не являющуюся положительно определенной. Такую матрицу НЕ называют неотрицательной (этот термин закреплен за ((:algebra2#положительная другим понятием)) теории матриц); такую матрицу называют **положительно полуопределенной**[[positive semidefinite]].
!!П!! **Пример.** Найти все значения параметра $ {\color{Red} \alpha } $, при которых
квадратичная форма
$$2\, x_1^2+2\, x_2^2+x_3^2+ 2\, {\color{Red}{ \alpha} } \, x_1x_2+6\, x_1x_3 +2\,x_2x_3 $$
будет положительно определенной.
**Решение.** Значения главных миноров:
$$\det {\mathbf A}_1=2,\ \det {\mathbf A}_2=4- {\color{Red} \alpha }^2,\ \det {\mathbf A}_3=-{\color{Red} \alpha }^2+
6\, {\color{Red} \alpha } -16 \ . $$
Последнее выражение будет отрицательно при любых $ {\color{Red} \alpha } \in \mathbb R $.
**Ответ.** Таких значений нет: $ {\color{Red} \alpha } \in \varnothing $.
Можно ли получить условия __неотрицательности__ квадратичной формы:
$$ f(X) \ge 0 \ npu \ \forall X \in {\mathbb R}^n $$
превращением всех неравенств из критерия Сильвестра в нестрогие: $ > \ \to {\color{Red}{ \to} } \ \ge $
?
--- Вообще говоря, нет.
!!П!! **Пример.**
Квадратичная форма
$$f(x_1,x_2,x_3,x_4)=x_1^2+2x_1x_3+2x_2x_4+x_4^2=
X^{\top} \left(
\begin{array}{cccc}
1&0&1 &0 \\
0&0&0&1 \\
1&0&0&0 \\
0&1&0&1
\end{array} \right)X
$$
--- неопределенная, т.к. $ f(1,0,-1,0)=-1_{}<0 $, а $ f(1,0,0,0)=1_{}>0 $. Тем не менее, все главные миноры ее матрицы неотрицательны.
♦
Имеются ли конструктивные необходимые и достаточные условия неотрицательности квадратичной формы?
!!Т!! **Теорема.** //Для неотрицательности квадратичной формы// $ X^{\top} \mathbf A X $ //необходимо и достаточно, чтобы все ((:algebra2/dets#миноры_и_алгебраические_дополнения ведущие миноры)) матрицы// $ \mathbf A $,// т.е. миноры, стоящие на пересечении строк и столбцов матрицы с одинаковыми номерами//
$$
A\left(
\begin{array}{lll}
j_1 & \dots & j_k \\
j_1 & \dots & j_k
\end{array}
\right) \ , j_10 $ при всех $ X\in \mathbb V_1, X \ne \mathbb O $.
!!Т!! **Теорема.** //Пусть линейное подпространство задано системой линейных однородных уравнений//
$$
\left\{ \begin{array}{cccc}
h_{11}x_1 & + \dots & + h_{1n}x_n&=0, \\
\dots & & & \dots \\
h_{k1}x_1 & + \dots & + h_{kn}x_n&=0, \\
\end{array}
\right. \qquad \iff \qquad
\underbrace{\left(
\begin{array}{lll}
h_{11} & \dots & h_{1n} \\
\dots & & \dots \\
h_{k1} & \dots & h_{kn}
\end{array}
\right)}_{=H}X=\mathbb O
$$
//Здесь// $ k
Результат приведен в ((#источники [3])) со ссылкой на статью ((#источники [4])), однако у меня есть основания считать, что он был известен еще Борхардту.
==Приведение квадратичной формы к каноническому виду с помощью ортогональной замены переменных==
В этом пункте рассматриваются только вещественные квадратичные формы.
Существенно используются материалы из раздела ((:algebra2:symmetric СИММЕТРИЧНАЯ МАТРИЦА)) и начальный пункт раздела ((algebra2/ort_matrix ОРТОГОНАЛЬНАЯ МАТРИЦА)).
!!Т!!** Теорема.** //Cуществует замена переменных//
$$ X=PY \ , $$
//c ((:algebra2/ort_matrix ортогональной матрицей))// $ P_{} $, //приводящая квадратичную форму// $ f(X)=X^{\top} \mathbf A X $ //к каноническому виду//
$$ \lambda_1 y_1^2 + \lambda_2 y_2^2+ \dots + \lambda_n y_n^2 ; $$
//при этом коэффициентами канонического вида являются ((:algebra2:charpoly#собственное_число собственные числа)) матрицы// $ \mathbf A $ (//более точно: набор// $ \{ \lambda_1,\dots, \lambda_n \} $ //составляет ((:algebra2:charpoly#собственное_число спектр матрицы))// $ \mathbf A $).
**Доказательство**
☞
((:algebra2:symmetric:vspom1 ЗДЕСЬ)).
!!П!! **Пример.** Найти ортогональную замену переменных, приводящую квадратичную форму
$$ X^{\top} \mathbf A X \quad
npu \quad
{\mathbf A}=\left(\begin{array}{rrr}
2 & 2 & -1 \\
2 & -1 & 2 \\
-1& 2 & 2
\end{array}
\right)
$$
к каноническому виду.
**Решение.** Характеристический полином $ \det (\mathbf A- \lambda E)=-(\lambda-3)^2(\lambda+3) $.
Простому собственному числу $ \lambda=-3 $ соответствует собственный вектор
$ {\mathfrak X}_1=[1,-2,1]^{^{\top}} $, а собственному числу $ \lambda=3 $ второй кратности соответствуют
два линейно-независимых собственных вектора $ {\mathfrak X}_2=[2,1,0]^{^{\top}} $ и
$ {\mathfrak X}_3=[-1,0,1]^{^{\top}} $. Очевидно, что
$ \langle {\mathfrak X}_1, {\mathfrak X}_2\rangle=0 , \langle {\mathfrak X}_1, {\mathfrak X}_3 \rangle =0 $, но
$ \langle {\mathfrak X}_2, {\mathfrak X}_3 \rangle \ne 0 $. Ортогонализуем систему
векторов $ \left\{{\mathfrak X}_2,{\mathfrak X}_3\right\} $:
$${\mathfrak Y}_2={\mathfrak X}_2, {\mathfrak Y}_3={\mathfrak X}_3+ {\color{Red} \alpha } {\mathfrak Y}_2
\quad \mbox{ и } \ \langle {\mathfrak Y}_2,{\mathfrak Y}_3\rangle =0 \
\Longrightarrow {\color{Red} \alpha }=-\frac{\langle {\mathfrak X}_2,{\mathfrak X}_3\rangle}
{\langle {\mathfrak X}_2,{\mathfrak X}_2\rangle}=\frac{2}{5}
$$
и $ {\mathfrak Y}_3=\left[-1/5, 2/5, 1 \right]^{^{\top}} $.
После нормирования, получаем ортогональную матрицу
$$
P=\left(\begin{array}{rrr}
1/\sqrt{6} & 2/\sqrt{5} & -1/\sqrt{30} \\
-2/\sqrt{6} & 1/\sqrt{5} & 2/\sqrt{30} \\
1/\sqrt{6} & 0 & 5/\sqrt{30}
\end{array}
\right) \ .
$$
Замена переменных $ X=PY $ приводит квадратичную форму $ X^{\top} \mathbf A X $ к каноническому виду
$$
(y_1,y_2,y_3)
\left(\begin{array}{rrr}
-3 & 0 & 0 \\
0 & 3 & 0 \\
0& 0 & 3
\end{array}
\right)
\left(
\begin{array}{c}
y_1 \\ y_2 \\ y_3
\end{array}
\right)=-3\,y_1^2+3\,y_2^2+3\,y_3^2 \ .
$$
Поскольку фундаментальную систему решений системы уравнений $ (\mathbf A - \lambda_j E)X= \mathbb O $ для кратного собственного числа $ \lambda_j $ можно строить разными способами, то у последней задачи имеется бесконечное
множество ответов. Так, например, в качестве еще одной ортогональной
матрицы можно взять
$$P=\left(\begin{array}{rrr}
1/\sqrt{6} & -1/\sqrt{2} & 1/\sqrt{3} \\
-2/\sqrt{6} & 0 & 1/\sqrt{3} \\
1/\sqrt{6}& 1/{\sqrt 2} & 1/\sqrt{3}
\end{array}
\right).
$$
!!Т!! **Теорема.** //Если известны коэффициенты характеристического полинома матрицы квадратичной формы// $ f(X)=X^{\top}\mathbf A X $:
$$ \det (\mathbf A- \lambda E) \equiv (-1)^n \left(\lambda^n+a_{1}\lambda^{n-1}+ \dots + a_n \right) \, ,$$
//то//
$$ \operatorname{rank} (f(X))={\mathfrak r} \iff
a_{n}=a_{n-1}=\dots=a_{{\mathfrak r}+1}=0,a_{{\mathfrak r}}\ne 0 \, . $$
//В этом случае будет также выполнено//
$$ n_{+} (f(X))={\mathcal V}(1,a_1,\dots,a_{{\mathfrak r}}),\quad
n_{-} (f(X))={\mathcal P}(1,a_1,\dots,a_{\mathfrak r}) \, , $$
$$ \sigma(f(X))=\sum_{j=1}^{\mathfrak r} \operatorname{sign} (a_{j-1}a_j) \quad npu \quad a_0=1 \, . $$
**Доказательство** основано на ((:polynomial:descartes правиле знаков Декарта)).
==Геометрия замен переменных==
В предыдущих пунктах мы рассмотрели два подхода к построению канонического вида квадратичной формы. Очевидно, что подход, основанный на ортогональной замене переменных более дорогостоящий в построении по сравнению с методом Лагранжа. В самом деле, он требует нахождения собственных чисел симметричной матрицы, т.е. решения алгебраического уравнения $ \det (\mathbf A - \lambda E)=0 $. В случае матриц порядка $ n> 4 $ корни этого уравнения, как правило, на находятся в виде "хорошей" комбинации коэффициентов, и могут быть определены разве лишь приближенно. Метод же Лагранжа принципиально безошибочен: коэффициенты канонического вида определяются в виде рациональных функций от коэффициентов квадратичной формы.
!!П!! **Пример.** Уравнение $ 1/3x_1^2-x_1x_2+x_2^2=1 $ задает на плоскости эллипс:
{{ el1.png |}}
{{el2.png |}} {{ el3.png|}}
Преобразование
$$
y_1=x_1-3/2x_2, y_2=x_2
$$
приводит уравнение к виду
$$ 1/3 y_1^2+1/4 y_2^2=1 ; $$
в новых координатах кривая имеет вид на рисунке слева. С другой стороны, преобразование
$$
\begin{array}{ll}
z_1&= \sqrt{1/2+1/\sqrt{13}}\,x_1+\sqrt{1/2-1/\sqrt{13}}\,x_2,\\
z_2&= \sqrt{-1/2-1/\sqrt{13}}\,x_1+\sqrt{1/2+1/\sqrt{13}}x_2
\end{array}
$$
приводит уравнение к виду
$$\frac{4-\sqrt{13}}{6}z_1^2+\frac{4+\sqrt{13}}{6}z_2^2=1 \ . $$
В этих координатах кривая имеет вид на рисунке справа.
Оба преобразования координат не изменяют типа кривой: эллипс остается эллипсом. Но второе преобразование дает нечто большее: оно сохраняет размеры. Фактически, оно сводится к повороту исходного эллипса.
**Вывод.** Метод Лагранжа "дешевле" метода ортогональных преобразований при решении задачи классификации алгебраических многообразий, заданных уравнением вида $ X^{\top} \mathbf A X=1 $. Иными словами, он позволяет "дешевле" определить тип поверхности с точностью до ее формы: например, в $ \mathbb R^3 $ является ли эта поверхность эллипсоидом или гиперболоидом (и каким именно --- однополостным или двуполостным)? Но если нас интересуют истинные размеры этой поверхности: например, размеры посылочного ящика, в который эллипсоид, заданный уравнением $ X^{\top} \mathbf A X=1 $, можно было бы ((:algebra2:symmetric#экстремальное_свойство_собственных_чисел поместить)) --- то здесь без собственных векторов и чисел матрицы $ \mathbf A $ не обойтись!
Здесь уместно вспомнить замечание о невырожденности замены переменных, приводящей квадратичную форму к каноническому виду.
В чем заключается его геометрический смыcл? Для ответа на вопрос обратимся к приведенному выше примеру.
Сделаем в квадратичной форме замену переменных зависящей от параметра:
$$ x_1=t_1+\alpha t_2, x_2=t_1+t_2 \, . $$
{{ eltt.png |}}
На рисунке изображены получаемые в результате такой замены кривые при различных значениях параметра. И если при значениях $ \alpha=0.4 $ и $ \alpha=0.7 $ мы еще можем визуально распознать эллипс, то значение $ \alpha=0.9 $ заставляет подозревать, что соответствующая кривая при сильном растяжении разрывается на два куска, близкие к прямым. Именно это и происходит при $ \alpha=1 $. Вместо двух существенных переменных $ x_1 $ и $ x_2 $, у нас остается, фактически, одна, а именно $ t_1 + t_2 $, а нелинейная кривая выродилась в две прямые линии.
==Билинейные формы==
==Задачи==
☞
((./2form/problems ЗДЕСЬ))
==Источники==
[1]. **Гантмахер Ф.Р.** //Теория матриц.// 4-е изд. М.Наука. 1988.
[2]. **Knuth D.E.** A permanent inequality. //American Math. Monthly//, v. 88, N 10, 1981, p.731--740
[3]. **Шилов Г.Е.** //Математический анализ. Конечномерные линейные пространства//. М.Наука.1969, с.243
[4]. **Шостак Р.Я.** //О признаке условной определённости квадратичной формы n переменных, подчинённых линейным связям, и о достаточном признаке условного экстремума функций n переменных//, УМН, 9:2(60) (1954), 199–206
[5]. **Иохвидов И.С.** //Ганкелевы и теплицевы матрицы и формы.// М. Наука. 1974.
[6]. **Turnbull H.W.** //The Theory of Determinants, Matrices and Invariants.// Blackie & Sons Ltd. 1929.