Содержание

Квадратичная форма
Закон инерции для квадратичных форм
Приведение квадратичной формы к каноническому виду с помощью ортогональной замены переменных
Геометрия замен переменных
Билинейные формы
Задачи
Источники

Квадратичная форма

$ \mathbb A_{} $ означает одно из множеств: $ \mathbb Q_{} $ рациональных, или $ \mathbb R_{} $ вещественных, или $ \mathbb C_{} $ комплексных чисел.

Определение

Квадратичной формой над множеством $ \mathbb A_{} $ называют однородный полином второй степени с коэффициентами из $ \mathbb A_{} $; если переменные обозначить $ x_1,\dots,x_{n} $, то общий вид квадратичной формы от этих переменных: $$ f(x_1,\dots,x_{n} )= \sum_{1\le j \le k \le n} f_{jk}x_jx_k= $$ $$\begin{array}{llll} \displaystyle= f_{11}x_1^2&+f_{12}x_1x_2&+ \dots & +f_{1n}x_1x_n+ \\ &+f_{22}x_2^2 &+ \dots & +f_{2n}x_2x_n+ \\ &+\dots & & +\dots + \\ & & +f_{jk}x_jx_k & + \dots+ \\ & & &+f_{nn}x_n^2. \end{array} $$

П

Пример. Функции

$$x_1^2-x_1x_2+x_3^2 \, , \quad \sqrt{3}\, x_2^2 - \pi\, x_3^2 \, , \quad -x_1x_2 \, , \quad \mathbf i \, x_1^2$$ являются квадратичными формами. Функции $$x_1^2-3\, x_1+1 \, , \quad 5\, x_1^2x_2^2 \, , \quad \frac{x_1x_3^2}{x_2} \, , \quad \sqrt{x_1x_2x_3x_4} $$ не являются квадратичными формами.

Заметим, что в выражении для квадратичной формы присутствуют как квадраты переменных $ x_1^2,\dots,x_n^2 $ так и их смешанные произведения $ x_j x_k $. Говорят, что квадратичная форма $ f(x_1,\dots,x_{n} ) $ имеет канонический вид если $$f(x_1,\dots,x_{n} )\equiv f_{11}x_1^2+f_{22}x_2^2+\dots+f_{nn}x_n^2 \quad npu \quad \left\{f_{jj}\right\}_{j=1}^n \subset \mathbb A \ , $$ т.е. все коэффициенты при смешанных произведениях переменных равны нулю; в этом случае говорят также, что форма является «суммой квадратов»¹⁾.

Оказывается, что в любой квадратичной форме можно так сгруппировать входящие в нее одночлены, что в результате получится ее (эквивалентное) представление в виде суммы квадратов.

П

Пример.

$$ 2\, x_1^2+4\, x_1x_2 +x_2^2 \equiv 2\, (x_1+x_2)^2-x_2^2 \equiv -2\,x_1^2 + (2\,x_1+x_2)^2 \ ; $$ $$ x_1^2+2 \mathbf i x_1x_2 - x_2^2 \equiv (x_1+ \mathbf i x_2)^2 \ ; $$ $$-x_1^2+6\,x_1x_2+6\,x_1x_3+2\,x_2^2+4\,x_2x_3+2\,x_3^2\equiv $$ $$ \equiv (x_1+x_2+x_3)^2-2\,(x_1-x_2-x_3)^2+3\,(x_2+x_3)^2 \equiv $$ $$\equiv -(x_1+3\,x_2+3\,x_3)^2+11\,(x_2+x_3)^2 \ ; $$ $$ x_1x_2 \equiv \frac{1}{4} (x_1+x_2)^2- \frac{1}{4} (x_1-x_2)^2 \ . $$

А в общем случае: $$ f(x_1,\dots,x_{n} )\equiv $$ $$ \begin{array}{l} \equiv a_1(c_{11}x_1+c_{12}x_2+\dots+c_{1n}x_n)^2 +\\ +a_2(c_{21}x_1+c_{22}x_2+\dots+c_{2n}x_n)^2+ \\ +\dots+ \\ +a_n(c_{n1}x_1+c_{n2}x_2+\dots+c_{nn}x_n)^2 \end{array} $$ при $ \{a_j\}_{j=1}^n,\{c_{jk}\}_{j,k=1}^n $ — константах. Такое представление оказывается достаточно удобным для анализа квадратичной формы — например, в случае вещественных форм, при проверке выполнимости неравенства вида $ f(x_1,\dots,x_{n} ) \ge 0 $. Приведенные выше примеры показывают неоднозначность представления в виде суммы квадратов: вид квадратов и даже их количество для одной и той же формы могут быть различными. С целью обеспечения частичной унификации установим некоторое дополнительное ограничение, а именно, потребуем, чтобы линейные однородные формы $$ c_{11}x_1+c_{12}x_2+\dots+c_{1n}x_n, \ c_{21}x_1+c_{22}x_2+\dots+c_{2n}x_n,\dots, c_{n1}x_1+c_{n2}x_2+\dots+c_{nn}x_n $$ были линейно независимыми. При таком ограничении любое представление квадратичной формы в виде суммы квадратов называется каноническим видом квадратичной формы.

Задача. Для произвольной квадратичной формы $ f(x_1,\dots,x_{n} ) $ построить (хотя бы один) ее канонический вид.

Поставленная задача имеет существенное значение для анализа

произвольного полинома ²⁾ нескольких переменных на максимумы и минимумы;
геометрии линий второго порядка на плоскости и поверхностей второго порядка в пространстве; например, по набору коэффициентов уравнения, задающего кривую

$$ x^2 -2\,xy+3\,y^2+x-4\,y-15=0 $$ определить к какому типу (эллипс, гипербола, парабола,…) она относится.

Метод Лагранжа приведения квадратичной формы к каноническому виду

Существует универсальный алгоритм, приводящий произвольную квадратичную форму к каноническому виду.

Метод Лагранжа

1. Пусть $ f_{11}\ne 0 $. Выделим в $ f(x_1,\dots, x_n)_{} $ все слагаемые, содержащие $ x_{1} $: $$ f_{11}x_1^2+f_{12}x_1x_2+ \dots +f_{1n}x_1x_n+ \sum_{2\le j\le k \le n} f_{jk}x_jx_k = $$ $$ = f_{11}\left(x_1^2+\frac{f_{12}}{f_{11}}x_1x_2+\dots+ \frac{f_{1n}}{f_{11}}x_1x_n \right)+\dots= $$ $$ =f_{11}\left[ \left(x_1+\frac{f_{12}}{2f_{11}}x_2+\dots+ \frac{f_{1n}}{2f_{11}}x_n \right)^2-\left(\frac{f_{12}}{2f_{11}}x_2+\dots+ \frac{f_{1n}}{2f_{11}}x_n \right)^2 \right]+\dots= $$ $$ =f_{11} \left(x_1+\frac{f_{12}}{2f_{11}}x_2+\dots+ \frac{f_{1n}}{2f_{11}}x_n\ \right)^2 - f_{11}\left(\frac{f_{12}}{2f_{11}}x_2+\dots+ \frac{f_{1n}}{2f_{11}}x_n \right)^2 +\dots $$ В последнем представлении первое слагаемое представляет собой квадрат линейной формы по переменным $ x_{1},x_2,\dots,x_n $; все оставшиеся слагаемые не зависят от $ x_{1} $, т.е. составляют квадратичную форму от переменных $ x_{2},\dots,x_n $. Таким образом, исходная задача для формы $ n_{} $ переменных оказывается сведенной к случаю формы $ (n-1)_{} $-й переменной; последняя преобразуется по аналогичному принципу.

2. Если $ f_{11}=0 $, но $ \exists k:\ f_{kk}\ne 0 $, т.е. при хотя бы одном квадрате переменной коэффициент отличен от нуля. Алгоритм модифицируется таким образом, чтобы выделение полного квадрата начиналось с переменной $ x_{k} $ вместо $ x_{1} $ — первая ничем не лучше (и не хуже) $ k_{} $-й!

3. Совсем исключительный случай: квадраты переменных вообще отсутствуют, т.е. $ f_{11}=\dots=f_{nn}=0 $. Выбираем один из ненулевых коэффициентов при смешанных произведениях переменных: пусть $ f_{jk}\ne 0 $. Представляем $ x_k=(x_j+x_k)-x_j $ и заменяем все вхождения переменной $ x_{k} $ на $ X_k-x_j $ при вспомогательной переменной $ X_k=x_j+x_k $. В новой квадратичной форме уже присутствует квадрат переменной $ x_{j} $ с ненулевым коэффициентом. Тем самым этот случай сводится к предыдущему. После приведения новой формы к сумме квадратов возвращаемся к «старой» переменной $ x_{k} $.

П

Пример. Привести форму

$$ f=4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$ к каноническому виду.

Решение. $$ \begin{array}{ccl} f&=&4\left(x_1^2-x_1x_2-x_1x_3+x_1x_4\right)+2x_2^2+x_3^2+x_4^2+4x_2x_3-4x_3x_4=\\ &=&4\bigg[ \left(x_1-\frac{1}{2}\, x_2-\frac{1}{2}\,x_3+ \frac{1}{2}\,x_4\, \right)^2- \left(-\frac{1}{2}\, x_2-\frac{1}{2}\, x_3+\frac{1}{2}\, x_4\right)^2 \bigg] + \\ &+&2\,x_2^2+x_3^2+x_4^2+4\,x_2x_3-4\,x_3x_4= \\ &=&4\,\left(x_1-\frac{1}{2}\, x_2-\frac{1}{2}\,x_3+ \frac{1}{2}\,x_4\, \right)^2+\\ & & + \Big[\left(x_2+x_3+x_4\, \right)^2- \left(x_3+x_4 \right)^2\Big]-2\,x_3x_4 = \\ &=&4\,\left(x_1-\frac{1}{2}\, x_2-\frac{1}{2}\,x_3+ \frac{1}{2}\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2- \\ &&-x_3^2-4\,x_3x_4-x_4^2= \\ && 4\,\left(x_1-\frac{1}{2}\, x_2-\frac{1}{2}\,x_3+ \frac{1}{2}\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2- \\ &&-\Big[ \left(x_3+ 2\, x_4\, \right)^2-4\, x_4^2\Big] -x_4^2 = \\ &=&4\,\left(x_1-\frac{1}{2}\, x_2-\frac{1}{2}\,x_3+ \frac{1}{2}\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2-\left(x_3+ 2\, x_4\, \right)^2+3\,x_4^2 \end{array} $$

Ответ. $ f\equiv 4\,\left(x_1-\frac{1}{2}\, x_2-\frac{1}{2}\,x_3+ \frac{1}{2}\,x_4\, \right)^2+ \left(x_2+x_3+x_4\, \right)^2-\left(x_3+ 2\, x_4\, \right)^2+3\,x_4^2 $.

П

Пример. Привести форму

$$ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$ к каноническому виду.

Решение. $$ f\equiv (x_1+x_2+3\,x_3)^2-(x_2+3\,x_3)^2+x_2^2-4\,x_3^2+4\,x_2x_3 \equiv $$ $$ \equiv (x_1+x_2+3\,x_3)^2-2\,x_2x_3 -13\,x_3^2 \equiv $$ В соответствии с алгоритмом, на следующем шаге нужно выделять слагаемые, содержащие переменную $ x_{2} $, но коэффициент при $ x_2^2 $ в правой части формулы обратился в нуль. Поэтому — в соответствии с пунктом 2 метода — приходится выделять квадрат на основе переменной $ x_{3} $: $$ (x_1+x_2+3\,x_3)^2-13\, \left(x_3-\frac{1}{13}x_2\right)^2+13\cdot \frac{1}{13^2}x_2^2 \ . $$

Ответ. $ (x_1+x_2+3\,x_3)^2-13\, \left(x_3-\frac{1}{13}x_2\right)^2+ \frac{1}{13}x_2^2 $.

П

Пример. Привести форму

$$ f=x_1x_2-3\,x_1x_3+2\,x_2x_3 $$ к каноническому виду.

Решение. Коэффициенты при квадратах переменных все равны нулю. Действуем в соответствии с пунктом 3 метода Лагранжа. Поскольку коэффициент при $ x_1x_2 $ отличен от нуля, делаем замену переменной $ x_2=X_2-x_1 $ при $ X_2=x_1+x_2 $: $$ f\equiv -x_1^2+x_1X_2-5\,x_1x_3+2\,X_2x_3 \ . $$ Дальнейший ход решения — в соответствии с пунктом 1 метода Лагранжа: $$ -\left(x_1-\frac{1}{2}X_2+\frac{5}{2}x_3\right)^2+\left(-\frac{1}{2}X_2+\frac{5}{2}x_3\right)^2+2\,X_2x_3 \equiv $$ $$ \equiv -\left(x_1-\frac{1}{2}X_2+\frac{5}{2}x_3\right)^2+\frac{1}{4}X_2^2-\frac{1}{2}X_2x_3+\frac{25}{4}x_3^2 \equiv $$ $$ \equiv -\left(x_1-\frac{1}{2}X_2+\frac{5}{2}x_3\right)^2+\frac{1}{4}\left(X_2-x_3 \right)^2+6\,x_3^2 \ $$ Получили сумму квадратов форм от переменных $ x_1,X_2,x_3 $. Возвращаемся к переменной $ x_{2} $:

Ответ. $ -(\frac{1}{2}x_1-\frac{1}{2}x_2+\frac{5}{2}x_3)^2+\frac{1}{4}(x_1+x_2-x_3)^2+6\,x_3^2 $.

Метод Лагранжа позволяет получить канонический вид квадратичной формы над тем же множеством $ \mathbb A_{} $, над которым рассматривается исходная форма — например, если коэффициенты формы $ f_{} $ являются рациональными, то и коэффициенты ее канонического вида (т.е. числа $ \{a_j\}_{j=1}^n,\{c_{jk}\}_{j,k=1}^n $) будут также рациональными.

Матричная форма записи квадратичной формы

В этом и последующих пунктах существенно потребуется знание ключевых понятий ТЕОРИИ МАТРИЦ и ОПРЕДЕЛИТЕЛЕЙ.

Задача. Установить правило формирования коэффициентов канонического вида квадратичной формы, получающегося применением метода Лагранжа.

Прежде всего, соберем все переменные в один вектор, а вернее — в два вектора: $$ {}_{.} \mbox{ столбец переменных } X= \left(\begin{array}{l} x_1 \\ \vdots \\ x_n \end{array} \right) \quad \mbox{ и строку переменных } X^{\top} = (x_1,\dots,x_n) \ ; $$ здесь $ {}^{\top} $ означает транспонирование. Не очень принципиально, что обозначать через $ X_{} $ — столбец или строку; и хотя сокращение $ f(x_1,\dots,x_n)=f(X) $ кажется не вполне корректным с точки зрения только что введенного обозначения, тем не менее не будем навешивать в правую часть дополнительные значки…

Если определить верхнетреугольную матрицу $ \mathbf F $ равенством: $$ {\mathbf F}= \left( \begin{array}{cccc} f_{11}&f_{12}&\dots &f_{1n} \\ &f_{22}& \dots & f_{2n} \\ \mathbb O & &\ddots & \vdots \\ & & & f_{nn} \end{array} \right), $$ то квадратичную форму можно записать в виде произведения трех матриц $$ {}_{.} \mbox{ строка переменных } \times \mbox{ матрица } \times \mbox{ столбец переменных } $$ $$ f(X)=X^{\top} {\mathbf F}X \ .$$ Более того, можно написать бесконечно много подобных представлений для одной и той же квадратичной формы $ f_{} $, подбирая разные матрицы

П

Пример. $ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 \equiv $

$$ \equiv (x_1,x_2,x_3) \left( \begin{array}{rrr} 1 & 2 & 6 \\ 0 & 1 & 4 \\ 0 & 0 & -4 \end{array} \right) \left( \begin{array}{l} x_1 \\ x_2 \\ x_3 \end{array} \right) \equiv (x_1,x_2,x_3) \left( \begin{array}{rrr} 1 & 0 & 3 \\ 2 & 1 & 4 \\ 3 & 0 & -4 \end{array} \right) \left( \begin{array}{l} x_1 \\ x_2 \\ x_3 \end{array} \right)\equiv $$ $$ \equiv (x_1,x_2,x_3) \left( \begin{array}{rrr} 1 & 1 & 3 \\ 1 & 1 & 2 \\ 3 & 2 & -4 \end{array} \right) \left( \begin{array}{l} x_1 \\ x_2 \\ x_3 \end{array} \right)\equiv \dots $$ ♦

Из всего этого бесконечного множества представлений выделим одно. Рассмотрим матрицу $${\mathbf A}=\frac{{\mathbf F}+{\mathbf F}^{\top}}{2}= \left( \begin{array}{cccc} f_{11}& \frac{1}{2} f_{12}&\dots & \frac{1}{2} f_{1n} \\ \frac{1}{2} f_{12} &f_{22}& \dots & \frac{1}{2} f_{2n} \\ \dots & & & \dots \\ \frac{1}{2} f_{1n} & \frac{1}{2} f_{2n} & \dots & f_{nn} \end{array} \right), $$ которая, очевидно, симметрична: $ {\mathbf A}^{\top}={\mathbf A} $. Тогда $$ f(X)=\sum_{1\le j,k \le n} a_{jk}x_jx_k=X^{\top}{\mathbf A}X \ . $$ Это представление называют правильной записью квадратичной формы; матрицу $ {\mathbf A} $ называют матрицей квадратичной формы $ f_{} $, а $ \det \mathbf A $ — дискриминантом квадратичной формы: $$ \det A = {\mathcal D} (f) \ . $$ В случае равенства дискриминанта нулю квадратичная форма называется вырожденной, в противном случае — невырожденной.

П

Пример. Для приведенной выше квадратичной формы

$$ f=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$ ее правильной записью будет именно последняя: $$ f\equiv (x_1,x_2,x_3) \left( \begin{array}{rrr} 1 & 1 & 3 \\ 1 & 1 & 2 \\ 3 & 2 & -4 \end{array} \right) \left( \begin{array}{l} x_1 \\ x_2 \\ x_3 \end{array} \right) $$ Правило формирования матрицы довольно просты: на диагонали ставятся коэффициенты при квадратах, а внедиагональные элементы получаются располовиниванием коэффициентов при смешанных произведениях переменных.

	$ x_{1} $	$ x_{2} $	$ x_{3} $
$ x_{1} $	$ f_{11} $	$ \frac{1}{2}f_{12} $	$ \frac{1}{2}f_{13} $
$ x_{2} $	$ \frac{1}{2}f_{12} $	$ f_{22} $	$ \frac{1}{2}f_{23} $
$ x_{3} $	$ \frac{1}{2}f_{13} $	$ \frac{1}{2}f_{23} $	$ f_{33} $

П

Пример. Для

$$ f(x_1,x_2)=a_{11}x_1^2+2\, a_{12}x_1x_2+a_{22}x_2^2 $$ имеем: $$ {\mathbf A} = \left( \begin{array}{ll} a_{11} & a_{12} \\ a_{12} & a_{22} \end{array} \right) \ ; \ {\mathcal D} (f)=a_{11}a_{22}-a_{12}^2 \ ; $$ последнее выражение вполне напоминает дискриминант квадратного трехчлена $ a_{11}x^2+2\, a_{12}x+a_{22} $ и это обстоятельство оправдывает использование слова дискриминант для нового объекта…

Матрица квадратичной формы совпадает с половиной матрицы Гессе этой формы: $ \mathbf A = 1/2 H(f) $.

Причина, по которой из бесконечного многообразия матричных представлений квадратичной формы выделяется именно то, что использует симметричную матрицу, остается пока непонятной. Отложив ненадолго обсуждение этой причины, попробуем переписать в матричных терминах приведение квадратичной формы к каноническому виду.

Рассмотрим замены переменных в квадратичной форме, т.е. переход от переменных $ x_{1},\dots,x_{n} $ к новым переменным $ y_{1},\dots,y_{n} $. Ограничимся только линейными заменами вида $$ \left\{ \begin{array}{ccc} x_1&=&c_{11}y_1+c_{12}y_2+\dots+c_{1n}y_n, \\ x_2&=&c_{21}y_1+c_{22}y_2+\dots+c_{2n}y_n, \\ \dots & & \dots \\ x_n&=&c_{n1}y_1+c_{n2}y_2+\dots+c_{nn}y_n. \end{array} \right. $$ Результатом такой замены переменных будет новая квадратичная форма относительно новых переменных. Установим по какому закону формируются ее коэффициенты. С этой целью введем в рассмотрение матрицу замены переменных $$ C= \left( \begin{array}{llcl} c_{11} & c_{12} & \dots & c_{1n} \\ c_{21} & c_{22} & \dots & c_{2n} \\ \dots & & & \dots \\ c_{n1} & c_{n2} & \dots & c_{nn} \\ \end{array} \right) ; $$ которая позволяет переписать саму замену переменных в матричном виде $$ \left(\begin{array}{l} x_1 \\ x_2 \\ \vdots \\ x_n \end{array} \right)= \left( \begin{array}{llcl} c_{11} & c_{12} & \dots & c_{1n} \\ c_{21} & c_{22} & \dots & c_{2n} \\ \dots & & & \dots \\ c_{n1} & c_{n2} & \dots & c_{nn} \\ \end{array} \right) \left(\begin{array}{l} y_1 \\ y_2 \\ \vdots \\ y_n \end{array} \right) \qquad \iff \qquad X=CY \ . $$ Тогда формальная подстановка последнего варианта в правильную запись квадратичной формы приведет к следующей цепочке $$ f(X)=X^{\top}{\mathbf A}X= (CY)^{\top}{\mathbf A} (CY)=Y^{\top} C^{\top}{\mathbf A}C Y=\tilde f (Y) \ , $$ (здесь использовались некоторые свойства операции транспонирования ) и, если обозначить матрицу $$ \mathbf B =C^{\top}{\mathbf A}C \ , $$ то мы получаем правило формирования матрицы квадратичной формы, получившейся в результате замены переменных, с помощью операции произведения матриц. Обратим внимание на еще один факт — матрица $ \mathbf B $ является симметричной: $$ \mathbf B^{\top} =(C^{\top}{\mathbf A}C)^{\top}= C^{\top}{\mathbf A}^{\top}\left(C^{\top} \right)^{\top} = C^{\top}{\mathbf A}C= \mathbf B \ , $$ т.е. выбор в качестве матричной записи квадратичной формы именно варианта c симметричной матрицей позволяет сохранить это свойство при любой линейной замене переменных.

Задача о нахождении канонического вида квадратичной формы $ X^{\top}{\mathbf A}X $ может быть также переформулирована в терминах замены переменных: требуется найти такую матрицу $ C_{} $, чтобы матрица $ \mathbf B= C^{\top}{\mathbf A}C $ оказалась диагональной: $$ \mathbf B= \left( \begin{array}{cccc} a_{1} & & & \\ & a_{2} & & {\mathbb O} \\ {\mathbb O} & & \ddots & \\ & & & a_{n} \end{array} \right) \ ; $$ при этом дополнительным условием ставится невырожденность (неособенность) матрицы $ C_{} $: $$ \det C \ne 0 \ . $$

Пока не вполне понятна существенность последнего условия: почему оно накладывается? С одной стороны, оно обеспечивает обратимость замены переменных $ (x_1,\dots,x_n) \leftrightarrow (y_1,\dots,y_n) $ --- не происходит "потери информации". В самом деле, наличие какого-то ограничения на все возможные замены переменных, довольно очевидно: если бы разрешалось использовать, например, нулевую матрицу $ C = {\mathbb O}_{n} $, то канонический вид у любой квадратичной формы был бы нулевым.. . Геометрический смысл условия $ \det C \ne 0 $ обсудим ☟ НИЖЕ.

Т

Теорема. Для любой квадратичной формы над $ \mathbb A $ существует невырожденная линейная замена переменных $ X=CY $ такая, что преобразованная квадратичная форма $ \widetilde f(Y) $ имеет канонический вид.

Вернемся к примерам предыдущего пункта, перепишем их на матричном языке.

П

Пример. Для формы

$$ f(x_1,x_2,x_3,x_4)= $$ $$=4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$ замена переменных осуществляется формулами

$$ \begin{array}{crrrr} y_1=& x_1 &-\frac{1}{2}\, x_2&-\frac{1}{2}\,x_3&+ \frac{1}{2}\,x_4, \\ y_2=& & x_2&+x_3&+x_4, \\ y_3=& & & x_3 &+ 2\, x_4,\\ y_4=& &&& x_4, \end{array} $$ т.е. матрица замены переменных $$ C= \left( \begin{array}{cccc} 1 & -\frac{1}{2} & -\frac{1}{2} & \frac{1}{2} \\ 0 & 1 & 1 & 1 \\ 0 & 0 & 1 & 2 \\ 0 & 0 & 0 & 1 \end{array} \right) $$ имеет верхнетреугольный вид. Канонический вид в новых переменных записывается $$ f(x_1,x_2,x_3,x_4) \equiv 4\,y_1^2+y_2^2-y_3^2+3\,y_4^2 \ . $$

Для формы $$ f(x_1,x_2,x_3)=x_1^2+x_2^2-4\,x_3^2+2\,x_1x_2+6\,x_1x_3+4\,x_2x_3 $$ замена переменных уже не имеет треугольного вида: $$ \begin{array}{crrr} y_1=& x_1 &+ x_2&+3\,x_3 \\ y_2=& & -\frac{1}{13}x_2&+x_3 \\ y_3=& & \frac{1}{13}x_2 & \end{array} \qquad \iff \qquad C= \left( \begin{array}{rrr} 1 & 1 & 3 \\ 0 & -\frac{1}{13} & 1 \\ 0 & \frac{1}{13} & 0 \end{array} \right) \ . $$ Для формы $$ f(x_1,x_2,x_3)=x_1x_2-3\,x_1x_3+2\,x_2x_3 $$ получили: $$ \begin{array}{crrr} y_1=& \frac{1}{2}x_1 &-\frac{1}{2}x_2&+\frac{5}{2}x_3 \\ y_2=& x_1&+x_2&-x_3 \\ y_3=& & & x_3 \end{array} \qquad \iff \qquad C= \left( \begin{array}{rrr} \frac{1}{2} & -\frac{1}{2} & \frac{5}{2} \\ 1 & 1 & -1 \\ 0 & 1 & 1 \end{array} \right) \ , $$ т.е. замена переменных также не имеет треугольного вида. ♦

Поставленную в начале пункта задачу об установлении структуры канонического вида квадратичной формы попытаемся решить сначала для случая когда замену переменных можно подобрать именно в треугольном виде.

Метод Лагранжа и метод Гаусса

В этом и последующих пунктах существенно потребуется знание МЕТОДА ГАУССА преобразования систем линейных уравнений.

П

Пример. Рассмотрим матрицу квадратичной формы

$$ f(x_1,x_2,x_3,x_4)=$$ $$ =4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$

из предыдущих пунктов, и, временно выходя из круга поставленных в настоящем разделе задач, попробуем применить к ней метод Гаусса приведения к треугольному виду: $$ \left( \begin{array}{rrrr} 4 & -2 & -2 & 2 \\ -2 & 2 & 2 & 0 \\ -2 & 2 & 1 & -2 \\ 2 & 0 & -2 & 1 \end{array} \right) \ \rightarrow \ \left( \begin{array}{rrrr} 4 & -2 & -2 & 2 \\ 0 & 1 & 1 & 1 \\ 0 & 1 & 0 & -1 \\ 0 & 1 & -1 & 0 \end{array} \right) \ \rightarrow \ $$ $$ \rightarrow \ \left( \begin{array}{rrrr} 4 & -2 & -2 & 2 \\ 0 & 1 & 1 & 1 \\ 0 & 0 & -1 & -2 \\ 0 & 0 & -2 & -1 \end{array} \right) \ \rightarrow \ \left( \begin{array}{rrrr} 4 & -2 & -2 & 2 \\ 0 & 1 & 1 & 1 \\ 0 & 0 & -1 & -2 \\ 0 & 0 & 0 & 3 \end{array} \right) \ . $$ Обратим внимание на два обстоятельства: диагональные элементы последней матрицы совпадают с коэффициентами канонического вида квадратичной формы, а коэффициенты замены переменных, приводящей к этому каноническому виду, совпадают с элементами строк этой матрицы, если их разделить на соответствующие диагональные элементы. Возникает подозрение , что метод Лагранжа является «замаскированной» версией метода Гаусса. ♦

Для того, чтобы выяснить аналитический смысл преобразований по методу Лагранжа найдем правило формирования коэффициентов в первом шаге приведения квадратичной формы к каноническому виду. Пусть исходная квадратичная форма записана в виде $$ f(x_1,\dots,x_{n} )=\sum_{1\le j,k \le n} a_{jk}x_jx_k= $$ $$ \begin{array}{llll} = a_{11}x_1^2&+2a_{12}x_1x_2&+ \dots & +2a_{1n}x_1x_n+ \\ &+a_{22}x_2^2 &+ \dots & +2a_{2n}x_2x_n+ \\ & & +\dots & + \\ & & &+a_{nn}x_n^2, \end{array} $$ т.е. коэффициенты при смешанных произведениях переменных записаны с выделением множителя $ 2_{} $. После выделения полного квадрата, содержащего переменные $ x_1,x_2,\dots,x_n $: $$ f(x_1,x_2,\dots,x_n)\equiv a_{11} \left(x_1+\frac{a_{12}}{a_{11}}x_2+\dots+ \frac{a_{1n}}{a_{11}}x_n\ \right)^2 + f_2(x_2,\dots,x_n) $$ в правой части тождества образовалась квадратичная форма $ f_{2} $, не содержащая $ x_{1} $. Она равна $$ f_2 =\sum_{2\le j,k \le n} a_{jk}x_jx_k- a_{11}\left(\frac{a_{12}}{a_{11}}x_2+\dots+ \frac{a_{1n}}{a_{11}}x_n \right)^2= $$ $$ =\sum_{2\le j,k \le n} a_{jk}x_jx_k-a_{11}\sum_{2\le j,k \le n} \frac{a_{1j}a_{1k}}{a_{11}^2}x_jx_k= \sum_{2\le j,k \le n}\left( a_{jk}-\frac{a_{1j}}{a_{11}}a_{1k} \right) x_jx_k \ . $$ Если теперь выписать матрицу этой квадратичной формы (она имеет порядок $ n_{}-1 $), то ее элементы образуются по точно такому же правилу, как и коэффициенты матрицы, получающейся из матрицы $ \mathbf A_{} $ в результате первого шага метода Гаусса.

Т

Теорема. Метод Лагранжа приведения квадратичной формы $ X^{\top}{\mathbf A}X $ к каноническому виду эквивалентен методу Гаусса приведения матрицы $ {\mathbf A} $ к треугольному виду.

Доказательство. Действительно, первый шаг прямого хода метода исключения переменных Гаусса преобразует матрицу $ \mathbf A $ следующим образом: $$ \left( \begin{array}{ccccc} a_{11}& a_{12}& a_{13}& \dots & a_{1n} \\ a_{12}& a_{22}& a_{23}& \dots & a_{2n} \\ & \dots & & \dots & \\ a_{1n}& a_{2n}& a_{3n}& \dots & a_{nn} \end{array} \right) \rightarrow \left(\begin{array}{llll} a_{11}&a_{12}&\dots&a_{1n}\\ 0&a_{22}^{[1]}& \dots &a_{2n}^{[1]}\\ &\dots & & \dots \\ 0&a_{n2}^{[1]}&\dots &a_{nn}^{[1]} \end{array} \right) \ ; $$ здесь $$a_{jk}^{[1]} = a_{jk} - \frac{a_{j1}a_{1k}}{a_{11}} \ ,$$ и предполагается, что $ a_{11}\ne 0 $. Видим, что формула формирования элементов матрицы $$ \left(\begin{array}{llll} a_{22}^{[1]}& \dots&a_{2n}^{[1]}\\ \dots & & \dots & \\ a_{n2}^{[1]}&\dots &a_{nn}^{[1]} \end{array} \right)_{(n-1)\times (n-1)} $$ точно такая же, как и матрицы квадратичной формы $ f_2 $. Более того, поскольку матрица $ {\mathbf A} $ симметрична ($ a_{jk}=a_{kj} $), то и только что полученная матрица оказывается симметричной. Если $ a_{22}^{[1]} \ne 0 $, то к этой новой матрице можно снова применить ту же процедуру, и т.д., и в конце концов придем к матрице первого порядка. Собирая все промежуточные результаты в одну матрицу, получим ее в треугольном виде $$ \left(\begin{array}{lllll} a_{11}&a_{12}&\dots&a_{1,n-1} &a_{1n}\\ 0&a_{22}^{[1]}& \dots&a_{2,n-1}^{[1]} &a_{2n}^{[1]}\\ & & \ddots & & \dots \\ 0 &0 & &a_{n-1,n-1}^{[n-2]}&a_{n-1,n}^{[n-2]} \\ 0 &0 &\dots & 0 &a_{nn}^{[n-1]} \end{array} \right) $$ при условии, что ни одно из чисел на диагонали не обратилось в нуль: $$a_{11} \ne 0,\ a_{22}^{[1]} \ne 0, \dots,\ a_{n-1,n-1}^{[n-2]} \ne 0,\ a_{nn}^{[n-1]} \ne 0 \ .$$ Если теперь обратиться к методу Лагранжа, то увидим, что полученная матрица как раз и определяет замену переменных $$ \left\{\begin{array}{lrrrrr} y_1=&\displaystyle x_1+&\frac{a_{12}}{a_{11}}x_2+&\dots+&\frac{a_{1,n-1}}{a_{11}}x_{n-1}+& \frac{a_{1n}}{a_{11}}x_n \\ y_2=&\displaystyle &x_2+&\dots + &\frac{a_{2,n-1}^{[1]}}{a_{22}^{[1]}}x_{n-1}+& \frac{a_{2n}^{[1]}}{a_{22}^{[1]}}x_{n} \\ \vdots & & & \ddots & \dots & \\ y_{n-1}=&\displaystyle & & &x_{n-1}+ &\frac{a_{n-1,n}^{[n-2]}}{a_{n-1,n-1}^{[n-2]}}x_n \\ y_n=&&&&&x_n \end{array} \right. \ , $$ приводящую квадратичную форму к каноническому виду: $$ a_{11}y_1^2 + a_{22}^{[1]} y_2^2 + \dots +a_{n-1,n-1}^{[n-2]} y_{n-1}^2 + a_{nn}^{[n-1]} y_n^2 \ . $$ ♦

Именно выбор представления квадратичной формы посредством симметричной матрицы позволил установить взаимосвязь между двумя такими разными задачами как решение системы линейных уравнений и представление квадратичной формы в каноническом виде. Фактически весь дальнейший анализ квадратичной формы сведется к исследованию свойств ее матрицы $ \mathbf A $. В теории линейных пространств для подобных соответствий, устанавливаемых между объектами разной природы, вводится понятие изоморфизма.

Явное выражение коэффициентов из последних формул, а также необходимые и достаточные условия существования такой замены — в терминах миноров матрицы $ \mathbf A $ — даются в следующем ☟ ПУНКТЕ

Формула Якоби

Т

Теорема [Якоби]. Квадратичная форма $ f(X)=X^{\top}{\mathbf A}X $ с симметричной матрицей $ {\mathbf A} $, ранг которой равен $ \mathfrak r_{} $, а главные миноры $ \{\det \mathbf A_j \}_{j=1}^{\mathfrak r} $ отличны от нуля, приводится к следующему каноническому виду (формула Якоби³⁾):

$$ \frac{z_1^2}{1 \cdot \det \mathbf A_1} +\frac{z_2^2}{\det \mathbf A_1 \cdot \det \mathbf A_2} +\frac{z_3^2}{\det \mathbf A_2 \cdot \det \mathbf A_3} +\dots+\frac{z_{\mathfrak r}^2}{\det \mathbf A_{{\mathfrak r}-1} \cdot \det \mathbf A_{\mathfrak r}} $$ Здесь $$ z_1 =\frac{1}{2} \partial f / \partial x_1,\ z_2= \frac{1}{2} \left| \begin{array}{ll} a_{11} & \partial f / \partial x_1 \\ a_{12} & \partial f / \partial x_2 \end{array} \right|, \ z_3= \frac{1}{2} \left| \begin{array}{lll} a_{11} & a_{12} & \partial f / \partial x_1 \\ a_{12} & a_{22} & \partial f / \partial x_2 \\ a_{13} & a_{23} & \partial f / \partial x_3 \end{array} \right|, \ \dots \ , $$ $$ \qquad \qquad z_{\mathfrak r}= \frac{1}{2} \left| \begin{array}{lllll} a_{11} & a_{12} & \dots & a_{1,\mathfrak r-1} & \partial f / \partial x_1 \\ a_{12} & a_{22} & \dots & a_{2,\mathfrak r-1} & \partial f / \partial x_2 \\ \dots & & & \dots & \dots \\ a_{1,\mathfrak r } & a_{2,\mathfrak r } & \dots & a_{\mathfrak r-1,\mathfrak r } & \partial f / \partial x_{\mathfrak r} \end{array} \right| $$

Доказательство ☞ ЗДЕСЬ.

П

Пример. Для квадратичной формы $$ f(x_1,x_2,x_3,x_4)= $$

$$ =4\,x_1^2+2\,x_2^2+x_3^2+x_4^2-4\,x_1x_2-4\,x_1x_3+4\,x_1x_4+4\,x_2x_3-4\,x_3x_4 $$ имеем: $$ \mathbf A= \left( \begin{array}{rrrr} 4 & -2 & -2 & 2 \\ -2 & 2 & 2 & 0 \\ -2 & 2 & 1 & -2 \\ 2 & 0 & -2 & 1 \end{array} \right) \quad , \left\{\det \mathbf A_j\right\}_{j=1}^4=\left\{4,4,-4,-12\right\} $$ и $$z_1=\frac{1}{2} (8\,x_1-4\,x_2-4\,x_3+4\,x_4)=4\,x_1-2\,x_2-2\,x_3+2\,x_4 \ ; $$ $$z_2=\frac{1}{2} \left| \begin{array}{rl} 4 & 8\,x_1-4\,x_2-4\,x_3+4\,x_4 \\ -2 & -4\,x_1+4\,x_2+4\,x_3 \end{array} \right|=4\,x_2+4\,x_3+4\,x_4 ; $$ $$ z_3= \frac{1}{2} \left| \begin{array}{rrl} 4 & -2 & 8\,x_1-4\,x_2-4\,x_3+4\,x_4 \\ -2 & 2 & -4\,x_1+4\,x_2+4\,x_3 \\ -2 & 2 & -4\,x_1+4\,x_2+2\,x_3-4\,x_4 \end{array} \right|=-4\,x_3-8\,x_4 ; $$ $$ z_4= \frac{1}{2} \left| \begin{array}{rrrl} 4 & -2 & -2 & 8\,x_1-4\,x_2-4\,x_3+4\,x_4 \\ -2 & 2 & 2 & -4\,x_1+4\,x_2+4\,x_3 \\ -2 & 2 & 1 & -4\,x_1+4\,x_2+2\,x_3-4\,x_4 \\ 2 & 0 & -2 & 4\,x_1-4\,x_3+2\,x_4 \end{array} \right|= -12\,x_4 \ . $$ $$ f\equiv \frac{(4\,x_1-2\,x_2-2\,x_3+2\,x_4)^2 }{1\cdot 4}+\frac{(4\,x_2+4\,x_3+4\,x_4)^2 }{4\cdot 4}+\frac{(-4\,x_3-8\,x_4)^2 }{4\cdot (-4)}+ $$ $$ +\frac{(-12\,x_4 )^2 }{(-4)\cdot (-12)} \ . $$ Обратим внимание, что замена переменных в настоящем примере имеет треугольный вид: $$ \left( \begin{array}{l} z_1 \\ z_2 \\ z_3 \\ z_4 \end{array} \right) = \left(\begin{array}{rrrr} 4 & -2 & -2 & 2 \\ & 4 & 4 & 4 \\ & & -4 & -8 \\ & & & -12 \end{array} \right) \left( \begin{array}{l} x_1 \\ x_2 \\ x_3 \\ x_4 \end{array} \right) \, . $$ ♦

Легко убедиться, что это — проявление общего правила. Выражение для $$ z_{k}= \frac{1}{2} \left| \begin{array}{lllll} a_{11} & a_{12} & \dots & a_{1,k-1} & \partial f / \partial x_1 \\ a_{12} & a_{22} & \dots & a_{2,k-1} & \partial f / \partial x_2 \\ \dots & & & \dots & \dots \\ a_{k1 } & a_{k2 } & \dots & a_{k,k-1 } & \partial f / \partial x_{k} \end{array} \right| $$ при $ k \in \{1,\dots, \mathfrak r\} $ преобразуем следующим образом: из последнего столбца определителя $$ = \left| \begin{array}{lllll} a_{11} & a_{12} & \dots & a_{1,k-1} & a_{11}x_1+a_{12}x_2+\dots+ a_{1,k-1} x_{k-1}+a_{1k}x_k+\dots+a_{1n}x_n \\ a_{12} & a_{22} & \dots & a_{2,k-1} & a_{21}x_1+a_{22}x_2+\dots+ a_{2,k-1} x_{k-1}+a_{2k}x_k+\dots+a_{2n}x_n \\ \dots & & & \dots & \dots \\ a_{k1 } & a_{k2 } & \dots & a_{k,k-1 } & a_{k1}x_1+a_{k2}x_2+\dots+ a_{k,k-1} x_{k-1}+a_{kk}x_k+\dots+a_{kn}x_n \end{array} \right| $$ вычтем первый, домноженный на $ x_1 $, второй, домноженный на $ x_2 $, и т.д., $ (k-1) $-й, домноженный на $ x_{k-1} $. В результате получим линейную форму $$ z_k= \left| \begin{array}{lllll} a_{11} & a_{12} & \dots & a_{1,k-1} & a_{1k} \\ a_{12} & a_{22} & \dots & a_{2,k-1} & a_{2k} \\ \dots & & & \dots & \dots \\ a_{k1 } & a_{k2 } & \dots & a_{k,k-1 } & a_{kk} \end{array} \right|x_k + \dots + \left| \begin{array}{lllll} a_{11} & a_{12} & \dots & a_{1,k-1} & a_{1n} \\ a_{12} & a_{22} & \dots & a_{2,k-1} & a_{2n} \\ \dots & & & \dots & \dots \\ a_{k1 } & a_{k2 } & \dots & a_{k,k-1 } & a_{kn} \end{array} \right|x_n \, , $$ не зависящую от $ x_1,\dots, x_{k-1} $. Коэффициент же при $ x_k $ равен $ \det \mathbf A_k $ и отличен от нуля по условию теоремы. Если его вынести за пределы формы, то получим еще альтернативный вариант формулы Якоби.

=>

Квадратичная форма $ f(X)=X^{\top}{\mathbf A}X $ с симметричной матрицей $ {\mathbf A} $, ранг которой равен $ \mathfrak r_{} $, а главные миноры $ \{\det \mathbf A_j \}_{j=1}^{\mathfrak r} $ отличны от нуля, приводится к следующему каноническому виду:

$$ y_1^2 \det \mathbf A_1 + y_2^2\frac{\det \mathbf A_2}{ \det \mathbf A_1} +y_3^2\frac{\det \mathbf A_3}{\det \mathbf A_2} +\dots+y_{\mathfrak r}^2 \frac{\det \mathbf A_{\mathfrak r}}{\det \mathbf A_{\mathfrak r-1}} \ ; $$ при этом линейные относительно переменных $ x_1,\dots,x_n $ формы $ \{y_j \}_{j=1}^{\mathfrak r} $ выражаются по формулам $$ \left\{ \begin{array}{lrrrrrr} y_1=&\displaystyle x_1+&\tilde c_{12}x_2& &+\dots+&\tilde c_{1,n-1}x_{n-1}+&\tilde c_{1n}x_n \\ y_2=&\displaystyle &x_2+& & \dots + &\tilde c_{2,n-1}x_{n-1}+&\tilde c_{2n}x_{n} \\ \vdots & & & \ddots & & \dots & \\ y_{\mathfrak r}=&\displaystyle & & &x_{\mathfrak r}+ & \dots + & \tilde c_{\mathfrak r n}x_n \end{array} \right. $$ Здесь $$ \tilde c_{1j}=a_{1j}/a_{11},\ \tilde c_{kj}=\left| \begin{array}{lllll} a_{11} & a_{12} & \dots & a_{1,k-1} & a_{1j} \\ a_{12} & a_{22} & \dots & a_{2,k-1} & a_{2j} \\ \dots & & & \dots & \dots \\ a_{k1 } & a_{k2 } & \dots & a_{k,k-1 } & a_{kj} \end{array} \right| \Bigg/ \det \mathbf A_j \, . $$

При $ \mathfrak r = n $ матрица $ \tilde C_{} $ из предыдущей формулы становится верхнетреугольной: $$ Y=\tilde C X \, ; $$ при этом на главной диагонали будут стоять $ 1 $. Обратная к матрице такого вида имеет ту же структуру — и матрица $ C=\tilde C^{-1} $ является матрицей, которая встретилась нам в предыдущем ПУНКТЕ.

T

Теорема. Квадратичная форма $ f(X)=X^{\top}{\mathbf A}X $ при симметричной неособенной матрице $ {\mathbf A} $ приводится к каноническому виду заменой переменных, задаваемой верхней унитреугольной матрицей

$$ X=CY \quad npu \ C= \left( \begin{array}{llll} 1& c_{12}& \dots & c_{1n} \\ & 1& \dots & c_{2n} \\ \mathbb O & & \ddots & \vdots \\ & & & 1 \end{array} \right) $$ тогда и только тогда, когда все главные миноры матрицы $ {\mathbf A} $ отличны от нуля. Этот канонический вид представлен формулой Якоби $$ y_1^2 \det \mathbf A_1 + y_2^2\frac{\det \mathbf A_2}{ \det \mathbf A_1} +\dots+y_{n}^2 \frac{\det \mathbf A_{n}}{\det \mathbf A_{n-1}} \ . $$ Доказательство достаточности условия теоремы уже произведено, необходимость доказывается в пункте ☞ LDU-разложение матрицы.

Закон инерции для квадратичных форм

Для заданной квадратичной формы канонические виды, т.е. представления в виде сумм квадратов, можно построить разными способами. Выясним, какие характеристики являются общими (инвариантными) для этих представлений.

Ранг квадратичной формы

Предположим, что с помощью какой-либо невырожденной замены переменных мы привели квадратичную форму к каноническому виду: $$\widetilde f(Y)=\alpha_1y_1^2+\dots+\alpha_n y_n^2 \ .$$ Может так случиться, что часть коэффициентов $ \{\alpha_j \}_{j=1}^n $ обратится в нуль.

Рангом квадратичной формы называется ранг ее матрицы: $$\operatorname{rank} ( f ) = \operatorname{rank} ( {\mathbf A} ) \ .$$

Т

Теорема. Ранг квадратичной формы не меняется при невырожденных заменах переменных:

$$ \operatorname{rank} (f) = \operatorname{rank}( C^{\top}{\mathbf A}C ) \quad npu \quad \forall C,\ \det C \ne 0 \ .$$

Доказательство основано на следствии к теореме $ 2 $, приведенной ☞ ЗДЕСЬ: ранг матрицы не меняется при домножении ее на произвольную неособенную.

=>

Ранг квадратичной формы равен числу ненулевых коэффициентов в ее каноническом виде.

Закон инерции

Начиная с этого момента рассматриваем только вещественные квадратичные формы.

Число положительных (или отрицательных) коэффициентов в каноническом виде квадратичной формы $ f_{}(X) $ называется ее положительным (соответственно, отрицательным) индексом инерции. Буду обозначать эти индексы⁴⁾ $$n_{+}(f) \quad \mbox{ и } \quad n_{-}(f) \ . $$ Разность⁵⁾ $$\sigma (f) = n_{+}(f)-n_{-}(f)$$ называется сигнатурой квадратичной формы (а также сигнатурой соответствующей ей симметричной матрицы).

Т

Теорема [закон инерции]. Индексы инерции не зависят от способа приведения квадратичной формы к каноническому виду.

Эта теорема часто формулируется в виде: «ранг и сигнатура квадратичной формы не зависят…». Эквивалентность этой формулировки исходной очевидно следует из формул $$ \operatorname{rank} (f) = n_{+}(f)+n_{-}(f), \ \sigma (f) = n_{+}(f)-n_{-}(f) \ . $$

Доказательство ☞ ЗДЕСЬ.

П

Пример. Найти ранг и сигнатуру квадратичной формы

$$ f(x_1,x_2,x_3)=x_1x_2-x_2x_3 \, .$$

Решение. Приводим квадратичную форму к каноническому виду по методу Лагранжа: $$f=\frac{1}{4} \,(x_1+x_2-x_3)^2 - \frac{1}{4} \,(x_1-x_2-x_3)^2 \ .$$

Ответ. $ \operatorname{rank} (f) = 2,\, \sigma (f)=0 $.

=>

В предположении, что ранг матрицы $ \mathbf A_{} $ равен $ \mathfrak r_{} $, а ее главные миноры $ \{ \det {\mathbf A}_j \}_{j=1}^{\mathfrak r} $ отличны от нуля, имеем:

$$ n_{+}(f)={\mathcal P}(1,\det {\mathbf A}_1,\dots, \det {\mathbf A}_{\mathfrak r}),\ n_{-}(f)={\mathcal V}(1,\det {\mathbf A}_1,\dots, \det {\mathbf A}_{\mathfrak r})\ . $$ Здесь $ {\mathcal P}_{} $ — число знакопостоянств, а $ {\mathcal V}_{} $ — число число знакоперемен в последовательности. Для сигнатуры квадратичой формы также справедлива и формула $$ \sigma (f)= \sum_{j=1}^{\mathfrak r} \operatorname{sign} (\det (\mathbf A_{j-1}) \cdot \det (\mathbf A_{j}) ) \quad npu \quad \det (\mathbf A_{0})=1 $$ и операции $ \operatorname{sign} $ определения знака, введенной ☞ ЗДЕСЬ.

Доказательство следует из формулы Якоби.

§

Правило вычисления сигнатуры из предыдущей теоремы остается справедливым и в случае, если в последовательности главных миноров $ \{ \det {\mathbf A}_j \}_{j=1}^{\mathfrak r} $ имеются нулевые, но не подряд идущие, и $ \det {\mathbf A}_{\mathfrak r} \ne 0 $. Если, например,

$$ \det (\mathbf A_{j}) = 0,\ \det (\mathbf A_{j-1}) \ne 0,\ \det (\mathbf A_{j+1}) \ne 0 \quad npu \quad j\in\{1,\dots, {\mathfrak r}-1\} ,$$ то сумма $$ \operatorname{sign} (\det (\mathbf A_{j-1}) \cdot \det (\mathbf A_{j}) )+ \operatorname{sign} (\det (\mathbf A_{j}) \cdot \det (\mathbf A_{j+1}) ) $$ считается равной нулю. (Можно также доказать, что в этом случае главные миноры $ \det (\mathbf A_{j-1}) $ и $ \det (\mathbf A_{j+1}) $ имеют противоположные знаки.)

П

Пример. Найти ранг и сигнатуру квадратичной формы

$$f_{{\color{Red} \alpha }}(x_1,x_2,x_3)=3\,x_1^2 -4\,x_1x_2-2\,x_1x_3 + {\color{Red} \alpha } \, x_2^2 +6\, x_2x_3 $$ в зависимости от значений параметра $ {\color{Red} \alpha } $.

Решение. Сначала пробуем применить формулу из последнего следствия: $$\det {\mathbf A}_1=3,\ \det {\mathbf A}_2=3\, {\color{Red} \alpha } -4,\ \det {\mathbf A}_3= \det {\mathbf A}=- {\color{Red} \alpha } -15 \ .$$ При $ {\color{Red} \alpha } \not\in \{4/3,\, -15 \} $ формула применима при $ {\mathfrak r}=3 $: $$n_{+}(f)=\left\{ \begin{array}{llr} 2 & npu & {\color{Red} \alpha } >4/3 ;\\ 2 & npu & -15<{\color{Red} \alpha } <4/3 ;\\ 1 & npu & {\color{Red} \alpha } < -15 . \end{array} \right. $$ При $ {\color{Red} \alpha }=4/3 $, по-прежнему, $ {\mathfrak r}=3 $, но формула следствия к закону инерции неприменима. В этом случае приходится действовать по методу Лагранжа: $$f_{4/3}(x_1,x_2,x_3)=3\, \left(x_1-\frac{2}{3}\, x_2 -\frac{1}{3}\, x_3\right)^2- \frac{1}{3}\, (x_3-7\, x_2)^2+\frac{49}{3}x_2^2 \ .$$ Следовательно, $ n_{+}(f)=2 $. Осталось рассмотреть случай $ {\color{Red} \alpha } =-15 $, когда $ {\mathfrak r}=2 $. Поскольку условия следствия выполняются, то формула из него применима: $ n_{+}(f)=1 $.

Во всех случаях отрицательный индекс инерции вычисляется по формуле $ n_{-}(f)={\mathfrak r}-n_{+}(f) $.

Ответ. $$ \begin{array}{c|c|c} {\color{Red} \alpha } & \operatorname{rank} (f) & \sigma (f) \\ \hline < -15 & 3 & -1 \\ \hline =-15 & 2 & 0 \\ \hline > -15 & 3 & 1 \end{array} $$

Рассмотренный только что пример относится к общей задаче оценки влияния параметров на характеристики квадратичной формы:

Как меняются ранг и сигнатура при непрерывном изменении параметров?

Пусть квадратичная форма зависит от параметров $ \alpha, \beta, \dots $, причем эта зависимость — полиномиальная. Пусть при некотором наборе вещественных значений параметров все главные миноры матрицы квадратичной формы отличны от нуля. Тогда ранг и сигнатура квадратичной формы могут быть вполне определены знаками этих миноров посредством формулы из следствия к закону инерции. Поскольку элементы миноров полиномиально зависят от параметров, то мы получаем систему неравенств, которую (при необходимости домножением некоторых неравенств на $ (-1) $) можно переписать в виде $$ G_1(\alpha,\beta,\dots) > 0, \dots, G_n(\alpha,\beta,\dots) > 0 \ . $$ Здесь $ G_1,\dots, G_n $ — полиномы от $ \alpha,\beta,\dots $. Если при некотором наборе значений $ \alpha=\alpha_0, \beta=\beta_0, \dots $ эта система удовлетворена, при непрерывной вариации этих параметров $ \alpha_0+\delta_{\alpha}, \beta_0 + \delta_{\beta},\dots $ какое из неравенств системы нарушится в первую очередь, т.е. раньше остальных? Иными словами: какое из неравенств системы самое важное? — Оказывается, последнее.

Т

Теорема[2]. Пусть $ f_{{\color{Red} \alpha }}(x_1,\dots,x_n) $ — квадратичная форма, зависящая от параметра $ {\color{Red} \alpha } $ линейным образом:

$$ f_{{\color{Red} \alpha }}(x_1,\dots,x_n) \equiv (1-{\color{Red} \alpha }) f_{0}(x_1,\dots,x_n)+ {\color{Red} \alpha } f_{1}(x_1,\dots,x_n) \ . $$ Если $ \operatorname{rank} (f_{{\color{Red} \alpha }})=n $ при $ 0 \le {\color{Red} \alpha } \le 1 $, то $ n_{+} (f_{0})= n_{+} (f_{1}) $.

Справедливо и более общее утверждение.

Т

Теорема[1,5]. Если при непрерывном изменении коэффициентов формы $ f_{} $ ее ранг $ {\mathfrak r}_{} $ остается неизменным, то не изменяется и ее сигнатура $ \sigma_{}(f) $.

В случае, когда главные миноры матрицы $ \mathbf A $ обращаются в нуль, к анализу канонического вида квадратичной формы приходится привлекать «тяжелую артиллерию» в виде ведущих миноров. Но, по крайней мере, один теоретический результат можно сформулировать немедленно.

Т

Теорема. В произвольной квадратичной форме $ f(X) $ ранга $ \mathfrak r\ge 1 $ можно так перенумеровать переменные, чтобы в матрице получившейся квадратичной формы $ \tilde f(Y) $ в последовательности главных миноров

$$ \det \widetilde{\mathbf A}_1, \dots, \det \widetilde{\mathbf A}_{ \mathfrak r} $$ не было двух подряд идущих нулевых и $ \det \widetilde{\mathbf A}_{ \mathfrak r} \ne 0 $.

Конгруэнтность квадратичных форм

Матрицы $ {\mathbf A} $ и $ {\mathbf B} $, связанные соотношением $ {\mathbf B}=C^{\top}{\mathbf A}C $ при некоторой неособенной матрице $ C $, называются конгруэнтными: $ {\mathbf A} \cong {\mathbf B} $. Если, вдобавок, матрицы $ {\mathbf A} $ и $ {\mathbf B} $ симметричны, то конгруэнтными называются и соответствующие им квадратичные формы $ X^{\top}{\mathbf A}X $ и $ X^{\top}{\mathbf B}X $.

Т

Теорема. Квадратичные формы $ X^{\top}{\mathbf A}X $ и $ X^{\top}{\mathbf B}X $ конгруэнтны тогда и только тогда, когда совпадают их индексы инерции, или, что то же, равны их ранги и сигнатуры.

Из всего разнообразия канонических видов квадратичной формы выберем самый простой, именно тот, коэффициенты которого равны $ +1 $ или $ (-1) $. Например, если квадратичная форма $ f(X) $ уже приведена к каноническому виду $$\widetilde f(Y)=\alpha_1y_1^2+\dots+\alpha_{\mathfrak r} y_{\mathfrak r}^2 \ .$$ то преобразование $$y_j=\frac{z_j}{\sqrt{\alpha_j}}\ npu \ j\in \{1,\dots, {\mathfrak r}\} \ , \ y_j=z_j \ npu \ j\in \{{\mathfrak r}+1,\dots, n \} $$ приводит эту форму к виду $$ z_1^2+\dots + z_{n_{+}(A)}^2 -z_{n_{+}(A)+1}^2 - \dots - z_{{\mathfrak r}}^2 \ , $$ который называется нормальным видом квадратичной формы.

Множество всех квадратичных форм с вещественными коэффициентами можно разбить на классы эквивалентности, в каждом из которых будут находиться только конгруэнтные между собой формы. Каждый из классов полностью описывается каким-то из своих представителей. Таким представителем можно взять нормальный вид.

Какое преобразование квадратичной формы оставляет ее инвариантной?

Т

Теорема [Эрмит]. Квадратичная форма $ X^{\top}{\mathbf A}X $ переходит в себя при преобразовании

$$ X= ({\mathbf A}+S)^{-1}({\mathbf A}-S) Y $$ где $ S $ означает произвольную кососимметричную матрицу порядка $ n $.

Доказательство. Обозначим $$ R=({\mathbf A}+S)^{-1}({\mathbf A}-S) $$ и докажем, что $ R^{\top}{\mathbf A}R= {\mathbf A} $. Используя равенства $ {\mathbf A}^{\top}={\mathbf A} $ , $ S^{\top}=-S $, получим: $$ R^{\top}{\mathbf A}R=({\mathbf A}-S)^{\top} \left(({\mathbf A}+S)^{-1}\right)^{\top}{\mathbf A} ({\mathbf A}+S)^{-1}({\mathbf A}-S)= $$ $$ =({\mathbf A}+S)\left(({\mathbf A}+S)^{\top}\right)^{-1} {\mathbf A} ({\mathbf A}+S)^{-1}({\mathbf A}-S)= $$ $$ =({\mathbf A}+S)({\mathbf A}-S)^{-1}\left[\frac{1}{2}({\mathbf A}-S)+ \frac{1}{2}({\mathbf A}+S)\right]({\mathbf A}+S)^{-1}({\mathbf A}-S)= $$ $$ =\frac{1}{2}({\mathbf A}+S)({\mathbf A}-S)^{-1}({\mathbf A}-S)({\mathbf A}+S)^{-1}({\mathbf A}-S)+ $$ $$ +\frac{1}{2}({\mathbf A}+S)({\mathbf A}-S)^{-1}({\mathbf A}+S)({\mathbf A}+S)^{-1}({\mathbf A}-S)= $$ $$ =\frac{1}{2}({\mathbf A}-S)+ \frac{1}{2}({\mathbf A}+S)={\mathbf A} \, . $$ ♦

Знакоопределенность

Здесь рассматриваются только вещественные квадратичные формы.

Квадратичная форма $ f_{}(X) $ называется

а) неотрицательной если $ f(X)\ge 0 $ для любого $ X\in \mathbb R^n $;

б) положительно определенной, если она неотрицательна и $ f(X)= 0 $ только при $ X=\mathbb O_{} $;

в) неопределенной или знакопеременной, если существуют $ \{X_1,X_2\} \subset \mathbb R^n $ такие что числа $ f(X_1) $ и $ f(X_2) $ имеют разные знаки: $ f(X_1)f(X_2)<0 $.

По аналогии с пунктами а) и б) определяются неположительные и отрицательно определенные квадратичные формы. Иногда неотрицательные или неположительные формы называют полуопределенными.

П

Пример. При $ n_{}=3 $ квадратичная форма

а) $ x_1^2+3x_2^2+4x_3^2 $ является положительно определенной;

б) $ x_1^2+x_3^{2} $ (или $ (x_1+{\sqrt 2} x_2-x_3)^{2} $) является неотрицательной, но не положительно определенной;

в) $ -x_1^2 $ является неположительной, но не отрицательно определенной;

г) $ -x_1^2-2\,x_2^2-4\,x_3^{2} $ является отрицательно определенной;

д) $ x_1x_{2}+x_2x_3 $ является неопределенной.

Какой смысл имеет свойство неотрицательности и положительной определенности с точки зрения математического анализа? — Неотрицательность формы $ f_{}(X) $ означает, что в точке $ X=\mathbb O $ эта функция достигает своего минимального значения: $ f(X)\ge 0 = f(\mathbb O) $; подчеркнем, что этот минимум будет глобальным. В случае положительной определенности точка $ X=\mathbb O $ будет единственной точкой пространства $ \mathbb R^{n} $, в которой $ f_{}(X) $ достигает своего минимального значения. Однако если свойство положительной определенности будет нарушено: $ f(X_1) =0 $ при $ X_1 \ne \mathbb O $, то вследствие однородности формы $ f_{}(X) $ будет выполнено $$ f(tX_1)=t^2f(X_1)= 0 \quad npu \quad \forall t \in \mathbb R \ . $$ Иными словами, свое минимальное значение $ 0_{} $ неотрицательная, но не положительно определенная, форма $ f_{} (X) $ будет принимать на всей прямой, проходящей через точки $ \mathbb O $ и $ \mathbb X_1 $. Точка $ X=\mathbb O $ перестает быть изолированной точкой минимума: в любой ее окрестности находятся другие точки минимума. С точки зрения здравого смысла, подобная ситуация может считаться исключительным, вырожденным случаем. Интуиция подтверждается аналитикой: как увидим впоследствии вероятность того, что случайным образом выбранная квадратичная форма, обладающая свойством неотрицательности, не будет, вдобавок, положительно определенной, равна $ 0_{} $. Событие теоретически возможно, но практически немыслимо.

Какой смысл имеет свойство положительной определенности с точки зрения геометрии? — Рассмотрим вещественную квадратичную форму от трех переменных: $ f(x,y,z) $. Поставим задачу определения типа поверхности второго порядка $$ f(x,y,z)=C $$ при произвольной константе $ C\in \mathbb R $. Если $ f $ положительно определена, то это уравнение не имеет вещественных решений при $ C<0 $. При $ C=0 $ уравнение определяет единственную точку в $ \mathbb R^3 $, а именно — начало координат. При $ C>0 $ уравнение определяет эллипсоид с центром в начале координат. От всех остальных поверхностей второго порядка эллипсоид отличает его замкнутость (и, как следствие, ограниченность).

Оказывается условие положительной определенности формы $ f $ является необходимым и достаточным для обеспечения подобного свойства в произвольном пространстве $ \mathbb R^n $. И это утверждение верно не только для квадратичной формы, но и для однородного полинома (формы) произвольного порядка.

§

Задача об условных экстремумах квадратичной формы $ f_{}(X) $ на сфере $ x_1^2+\dots+x_n^2 =1 $ решается ☞ ЗДЕСЬ.

П

Пример. В произвольном евклидовом пространстве $ \mathbb E $ квадратичная форма с матрицей Грама произвольной системы векторов $ \{X_1,\dots,X_m\} \subset \mathbb E $

$$ G(X_1,\dots,X_m)= \left( \begin{array}{cccc} \langle X_1,X_1 \rangle & \langle X_1,X_2 \rangle & \dots & \langle X_1,X_m \rangle \\ \langle X_2,X_1 \rangle & \langle X_2,X_2 \rangle & \dots & \langle X_2,X_m \rangle \\ \dots & & & \dots \\ \langle X_m,X_1 \rangle & \langle X_m,X_2 \rangle & \dots & \langle X_m,X_m \rangle \end{array} \right) $$ будет неотрицательной; эта квадратичная форма будет положительно определенной тогда и только тогда, когда система $ \{X_1,\dots,X_m\} $ линейно независима.

Задача. Найти условия неотрицательности и положительной определенности квадратичной формы в терминах ее коэффициентов.

Очевидны необходимые условия неотрицательности квадратичной формы $$ f(X)=\displaystyle \sum_{1\le j \le k \le n} f_{jk}x_jx_k \ : $$ все коэффициенты при квадратах переменных должны быть неотрицательными: $$ f_{11}\ge 0, \dots , f_{nn}\ge 0 . $$ Также очевидно, что эти условия будут и достаточными, если все остальные коэффициенты $ f_{jk}^{} $ при $ j\ne k $ равны нулю. Если же последнее условие не выполняется, то имеет смысл предварительно преобразовать квадратичную форму к сумме квадратов, т.е. исследовать ее канонический вид.

Т

Теорема. Ненулевая квадратичная форма, представленная в правильном виде

$$ f(X)=X^{\top}{\mathbf A}X \, , $$ будет неотрицательной тогда и только тогда, когда ее отрицательный индекс инерции равен нулю: $$ n_{-} ({\mathbf A})=0 \qquad \iff \qquad \qquad \sigma ( {\mathbf A})=\operatorname{rank} {\mathbf A} \ .$$ Если это условие выполнено, то для положительной определенности формы необходимо и достаточно чтобы она была невырождена: $ \det {\mathbf A} \ne 0 $.

Доказательство ☞ ЗДЕСЬ.

К счастью, явное представление канонического вида квадратичной формы уже имеется — как правило, он задается формулой Якоби. Индексы инерции вычисляются через знаки главных миноров матрицы квадратичной формы.

Т

Теорема [Сильвестр]. Квадратичная форма

$$ f(X)=X^{\top}{\mathbf A}X $$ будет положительно определенной тогда и только тогда, когда все главные миноры ее матрицы положительны: $$ a_{11}>0, \ \left| \begin{array}{cc} a_{11} & a_{12} \\ a_{12} & a_{22} \end{array} \right| >0, \ \left| \begin{array}{ccc} a_{11} & a_{12} & a_{13} \\ a_{12} & a_{22} & a_{23} \\ a_{13} & a_{23} & a_{33} \end{array} \right| >0, \dots, \det {\mathbf A} >0 \ . $$

Доказательство ☞ ЗДЕСЬ.

=>

Квадратичная форма будет отрицательно определенной тогда и только тогда, когда знаки главных миноров ее матрицы будут чередоваться следующим образом:

$$ a_{11}<0, \ \left| \begin{array}{cc} a_{11} & a_{12} \\ a_{12} & a_{22} \end{array} \right| >0, \ \left| \begin{array}{ccc} a_{11} & a_{12} & a_{13} \\ a_{12} & a_{22} & a_{23} \\ a_{13} & a_{23} & a_{33} \end{array} \right| <0, \dots, (-1)^n\det {\mathbf A} >0 \ . $$

В настоящем ресурсе я буду часто говорить об определенности или неопределенности вещественной симметричной матрицы, имея в виду соответствующее свойство порождаемой ею квадратичной формы. Имеется одна особенность в определении симметричной матрицы, задающей неотрицательную квадратичную форму, не являющуюся положительно определенной. Такую матрицу НЕ называют неотрицательной (этот термин закреплен за другим понятием теории матриц); такую матрицу называют положительно полуопределенной⁶⁾.

П

Пример. Найти все значения параметра $ {\color{Red} \alpha } $, при которых квадратичная форма

$$2\, x_1^2+2\, x_2^2+x_3^2+ 2\, {\color{Red}{ \alpha} } \, x_1x_2+6\, x_1x_3 +2\,x_2x_3 $$ будет положительно определенной.

Решение. Значения главных миноров: $$\det {\mathbf A}_1=2,\ \det {\mathbf A}_2=4- {\color{Red} \alpha }^2,\ \det {\mathbf A}_3=-{\color{Red} \alpha }^2+ 6\, {\color{Red} \alpha } -16 \ . $$ Последнее выражение будет отрицательно при любых $ {\color{Red} \alpha } \in \mathbb R $.

Ответ. Таких значений нет: $ {\color{Red} \alpha } \in \varnothing $.

Можно ли получить условия неотрицательности квадратичной формы: $$ f(X) \ge 0 \ npu \ \forall X \in {\mathbb R}^n $$ превращением всех неравенств из критерия Сильвестра в нестрогие: $ > \ \to {\color{Red}{ \to} } \ \ge $ ? — Вообще говоря, нет.

П

Пример. Квадратичная форма

$$f(x_1,x_2,x_3,x_4)=x_1^2+2x_1x_3+2x_2x_4+x_4^2= X^{\top} \left( \begin{array}{cccc} 1&0&1 &0 \\ 0&0&0&1 \\ 1&0&0&0 \\ 0&1&0&1 \end{array} \right)X $$ — неопределенная, т.к. $ f(1,0,-1,0)=-1_{}<0 $, а $ f(1,0,0,0)=1_{}>0 $. Тем не менее, все главные миноры ее матрицы неотрицательны. ♦

Имеются ли конструктивные необходимые и достаточные условия неотрицательности квадратичной формы?

Т

Теорема. Для неотрицательности квадратичной формы $ X^{\top} \mathbf A X $ необходимо и достаточно, чтобы все ведущие миноры матрицы $ \mathbf A $, т.е. миноры, стоящие на пересечении строк и столбцов матрицы с одинаковыми номерами

$$ A\left( \begin{array}{lll} j_1 & \dots & j_k \\ j_1 & \dots & j_k \end{array} \right) \ , j_1<j_2<\dots < j_k $$ были неотрицательны.

П

Пример. При любой матрице $ A \in \mathbb R^{m\times n} $ матрицы

$$ A^{\top} A \quad \mbox{ и } \quad A \cdot A^{\top} $$ являются положительно полуопределенными.

Знакоопределенность на подпространстве

Будем говорить, что квадратичная форма $ f(X) $ положительно определена на подпространстве $ \mathbb V_1 $ пространства $ \mathbb R^{n} $ если $ f(X)>0 $ при всех $ X\in \mathbb V_1, X \ne \mathbb O $.

Т

Теорема. Пусть линейное подпространство задано системой линейных однородных уравнений

$$ \left\{ \begin{array}{cccc} h_{11}x_1 & + \dots & + h_{1n}x_n&=0, \\ \dots & & & \dots \\ h_{k1}x_1 & + \dots & + h_{kn}x_n&=0, \\ \end{array} \right. \qquad \iff \qquad \underbrace{\left( \begin{array}{lll} h_{11} & \dots & h_{1n} \\ \dots & & \dots \\ h_{k1} & \dots & h_{kn} \end{array} \right)}_{=H}X=\mathbb O $$ Здесь $ k<n $ и предполагается, что минор, образованный первыми $ k_{} $ столбцами матрицы $ H_{} $ отличен от нуля, (т.е. $ \operatorname{rank} (H)=k $). Тогда необходимым и достаточным условием положительной определенности квадратичной формы $ X^{\top} \mathbf A X $ на этом подпространстве является то, что все главные миноры матрицы $$ (-1)^k \left( \begin{array}{cc} \mathbb O_{k\times k} & H \\ H^{\top} & \mathbf A \end{array} \right)_{(n+k)\times (n+k)} $$ порядков $ 2k+1, 2k+2, \dots, n+k $ положительны.

Результат приведен в [3] со ссылкой на статью [4], однако у меня есть основания считать, что он был известен еще Борхардту.

Приведение квадратичной формы к каноническому виду с помощью ортогональной замены переменных

В этом пункте рассматриваются только вещественные квадратичные формы. Существенно используются материалы из раздела СИММЕТРИЧНАЯ МАТРИЦА и начальный пункт раздела ОРТОГОНАЛЬНАЯ МАТРИЦА.

Т

Теорема. Cуществует замена переменных

$$ X=PY \ , $$ c ортогональной матрицей $ P_{} $, приводящая квадратичную форму $ f(X)=X^{\top} \mathbf A X $ к каноническому виду $$ \lambda_1 y_1^2 + \lambda_2 y_2^2+ \dots + \lambda_n y_n^2 ; $$ при этом коэффициентами канонического вида являются собственные числа матрицы $ \mathbf A $ (более точно: набор $ \{ \lambda_1,\dots, \lambda_n \} $ составляет спектр матрицы $ \mathbf A $).

Доказательство ☞ ЗДЕСЬ.

П

Пример. Найти ортогональную замену переменных, приводящую квадратичную форму

$$ X^{\top} \mathbf A X \quad npu \quad {\mathbf A}=\left(\begin{array}{rrr} 2 & 2 & -1 \\ 2 & -1 & 2 \\ -1& 2 & 2 \end{array} \right) $$ к каноническому виду.

Решение. Характеристический полином $ \det (\mathbf A- \lambda E)=-(\lambda-3)^2(\lambda+3) $. Простому собственному числу $ \lambda=-3 $ соответствует собственный вектор $ {\mathfrak X}_1=[1,-2,1]^{^{\top}} $, а собственному числу $ \lambda=3 $ второй кратности соответствуют два линейно-независимых собственных вектора $ {\mathfrak X}_2=[2,1,0]^{^{\top}} $ и $ {\mathfrak X}_3=[-1,0,1]^{^{\top}} $. Очевидно, что $ \langle {\mathfrak X}_1, {\mathfrak X}_2\rangle=0 , \langle {\mathfrak X}_1, {\mathfrak X}_3 \rangle =0 $, но $ \langle {\mathfrak X}_2, {\mathfrak X}_3 \rangle \ne 0 $. Ортогонализуем систему векторов $ \left\{{\mathfrak X}_2,{\mathfrak X}_3\right\} $: $${\mathfrak Y}_2={\mathfrak X}_2, {\mathfrak Y}_3={\mathfrak X}_3+ {\color{Red} \alpha } {\mathfrak Y}_2 \quad \mbox{ и } \ \langle {\mathfrak Y}_2,{\mathfrak Y}_3\rangle =0 \ \Longrightarrow {\color{Red} \alpha }=-\frac{\langle {\mathfrak X}_2,{\mathfrak X}_3\rangle} {\langle {\mathfrak X}_2,{\mathfrak X}_2\rangle}=\frac{2}{5} $$ и $ {\mathfrak Y}_3=\left[-1/5, 2/5, 1 \right]^{^{\top}} $. После нормирования, получаем ортогональную матрицу $$ P=\left(\begin{array}{rrr} 1/\sqrt{6} & 2/\sqrt{5} & -1/\sqrt{30} \\ -2/\sqrt{6} & 1/\sqrt{5} & 2/\sqrt{30} \\ 1/\sqrt{6} & 0 & 5/\sqrt{30} \end{array} \right) \ . $$ Замена переменных $ X=PY $ приводит квадратичную форму $ X^{\top} \mathbf A X $ к каноническому виду $$ (y_1,y_2,y_3) \left(\begin{array}{rrr} -3 & 0 & 0 \\ 0 & 3 & 0 \\ 0& 0 & 3 \end{array} \right) \left( \begin{array}{c} y_1 \\ y_2 \\ y_3 \end{array} \right)=-3\,y_1^2+3\,y_2^2+3\,y_3^2 \ . $$

Поскольку фундаментальную систему решений системы уравнений $ (\mathbf A - \lambda_j E)X= \mathbb O $ для кратного собственного числа $ \lambda_j $ можно строить разными способами, то у последней задачи имеется бесконечное множество ответов. Так, например, в качестве еще одной ортогональной матрицы можно взять $$P=\left(\begin{array}{rrr} 1/\sqrt{6} & -1/\sqrt{2} & 1/\sqrt{3} \\ -2/\sqrt{6} & 0 & 1/\sqrt{3} \\ 1/\sqrt{6}& 1/{\sqrt 2} & 1/\sqrt{3} \end{array} \right). $$

Т

Теорема. Если известны коэффициенты характеристического полинома матрицы квадратичной формы $ f(X)=X^{\top}\mathbf A X $:

$$ \det (\mathbf A- \lambda E) \equiv (-1)^n \left(\lambda^n+a_{1}\lambda^{n-1}+ \dots + a_n \right) \, ,$$ то $$ \operatorname{rank} (f(X))={\mathfrak r} \iff a_{n}=a_{n-1}=\dots=a_{{\mathfrak r}+1}=0,a_{{\mathfrak r}}\ne 0 \, . $$ В этом случае будет также выполнено $$ n_{+} (f(X))={\mathcal V}(1,a_1,\dots,a_{{\mathfrak r}}),\quad n_{-} (f(X))={\mathcal P}(1,a_1,\dots,a_{\mathfrak r}) \, , $$ $$ \sigma(f(X))=\sum_{j=1}^{\mathfrak r} \operatorname{sign} (a_{j-1}a_j) \quad npu \quad a_0=1 \, . $$

Доказательство основано на правиле знаков Декарта.

Геометрия замен переменных

В предыдущих пунктах мы рассмотрели два подхода к построению канонического вида квадратичной формы. Очевидно, что подход, основанный на ортогональной замене переменных более дорогостоящий в построении по сравнению с методом Лагранжа. В самом деле, он требует нахождения собственных чисел симметричной матрицы, т.е. решения алгебраического уравнения $ \det (\mathbf A - \lambda E)=0 $. В случае матриц порядка $ n> 4 $ корни этого уравнения, как правило, на находятся в виде «хорошей» комбинации коэффициентов, и могут быть определены разве лишь приближенно. Метод же Лагранжа принципиально безошибочен: коэффициенты канонического вида определяются в виде рациональных функций от коэффициентов квадратичной формы.

П

Пример. Уравнение $ 1/3x_1^2-x_1x_2+x_2^2=1 $ задает на плоскости эллипс:

Преобразование $$ y_1=x_1-3/2x_2, y_2=x_2 $$ приводит уравнение к виду $$ 1/3 y_1^2+1/4 y_2^2=1 ; $$ в новых координатах кривая имеет вид на рисунке слева. С другой стороны, преобразование $$ \begin{array}{ll} z_1&= \sqrt{1/2+1/\sqrt{13}}\,x_1+\sqrt{1/2-1/\sqrt{13}}\,x_2,\\ z_2&= \sqrt{-1/2-1/\sqrt{13}}\,x_1+\sqrt{1/2+1/\sqrt{13}}x_2 \end{array} $$ приводит уравнение к виду $$\frac{4-\sqrt{13}}{6}z_1^2+\frac{4+\sqrt{13}}{6}z_2^2=1 \ . $$ В этих координатах кривая имеет вид на рисунке справа.

Оба преобразования координат не изменяют типа кривой: эллипс остается эллипсом. Но второе преобразование дает нечто большее: оно сохраняет размеры. Фактически, оно сводится к повороту исходного эллипса.

Вывод. Метод Лагранжа «дешевле» метода ортогональных преобразований при решении задачи классификации алгебраических многообразий, заданных уравнением вида $ X^{\top} \mathbf A X=1 $. Иными словами, он позволяет «дешевле» определить тип поверхности с точностью до ее формы: например, в $ \mathbb R^3 $ является ли эта поверхность эллипсоидом или гиперболоидом (и каким именно — однополостным или двуполостным)? Но если нас интересуют истинные размеры этой поверхности: например, размеры посылочного ящика, в который эллипсоид, заданный уравнением $ X^{\top} \mathbf A X=1 $, можно было бы поместить — то здесь без собственных векторов и чисел матрицы $ \mathbf A $ не обойтись!

Здесь уместно вспомнить замечание о невырожденности замены переменных, приводящей квадратичную форму к каноническому виду. В чем заключается его геометрический смыcл? Для ответа на вопрос обратимся к приведенному выше примеру. Сделаем в квадратичной форме замену переменных зависящей от параметра: $$ x_1=t_1+\alpha t_2, x_2=t_1+t_2 \, . $$

На рисунке изображены получаемые в результате такой замены кривые при различных значениях параметра. И если при значениях $ \alpha=0.4 $ и $ \alpha=0.7 $ мы еще можем визуально распознать эллипс, то значение $ \alpha=0.9 $ заставляет подозревать, что соответствующая кривая при сильном растяжении разрывается на два куска, близкие к прямым. Именно это и происходит при $ \alpha=1 $. Вместо двух существенных переменных $ x_1 $ и $ x_2 $, у нас остается, фактически, одна, а именно $ t_1 + t_2 $, а нелинейная кривая выродилась в две прямые линии.

Билинейные формы

Задачи

☞ ЗДЕСЬ

Источники

[1]. Гантмахер Ф.Р. Теория матриц. 4-е изд. М.Наука. 1988.

[2]. Knuth D.E. A permanent inequality. American Math. Monthly, v. 88, N 10, 1981, p.731–740

[3]. Шилов Г.Е. Математический анализ. Конечномерные линейные пространства. М.Наука.1969, с.243

[4]. Шостак Р.Я. О признаке условной определённости квадратичной формы n переменных, подчинённых линейным связям, и о достаточном признаке условного экстремума функций n переменных, УМН, 9:2(60) (1954), 199–206

[5]. Иохвидов И.С. Ганкелевы и теплицевы матрицы и формы. М. Наука. 1974.

[6]. Turnbull H.W. The Theory of Determinants, Matrices and Invariants. Blackie & Sons Ltd. 1929.

¹⁾

На самом деле эти квадраты еще домножены на константы, но …, словом, говорят так, как говорят!

²⁾

И других функций, которые в настоящем ресурсе не рассматриваются.

³⁾

Якóби Карл Густав Якоб (Jacobi Carl Gustav Jacob, 1804-1851) — выдающийся немецкий математик, брат российского физика Бориса Семёновича Якоби. Замечательные результаты в теории чисел, алгебре, анализе и механике.

⁴⁾

Мое «изобретение», в литературе нет единого стиля обозначения.

⁵⁾

А вот следующее обозначение — традиционно.

⁶⁾

positive semidefinite

VMath

Основное

Навигация

Информация

Действия

Содержание

Квадратичная форма

Определение

Метод Лагранжа приведения квадратичной формы к каноническому виду

Матричная форма записи квадратичной формы

Метод Лагранжа и метод Гаусса

Формула Якоби

Закон инерции для квадратичных форм

Ранг квадратичной формы

Закон инерции

Конгруэнтность квадратичных форм

Знакоопределенность

Знакоопределенность на подпространстве

Приведение квадратичной формы к каноническому виду с помощью ортогональной замены переменных

Геометрия замен переменных

Билинейные формы

Задачи

Источники

VMath

Инструменты сайта

Основное

Навигация

Информация

Действия

Содержание

Квадратичная форма

Определение

Метод Лагранжа приведения квадратичной формы к каноническому виду

Матричная форма записи квадратичной формы

Метод Лагранжа и метод Гаусса

Формула Якоби

Закон инерции для квадратичных форм

Ранг квадратичной формы

Закон инерции

Конгруэнтность квадратичных форм

Знакоопределенность

Знакоопределенность на подпространстве

Приведение квадратичной формы к каноническому виду с помощью ортогональной замены переменных

Геометрия замен переменных

Билинейные формы

Задачи

Источники