Инструменты сайта


Для понимания материалов настоящего раздела крайне желательно ознакомиться с разделами ПОЛИНОМ ОДНОЙ ПЕРЕМЕННОЙ и ОПРЕДЕЛИТЕЛЬ.

Дискриминант

Будем обозначать через $ \mathbb A_{} $ какое-либо из множеств $ \mathbb Z_{}, \mathbb Q, \mathbb R $ или $ \mathbb C_{} $.

Дискриминант1) полинома $ f(x)=a_{0}x^n+a_1x^{n-1}+\dots+a_n, (n>1, a_0\ne 0) $ фактически совпадает с результантом этого полинома и его производной: $$ {\mathcal D}(f)=\frac{(-1)^{n(n-1)/2}}{a_0}{\mathcal R}(f(x),f^{\prime}(x)) \ . $$

Т

Теорема. Если $ \{ \lambda_{1},\dots,\lambda_n \} $ — набор корней полинома $ f_{}(x) $ с учетом их кратностей , то

$$ {\mathcal D}(f) =(-1)^{n(n-1)/2} a_0^{n-2}\prod_{j=1}^n f^{\prime}(\lambda_j)= a_0^{2n-2} \prod_{1\le j < k \le n} (\lambda_k - \lambda_j)^2 \ . $$

=>

$ {\mathcal D}(f_{}) = 0 $ тогда и только тогда, когда $ f_{}(x) $ имеет кратный корень.

П

Пример. Для квадратного трехчлена

$$ {\mathcal D}(a_0x^2+a_1x+a_2)=\frac{1}{a_0}\left|\begin{array}{ccc} a_0&a_1&a_2\\ 0&2a_0&a_1\\ 2a_0&a_1&0 \end{array}\right|=a_1^2-4\,a_0a_2 \ . $$

?

Показать, что

a) $ \displaystyle {\mathcal D}(x^{3}+p\,x+q)=-108\left(\frac{q^2}{4}+\frac{p^3}{27}\right) $;

б) $ {\mathcal D}(a_{0}x^3+a_1x^2+a_2x+a_3)= a_1^2a_2^2-4a_1^3a_3-4\,a_0a_2^3+18\,a_0a_1a_2a_3-27\,a_0^2a_3^2 $;

в) $ \displaystyle {\mathcal D}(x^{4}+px+q)=6912\left(\frac{q^3}{27}-\frac{p^4}{256}\right) $.

П

Пример.

$${\mathcal D} (a_0x^4+a_1x^3+a_2x^2+a_3x+a_4)=4I_2^3-27I_3^2 \ . $$ Здесь $$ I_2=4a_0a_4-a_1a_3 +\frac{1}{3}a_2^2 \ , $$ $$ I_3=-a_0a_3^2-a_1^2a_4+\frac{8}{3}a_0a_2a_4+ \frac{1}{3}a_1a_2a_3-\frac{2}{27}a_2^3 \ . $$

§

Смысл выражений $ I_{2} $ и $ I_{3} $ ЗДЕСЬ.

Свойства

1. $$ {\mathcal D}(A\cdot f(x)) = A^{2n-2} {\mathcal D}(f) ; $$ здесь $ A_{} $ — константа и $ \deg f = n_{}>1 $.

2. $$ {\mathcal D}(f(x)\cdot g(x))={\mathcal D}(f){\mathcal D}(g)\left[{\mathcal R}(f, g) \right]^2 \ ; $$ здесь $ {\mathcal R}(f, g_{}) $ — результант полиномов $ f(x)_{} $ и $ g_{}(x) $; степени которых предполагаются большими $ 1_{} $.

3. $$ {\mathcal D}(f(x)(x-a))={\mathcal D}(f)\left[f(a) \right]^2 \ . $$ 4. При условии $ a_{0}\ne 0, a_n \ne 0 $: $$ {\mathcal D}(a_0x^n+a_1x^{n-1}+\dots+a_n)={\mathcal D}(a_0+a_1x+\dots+a_{n-1}x^{n-1}+a_nx^n) $$

5. $$ {\mathcal D}(f(g(x))=\left[{\mathcal D}(f) \right]^m \prod_{j=1}^n {\mathcal D}(g(x)-\lambda_j) \ ; $$ здесь $ n=\deg f, m=\deg g , \{ \lambda_{1},\dots,\lambda_n \} $ — набор корней полинома $ f_{}(x) $, и старшие коэффициенты $ f_{}(x) $ и $ g_{}(x) $ считаются равными $ 1_{} $.

?

Выразить

a) $ {\mathcal D}(f_{}(A\,x+B)) $; б) $ {\mathcal D}(f(x^{m})) $; в) $ {\mathcal D}( {\tilde f}_{}(x)) $ через $ {\mathcal D}(f)_{} $. Здесь $$ {\tilde f}(x)\equiv (C\,x+D)^n f\left(\frac{A\,x+B}{C\,x+D} \right) \ . $$

Детерминантные представления

В соответствии с определением, дискриминант можно представить в виде определителя порядка $ 2n-1_{} $: $$ {\mathcal D}(f)=\frac{1}{a_0} \left|\begin{array}{cccccccccc} a_0&a_1&a_2&\ldots&\ldots&a_n&0&\dots &0 &0\\ 0&a_0&a_1&\ldots&\ldots&a_{n-1}&a_n&\dots&0 &0\\ \vdots&&\ddots&&&&&&\ddots\\ 0&0&\ldots&a_0&a_1&\ldots & & \ldots &a_{n-1} &a_n\\ 0&0&\ldots&&na_0&(n-1)a_1&\ldots& \ldots &2a_{n-2}&a_{n-1}\\ 0&0&\ldots&na_0&(n-1)a_1&\ldots &&\ldots &a_{n-1}&0\\ \vdots&&&\ldots&&&& &&\vdots\\ 0&na_0&\ldots&\ldots&&a_{n-1}&\ldots&&\ldots&0\\ na_0&\ldots&\ldots&&a_{n-1}&0&\ldots&&&0 \end{array}\right| \begin{array}{l} \left.\begin{array}{l} \\ \\ \\ \\ \end{array}\right\} n-1 \\ \left. \begin{array}{l} \\ \\ \\ \\ \\ \end{array}\right\} n \end{array} $$ В результате элементарных преобразований строк этого определителя, дискриминант можно представить в виде определителя порядка $ 2n-2_{} $: $$ {\mathcal D}(f)=\frac{1}{n^{n-2}} \left|\begin{array}{cccccccc} a_1&2a_2&3a_3&\ldots&na_n&0&\ldots&0\\ 0& a_1&2a_2&3a_3&\ldots&na_n&\ldots&0\\ & & &\ldots&\ldots& & & \\ 0&\ldots&0&a_1&2a_2&3a_3&\ldots&na_n\\ 0&\ldots&0&na_0&(n-1)a_1&(n-2)a_2&\ldots&a_{n-1}\\ 0&\ldots&na_0&(n-1)a_1&(n-2)a_2&\ldots&a_{n-1}&0\\ & & &\ldots&\ldots& & & \\ na_0&(n-1)a_1&(n-2)a_2&\ldots&a_{n-1}&0 &\ldots&0 \end{array}\right| $$ Последний определитель может быть получен и из альтернативного определения дискриминанта. Рассмотрим однородный полином (форму) от двух переменных $ x_{} $ и $ y_{} $: $$ F(x,y)= a_0x^n + a_1x^{n-1}y +a_2x^{n-2}y^2+\dots+a_{n-1}xy^{n-1}+a_ny^n . $$ Вычислим его частные производные $$ \phi(x,y)=\partial F / \partial x ,\ \psi(x,y)=\partial F / \partial y \ . $$ Тогда дискриминантом формы $ F(x,y)_{} $ называется результант полиномов $ \psi(x,1)_{} $ и $ \phi(x,1)_{} $.

Дискриминант как полиномиальная функция коэффициентов

По построению, дискриминант является однородным полиномом относительно коэффициентов $ a_{0},\dots,a_n $, причем полиномом с целыми коэффициентами: $$ {\mathcal D}(a_0x^n+\dots+a_n)\equiv D(a_0,\dots,a_n) \in {\mathbb Z}[a_0,\dots,a_n] \ ;$$ степень этого полинома равна $ 2n-2_{} $, и в своем разложении по степеням $ a_{0},\dots,a_n $ он будет содержать одночлен $ (-1)^{n(n-1)/2}n^n a_{0}^{n-1}a_n^{n-1} $.

Т

Теорема. Если полином $ f(x)_{} $ имеет единственный кратный корень $ \lambda_{} $ второй кратности,то

$$ 1 : \lambda : \lambda^2 : \dots : \lambda^n = \frac{\partial D}{\partial a_n} : \frac{\partial D}{\partial a_{n-1}} : \frac{\partial D}{\partial a_{n-2}} : \dots : \frac{\partial D}{\partial a_{0}} \, . $$

.

П

Пример. Вывести общую формулу вычисления кратного корня полинома

$$ f(x)=a_{0}x^4+a_1x^3+a_2x^2+a_3x+a_4 $$ при условии единственности этого корня.

Решение. C использованием формулы для дискриминанта полинома четвертой степени ( см. ВЫШЕ ), имеем: $$\lambda = -\frac{2\,a_1I_2^2+9\,(-2\,a_0a_3+1/3\, a_1a_2)I_3}{8\,a_0I_2^2-9\,I_3(-a_1^2+8/3\,a_0a_2)} \ . $$

Для полинома $ f(x)= x^{4}-5x^3+4x^2+3x+9 $ будет $ I_{2}=169/3, I_3=-4394/27 $, $ {\mathcal D}(f)=0_{} $ и, по формуле имеем $ \lambda_{} = 3 $.

Дискриминант является инвариантом полинома $ f(x)_{} $ (строго говоря, инвариантом однородного полинома (формы) $ y^{n}f(x/y) $).
Т

Теорема. Имеет место тождество

$$ na_0\frac{\partial D}{\partial a_1}+(n-1)a_1\frac{\partial D}{\partial a_2}+\dots+a_{n-1}\frac{\partial D}{\partial a_n} \equiv 0 $$

Субдискриминанты

Определитель, получающийся из определителя $$ \left|\begin{array}{cccccccc} a_1&2a_2&3a_3&\ldots&na_n&0&\ldots&0\\ 0& a_1&2a_2&3a_3&\ldots&na_n&\ldots&0\\ & & &\ldots&\ldots& & & \\ 0&\ldots&0&a_1&2a_2&3a_3&\ldots&na_n\\ 0&\ldots&0&na_0&(n-1)a_1&(n-2)a_2&\ldots&a_{n-1}\\ 0&\ldots&na_0&(n-1)a_1&(n-2)a_2&\ldots&a_{n-1}&0\\ & & &\ldots&\ldots& & & \\ na_0&(n-1)a_1&(n-2)a_2&\ldots&a_{n-1}&0 &\ldots&0 \end{array}\right| $$ вычеркиванием первых $ k_{} $ и последних $ k_{} $ строк, и первых $ k_{} $ и последних $ k_{} $ столбцов будем называть $ k_{} $-ым субдискриминантом дискриминанта $ \mathcal D (f_{}) $ и обозначать $ {\mathcal D}_{k} $. Для удобства формулировки некоторых последующих результатов дополнительно положим, что нулевой субдискриминант равен величине самого определителя, т.е. $$ {\mathcal D}_0=n^{n-2}{\mathcal D} (f) \quad u \quad {\mathcal D}_{n-1} = 1 \ . $$

В классической и современной литературе я не встречал устоявшегося названия объекта из последнего определения. В книге [2] сходный определитель назван апериодическим или биградиентным.
Т

Теорема. Полином $ f_{}(x) $ имеет ровно $ d_{} $ общих корней со своей производной (более строго: $ \deg( \operatorname{HOD} (f,f^{\prime}))=d$) тогда и только тогда, когда

$$ \underbrace{{\mathcal D}_0=0, {\mathcal D}_1=0,\dots, {\mathcal D}_{d-1}=0}_d,{\mathcal D}_d\ne 0 \ . $$

=>

Если полином $ f_{}(x) $ имеет единственный кратный корень второй кратности, то этот корень рационально выражается через коэффициенты полинома:

$$ \lambda=-\frac{\tilde {\mathcal D}_1}{{\mathcal D}_1} \ , $$ где $ \tilde {\mathcal D}_{1} $ – определитель, получающийся из $ {\mathcal D}_{0} $ вычеркиванием из него первой и последней строк, а также первого и предпоследнего столбцов (таким образом $ \tilde {\mathcal D}_{1} $ отличается от $ {\mathcal D}_{1} $ только последним столбцом).

П

Пример. Определить все значения параметра $ {\color{Red} \alpha } $, при которых полином

$$ f(x)=2\,x^5+3\,x^4+4\,x^3+x^{2}-{\color{Red} \alpha } $$ обладает единственным кратным корнем и вычислить этот корень.

Решение. Составляем определитель для $ {\mathcal D}_{0} $: $$ {\mathcal D}_0=\left|\begin{array}{rrrrrrrr} 3 & 8 & 3 & 0 & -5 {\color{Red} \alpha } & 0 & 0 & 0 \\ 0 & 3 & 8 & 3 & 0 & -5 {\color{Red} \alpha } & 0 & 0 \\ 0 & 0 & 3 & 8 & 3 & 0 & -5 {\color{Red} \alpha } & 0 \\ 0 & 0 & 0 & 3 & 8 & 3 & 0 & -5 {\color{Red} \alpha } \\ 0 & 0 & 0 & 10 & 12 & 12 & 2 & 0 \\ 0 & 0 & 10 & 12 & 12 & 2 & 0 & 0 \\ 0 & 10 & 12 & 12 & 2 & 0 & 0 & 0 \\ 10 & 12 & 12 & 2 & 0 & 0 & 0 & 0 \end{array} \right| = $$ $$ =50000\,{\color{Red} \alpha }^4-100608\,{\color{Red} \alpha }^3+51216\,{\color{Red} \alpha }^2-608\,{\color{Red} \alpha } \ . $$ Этот полином по $ {\color{Red} \alpha } $ обращается в нуль только при $ {\color{Red} \alpha } \in \{0,1, 38/3125 \} $. Вычеркивая из $ {\mathcal D}_{0} $ крайние столбцы и строки, составляем $$ {\mathcal D}_1=\left|\begin{array}{rrrrrr} 3 & 8 & 3 & 0 & -5 {\color{Red} \alpha } & 0 \\ 0 & 3 & 8 & 3 & 0 & -5 {\color{Red} \alpha } \\ 0 & 0 & 3 & 8 & 3 & 0 \\ 0 & 0 & 10 & 12 & 12 & 2 \\ 0 & 10 & 12 & 12 & 2 & 0 \\ 10 & 12 & 12 & 2 & 0 & 0 \end{array} \right| = 110000\,{\color{Red} \alpha }^2-102400\,{\color{Red} \alpha }-7600 \ . $$ При подстановке сюда найденных значений параметра $ {\color{Red} \alpha } $, получим: $$ {\mathcal D}_1 \ne 0 \ npu \ {\color{Red} \alpha } \in \{0, 38/3125 \}; \ {\mathcal D}_1 = 0 \ npu \ {\color{Red} \alpha } =1 \ . $$ Таким образом, полином $ f_{}(x) $ обладает единственным кратным корнем второй кратности при $ {\color{Red} \alpha } \in \{0, 38/3125 \} $, а при $ {\color{Red} \alpha } =1 $ имеет либо несколько кратных корней, либо один кратности выше второй. Для установления величины кратного корня, составим определитель $ \tilde {\mathcal D}_{1} $: $$ \tilde {\mathcal D}_1=\left|\begin{array}{rrrrrr} 3 & 8 & 3 & 0 & -5 {\color{Red} \alpha } & 0 \\ 0 & 3 & 8 & 3 & 0 & 0 \\ 0 & 0 & 3 & 8 & 3 & -5 {\color{Red} \alpha } \\ 0 & 0 & 10 & 12 & 12 & 0 \\ 0 & 10 & 12 & 12 & 2 & 0 \\ 10 & 12 & 12 & 2 & 0 & 0 \end{array} \right| = 147000{\color{Red} \alpha }^2-147000{\color{Red} \alpha } \ , $$ и подставим в формулу $$ \lambda=- \tilde {\mathcal D}_1 / {\mathcal D}_1 $$ найденные значения $ {\color{Red} \alpha } $: $$ \lambda = \left\{ \begin{array}{cl} 0 & npu \ {\color{Red} \alpha } =0 , \\ -1/5 & \ npu \ {\color{Red} \alpha } = 38/3125 \ . \end{array} \right. $$

При $ {\color{Red} \alpha }=1 $ имеются два кратных корня $$ (-1+\mathbf i \sqrt{3})/2,\ (-1-\mathbf i \sqrt{3})/2 \ , $$ каждый — второй кратности. Но это факт устанавливается рассмотрением субдискриминанта $ \mathcal D_2 $.

Представление дискриминанта посредством ганкелевой матрицы

Для полинома $ f_{}(x) $ его $ k_{} $-й суммой Ньютона называется сумма $ k_{} $-х степеней его корней $$ s_k=\sum_{j=1}^n\lambda_j^k \ . $$ Суммы Ньютона выражаются рационально через коэффициенты полинома $ f_{}(x) $ посредством следующих рекуррентных формул Ньютона: $$s_0=n,\ s_1=-a_1/a_0,\ $$ $$ s_k=\left\{\begin{array}{lr} -(a_1s_{k-1}+a_2s_{k-2}+\dots+a_{k-1}s_1+a_kk)/a_0, &npu \ k\le n ;\\ -(a_1s_{k-1}+a_2s_{k-2}+\dots+a_ns_{k-n})/a_0, &npu \ k > n \end{array} \right. $$ Явное выражение сумм Ньютона через $ a_{0}, \dots, a_n $ дается формулой Варинга.

Вычислим суммы Ньютона $ s_{0},s_1,\dots,s_{2n-2} $ полинома $ f_{}(x) $ и составим из них ганкелеву матрицу $$ S=\left[s_{j+k} \right]_{j,k=0}^{n-1} = \left[\begin{array}{llllll} s_0 &s_1&s_2&\dots&s_{n-2}& s_{n-1}\\ s_1 &s_2&s_3&\dots&s_{n-1}& s_{n}\\ s_2 &s_3&s_4&\dots&s_{n}& s_{n+1}\\ \dots& & &&& \dots\\ s_{n-1} &s_n&s_{n+1}&\dots &s_{2n-3}&s_{2n-2} \end{array}\right]_{n\times n} \ . $$ Обозначим $ S_{1},\dots, S_n $ ее главные миноры.

Т

Теорема. Имеет место формула связи миноров матрицы $ S_{} $ с субдискриминантами:

$$ {\mathcal D}_{k}=n^{n-k-2}a_0^{2(n-k-1)}S_{n-k} \ , $$ В частности, $$ {\mathcal D}(f)=a_0^{2n-2}\det S \ . $$

Доказательство следует из представления результанта $ \mathcal R(f,f^{\prime}) $ в форме Кронекера.

=>

Если $ S_n=0, S_{n-1}\ne 0 $, то полином $ f(x) $ имеет единственный кратный корень, и кратность этого корня — вторая. Этот корень вычисляется по формуле

$$ \lambda = s_1-\frac{1}{S_{n-1}} \left| \begin{array}{lllll} s_0 & s_1 & \dots & s_{n-3} & s_{n-1} \\ s_1 & s_2 & \dots & s_{n-2} & s_{n} \\ \vdots & & & & \vdots \\ s_{n-2} & s_{n-1} & \dots & s_{2n-1} & s_{2n-3} \end{array} \right| \, . $$ В правой части формулы стоит определитель, получающейся вычеркиванием из матрицы $ \det S $ последней строки и предпоследнего столбца.

Влияние на корни полинома

Оценка близости корней

Дискриминант фактически отвечает за близость корней полинома $ f_{}(x) $: чем ближе корни, тем он меньше и наоборот. Величина дискриминанта может быть использована и для оценки расстояния между корнями.
Т

Теорема. Имеет место оценка

$$ \frac{\sqrt{\left|{\mathcal D}(f) \right|}}{(2\rho)^{n(n-1)/2-1}|a_0|^{n-1}} \le \min_{j,k\in \{1,\dots,n \} \atop j\ne k} \left|\lambda_j - \lambda_k \right| \le \frac{\left|{\mathcal D}(f)\right|^{1/[n(n-1)]}}{|a_0|^{2/n}} \quad npu \quad \rho = \max_{j \in \{1,\dots,n \}} |a_j| \ . $$

Решение уравнений в радикалах

Из школьного курса алгебры известна формула, выражающая корни квадратного уравнения $ f(x)=a_{0}x^2+a_1x+a_2=0 $ в виде функций коэффициентов: $$ \lambda_{1,2}=\frac{-a_1\pm\sqrt{{\mathcal D}(f)}}{2a_0} \ . $$ Здесь $ {\mathcal D}(f)=a_{1}^2-4a_0a_2 $ – дискриминант квадратного трехчлена. В этой формуле предполагалось, что $ {\mathcal D}(f) \ge 0_{} $, a все коэффициенты, разумеется, считались вещественными. Тем не менее, формула остается справедливой и в том случае, когда коэффициенты полинома являются мнимыми (см. ЗДЕСЬ ).

Для кубического уравнения $ f(x)=a_{0}x^3+a_1x^2+a_2x+a_3=0 $ также существует явная формула, выражающая корни через коэффициенты — формула Кардано. В частном случае полинома $ f(x)=x^{3}+px+q $ она имеет вид $$ \lambda = \sqrt[3]{-\frac{q}{2}+\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}}+ \sqrt[3]{-\frac{q}{2}-\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}} $$ По определенному правилу (см. ЗДЕСЬ ) комбинируются значения корней кубических из (вообще говоря) мнимых чисел (даже для случая вещественных $ p_{} $ и $ q_{} $). Под знаком квадратного корня снова стоит диcкриминант: $$ \frac{q^2}{4}+\frac{p^3}{27} = -108 {\mathcal D}(x^3+px+q) \ . $$

Вещественность корней

Полином $ f(x)=a_0x^{n}+a_1x^{n-1}+\dots+a_{n} $ с вещественными коэффициентами $ a_{0}\ne 0, a_1,\dots a_n $ может иметь как вещественные, так и мнимые корни $ \lambda_{1},\dots,\lambda_n $ (см. ЗДЕСЬ ). Хотя сами эти корни, как правило, не выражаются в «хороших» функциях от коэффициентов (см. РЕШЕНИЕ УРАВНЕНИЙ В РАДИКАЛАХ ), но условия наличия среди них заданного количества вещественных могут быть выражены в виде полиномиальных неравенств, наложенных на $ a_{0}, a_1,\dots a_n $. Самым существенным из этих условий является условие на знак дискриминанта $ {\mathcal D}(f_{}) $.

П

Пример. Необходимым и достаточным условием вещественности корней полинома

a) $ f(x)=a_{0}x^2+a_1x+a_{2} $ является $ {\mathcal D}(f)=a_1^2-4a_0a_{2} \ge 0 $;

б) $ f(x)=x^{3}+p\,x+q_{} $ является $ {\mathcal D}(f) = -4\,p^3-27\,q^{2} \ge 0 \ \iff \ \frac{q^2}{4}+\frac{p^3} {27} \le 0 $.

При степени полинома $ n \ge 4_{} $ условие положительности дискриминанта уже не будет необходимым и достаточным для вещественности всех его корней.

Т

Теорема. Для того, чтобы все корни полинома $ f(x)_{} $ были вещественными необходимо, чтобы $ {\mathcal D}(f) \ge 0_{} $.

Доказательство очевидно следует из представления $ \mathcal D (f)_{} $ через корни $ f(x)_{} $.

Более общий результат связывает количество различных вещественных корней $ f(x)_{} $ со знаками субдискриминантов.

Т

Теорема. Пусть $ {\mathcal D}(f) \ne 0_{} $. Если в последовательности субдискриминантов

$$ {\mathcal D}_0,{\mathcal D}_{1},\dots,{\mathcal D}_{n-1}=1 $$ нет двух последовательных нулей, то все корни полинома $ f(x)_{} $ различны и число вещественных равно $$ {\mathcal P}(1,{\mathcal D}_{n-1},\dots,{\mathcal D}_0) - {\mathcal V}(1,{\mathcal D}_{n-1},\dots,{\mathcal D}_0) \ , $$ где $ {\mathcal P} $ и $ {\mathcal V} $ — числа знакопостоянств и знакоперемен в последовательности.

Предыдущая теорема является переформулировкой следующей, основанной на представлении дискриминанта посредством ганкелевой матрицы $ S_{} $.

Т

Теорема [Якоби]. Число различных корней полинома $ f(x)_{} $ равно рангу, а число различных вещественных корней $ f(x)_{} $ — сигнатуре матрицы $ S_{} $.

Конструктивное вычисление ранга и сигнатуры симметричной матрицы $ S_{} $ возможно посредством определения знаков ее главных миноров $ S_{1},\dots,S_n $.

=>

Пусть

$$ S_n=0,\dots,S_{{\mathfrak r}+1}=0,S_{\mathfrak r}\ne 0, \dots, S_1 \ne 0 \ .$$ Тогда $ \operatorname{rank} (S)={\mathfrak r}_{} $ и число различных вещественных корней $ f(x)_{} $ равно $${\mathcal P}(1,S_1,\dots,S_{\mathfrak r}) -{\mathcal V}(1,S_1,\dots,S_{\mathfrak r}) \ . $$

=>

Для того, чтобы все корни полинома $ f(x) \in \mathbb R[x]_{} $ были вещественны и различны необходимо и достаточно, чтобы все главные миноры матрицы $ S_{} $ были положительны:

$$ S_1>0,\dots,S_n > 0 \ . $$

П

Пример. Определить число вещественных корней полинома

$$ x^{5}-3\,x^3-x-1 \, . $$

Решение. Суммы Ньютона: $$ \{s_j \}_{j=0}^8=\{5,\, 0,\, 6,\, 0,\, 22,\, 5,\, 72,\, 21,\,238 \} \ . $$ Составляем из них ганкелеву матрицу $$ S= \left[ \begin{array}{rrrrr} 5 & 0 & 6 & 0 & 22 \\ 0 & 6 & 0 & 22 & 5 \\ 6 & 0 & 22 & 5 & 72 \\ 0 & 22 & 5 & 72 & 21 \\ 22 & 5 & 72 & 21 & 238 \end{array} \right] $$ и вычисляем ее главные миноры: $$ S_1=5,\, S_2=30,\, S_3=444,\, S_4=-4598,\, S_5=-56\,123 \ . $$ Поскольку $ S_{5}\ne 0 $, все корни $ f(x)_{} $ различны. $$ {\mathcal P}(1,\,5,\,30,\,444,\,-4598,\,-56\,123)=4,\ {\mathcal V}(1,\,5,\,30,\,444,\,-4598,\,-56\,123)=1 \ . $$

Ответ. Три вещественных корня.

П

Пример. Установить количество вещественных корней полинома

$$ 2\,x^{5}+3\,x^4+4\,x^3+x^{2}- {\color{Red} \alpha } $$ в зависимости от значений параметра $ {\color{Red} \alpha } \in \mathbb R $.

Решение. Дискриминант полинома и его первый субдискриминант уже были вычислены выше: $$ {\mathcal D}_0= 16\alpha(3125\,{\color{Red} \alpha }-38)({\color{Red} \alpha }-1)^2,\ {\mathcal D}_1=400\,(275\,{\color{Red} \alpha }+19)(\alpha-1) \ . $$ $$ {\mathcal D}_2=\left|\begin{array}{rrrr} 3 & 8 & 3 & 0 \\ 0 & 3 & 8 & 3 \\ 0 & 10 & 12 & 12 \\ 10 & 12 & 12 & 2 \end{array} \right| = -2940 \ , {\mathcal D}_3=\left|\begin{array}{rr} 3 & 8 \\ 10 & 12 \end{array} \right|=-44 \ . $$ Анализируем знаки $ {\mathcal D}_{0} $ и $ {\mathcal D}_{1} $ в зависимости от значений параметра $ \alpha_{} $; здесь критическими оказываются те значения, что обращают хоть один из субдискриминантов в нуль: $$ \begin{array}{c|c|c|c} & {\mathcal D}_0 & {\mathcal D}_1 & \begin{array}{l} {\mathcal P}(1,1,{\mathcal D}_3,{\mathcal D}_2, {\mathcal D}_1,{\mathcal D}_0) - \\ {\mathcal V}(1,1,{\mathcal D}_3,{\mathcal D}_2, {\mathcal D}_1,{\mathcal D}_0) \end{array} \\ \hline {\color{Red} \alpha }>1 & >0 & <0 & 3-2 \\ \hline \frac{38}{3125}<{\color{Red} \alpha }<1 & >0 & <0 & 3-2 \\ \hline 0<{\color{Red} \alpha }<\frac{38}{3125} & <0 & <0 & 4-1 \\ \hline -\frac{19}{275} < {\color{Red} \alpha } < 0 & >0 & <0 & 3-2 \\ \hline {\color{Red} \alpha } < -\frac{19}{275} & >0 & >0 & 3-2 \end{array} $$

Ответ. Полином имеет один вещественный корень при $ {\color{Red} \alpha }<0_{} $ и при $ {\color{Red} \alpha } > 38/3125 $; полином имеет три вещественных корня при $ {\color{Red} \alpha } \in [0,38/3125] $.

Обратим внимание, что установленные в предыдущем примере условия имеют следующую структуру: границами интервалов значений параметра $ {\color{Red} \alpha } $, обеспечивающих заданное количество вещественных корней у полинома $ f(x,{\color{Red} \alpha }) $, оказались корни его дискриминанта $ \mathcal D_{x} (f(x,{\color{Red} \alpha })) $. Это обстоятельство оказывается проявлением общего принципа: из всех неравенств на знаки субдискриминантов самым критичным оказывается условие на знак самого дискриминанта.
Т

Теорема. В $ n_{} $-мерном пространстве коэффициентов $ (a_{1},\dots, a_n) $ области, соответствующие полиномам

$$ f(x)=x^n+a_1x^{n-1}+\dots+a_{n} $$ с одинаковым числом вещественных корней, отделяются друг от друга дискриминантной поверхностью, т.е. поверхностью $$D(1,a_1,\dots,a_n) = \mathcal D_x(x^n+a_1x^{n-1}+\dots + a_n)=0 \ . $$

Это свойство дискриминанта оправдывает его название: discriminant (лат.) — различающий, разделяющий; слово дискриминация происходит от discriminatio — различение.
П

Пример. Для полинома $ x^{3}+px+q $ дискриминантная поверхность становится плоской кривой: $ 4\,p^3+27\,q^2 =0 $; она отделяет (см. анализ ЗДЕСЬ ) область значений параметров $ (p,q_{}) $, соответствующих полиномам с тремя вещественными корнями (обозначена желтым цветом) от области полиномов, имеющих лишь один вещественный корень (обозначена голубым).

Авторство приведенной выше теоремы до конца не выяснил. В [3] на с. 252 идут ссылки на работу Brill от 1877 г., а также на работы Кронекера по теории характеристик. В отечественной литературе выражение «дискриминантная поверхность» — в указанном смысле — не встречал; только в классической немецкой под названием Diskriminantenfläche. В теории огибающих это выражение используется в ином смысле.

Приложения

Экстремальные значения полинома

Задача. Для полинома $ f(x)=a_0x^{n}+a_1x^{n-1}+\dots+a_n $ с вещественными коэффициентами $ a_0\ne 0, a_{1},\dots a_n $ найти его экстремальные значения. В частности, при $ n_{} $ – четном и $ a_{0}<0 $ найти его абсолютный максимум $$ \max_{x\in {\mathbb R}}f(x) \ . $$

Т

Теорема. Экстремальные значения полинома $ f_{}(x) $ являются вещественными корнями полинома

$$ {\mathcal F}(z)={\mathcal D}_x(f(x)-z) \ . $$ Здесь дискриминант рассматривается от полинома по переменной $ x_{} $, а $ z_{} $ считается числовым параметром.

=>

При $ n_{} $ – четном и $ a_{0}<0 $ максимальное значение полинома $ f_{}(x) $ совпадает с максимальным корнем полинома $ {\mathcal F}(z_{}) $, при условии, что этот корень не является кратным.

П

Пример. Для

$$ f(x)=x^{4}+p\,x+q $$ имеем $${\mathcal F}(z)=256\ z^3-768q\ z^2+768q^2\ z+(27 p^4-256 q^3) \ .$$

П

Пример. Найти максимум полинома

$$ f(x)=-x^{6}+12\,x^2+12\,x+2 \, . $$

Решение. Имеем $$ \mathcal F(z)= 46656(-z^5+10\,z^4+472\,z^3+16208\,z^2-16272\,z-32800)\ , $$ и максимальный вещественный корень последнего полинома $ \approx 35.6321_{} $, что совпадает со значением полинома $ f_{}(x) $ на одном из корней его производной: $ \mu_{} \approx 1.51851 $.

Выводы. Вместо того, чтобы искать все вещественные корни производной $ f{'}(x) $, подставлять их потом в $ f_{}(x) $ и сравнивать получившиеся значения, мы ищем только один — максимальный корень нового полинома $ \mathcal F_{}(z) $. Последнюю задачу — поиска какого-то одного корня алгебраического уравнения с заранее определенными свойствами — иногда решать проще. Так, к примеру, можно наудачу попробовать искать максимальный корень полинома $ \mathcal F_{}(z) $ по методу Бернулли — и если алгоритм сойдется к положительному значению, то оно2) и будет величиной глобального максимума $ f_{}(x) $.
?

Построить полином $ {\mathcal F}(z) $ для

а) $ f(x)=-x^{4}-4x^3+2x^2+12x $,

б) $ f(x)=-x^{4}+4x^3-4x^2 $,

в) $ f(x)=-x^{6}-10x^3+12 x $

и установить, что $ \max f_{}(x) $ достигается в двух стационарных точках.

Существенность условия простоты максимального корня $ {\mathcal F}(z) $ поясняет следующий

П

Пример [4]. Для

$$ f(x)=-x^{6}-135\, x^2-324\, x $$ получим: $$ {\mathcal F}(z)\equiv 46656(z^3+1080\,z^2+1603800\,z-354294000)(z-540)^2 $$ имеет максимальный корень равным $ z_{}=540 $; однако последний соответствует комплексно-сопряженным корням $ \mu_{1,2}=(-3\pm \mathbf i\sqrt {15})/2_{} $ производной $ f{'}(x)=-6(x^{5}+45\,x+54) $. Максимум $ f_{}(x) $ достигается на корне $ \mu_{3}=1-\sqrt[3]{10} $ и равен $ 90(-4+5 \sqrt[3]{10}-\sqrt[3]{100}_{}) \approx 191.7526154 $.

Экстремальные значения неявной функции

Обобщением задачи из предыдущего пункта является следующая:

Задача. Найти экстремумы функции $ y=f_{}(x) $, заданной алгебраическим уравнением $ \Phi_{}(x,y)=0 $. Здесь $ \Phi_{}(x,y) $ — полином по $ x $ и $ y $ с вещественными коэффициентами.

Т

Теорема. Экстремальные значения неявной функции являются вещественными корнями полинома

$$ {\mathcal F}(y)={\mathcal D}_x(\Phi(x,y)) \ . $$ Здесь дискриминант рассматривается от полинома по переменной $ x_{} $, а $ y_{} $ считается числовым параметром.

Доказательство. Необходимое условие экстремума функции $ y=f_{}(x) $ в точке $ x=x_{0} $ заключается в обращении в нуль производной $ f^{\prime}(x_{}) $. Дифференцируя тождество $ \Phi(x,f(x)) \equiv 0 $ по $ x_{} $ $$ \frac{\partial \Phi}{\partial x} + \frac{\partial \Phi}{\partial y} f^{\prime}(x) \equiv 0 $$ получаем, что в точке $ x=x_0, y_0=f(x_0) $ должны быть выполнены условия $$ \Phi(x,y)=0,\ \partial \Phi / \partial x = 0 \ . $$

П

Пример. Найти минимум неявной функции, заданной уравнением

$$ -x^4-1/2 y^4+4\,x^2+3\,xy+4\,y=0 \ \mbox{при} \ y < 0, x\in ]-2,2[ \ . $$

Решение. Вопрос о существовании и способах представления этой функции решается ЗДЕСЬ; но в настоящем решении мы просто формально применяем теорему: $$ {\mathcal F}(y)={\mathcal D}_x(-x^4+4\,x^2+3\,xy-1/2 y^4+4\,y) = $$ $$ =32\,y^{12}-768\,y^9-512\,y^8+3552\,y^6+8192\,y^5-139\,y^4+4352\,y^3-30464\,y^2-16384\,y \ . $$ Вещественные корни последнего полинома: $$ y_1 \approx -1.795011, \ y_2 \approx -0.490598, \ y_3= 0,\ y_4 \approx 2.741399 \ . $$ Минимальным корнем является первый, по его значению можно восстановить и значение $ x_{1} $: как кратного корня полинома $ \Phi (x,y_1) $. Его значение $ x_1 \approx -1.674506 $ принадлежит рассматриваемому интервалу $ ]-2,2[ $ и можно проверить, что при $ x = \pm 2 $ вещественные корни полинома $ \Phi(x_{},y) $ все больше $ y_{1} $.

Ответ. $ \min \approx -1.795011 $.

Задача условного экстремума — поиска минимума или максимума функции $ g(x,y) $ при условии $ f(x,y)=0 $ для полиномиальных $ f $ и $ g $ — рассматривается ЗДЕСЬ.

Вычисление расстояния

Т

Теорема. Квадрат расстояния от точки $ X_{0} \in {\mathbb R}^n $ до квадрики в $ {\mathbb R}^{n} $, заданной уравнением

$$ X^{\top}AX+2B^{\top}X-1=0 \ , (A=A^{\top}) $$ равен минимальному положительному корню полинома $$ {\mathcal F}(z)={\mathcal D}_{\mu} \left(\det \left( \left[ \begin{array}{cc} A & B \\ B^{\top} & -1 \end{array} \right] + \mu \left[ \begin{array}{cc} -E & X_0 \\ X_0^{\top} & z-X_0^{\top}X_0 \end{array} \right] \right) \right) \ , $$ при условиях, что $ X_{0}^{\top}AX_0+2 B^{\top}X_0-1\ne 0 $ и указанный корень не является кратным. Здесь дискриминант рассматривается от полинома по переменной $ \mu_{} $, $ z_{} $ считается числовым параметром, а $ E_{} $ означает единичную матрицу порядка $ n_{} $.

=>

Квадрат расстояния от начала координат $ {\mathbb O} \in {\mathbb R}^{n} $ до поверхности, заданной уравнением

$$ X^{\top}AX+2B^{\top}X-1=0 \ , $$ равен минимальному положительному корню полинома $$ {\mathcal F}(z)={\mathcal D}_{\mu} \left( f(\mu)(\mu z-1)-B^{\top}q(A,\mu)B \right)\ , $$ при условии, что этот корень не является кратным. Здесь $ f(\mu)=\det (A-\mu E)_{} $ — характеристический полином матрицы $ A_{} $, а $ q(A,\mu) $ — матрица взаимная матрице $ A-\mu E_{} $.

В частном случае $ B={\mathbb O}_{} $ (поверхность центрирована к началу координат), имеем (на основании свойства 2 ЗДЕСЬ ): $$ {\mathcal F}(z)=\left[z^nf(1/z) \right]^2{\mathcal D}_{\mu}(f(\mu)) \ , $$ и расстояние до квадратичной поверхности оказывается равным $ 1/\sqrt{\lambda_{\max}^{}} $, где $ \lambda_{\max}^{} $ — максимальное собственное число матрицы $ A_{} $. Получаем проявление известного экстремального свойства собственных чисел симметричной матрицы.

§

Другие приложения дискриминанта в задачах, связанных с вычислением расстояния ЗДЕСЬ

Эквидистанта

Рассмотрим гладкую кривую $ \mathbf K_{} $ на плоскости, в каждой ее точке $ A_{} $ проведем перпендикуляр и возьмем на этом перпендикуляре точки, находящиеся на некотором фиксированном расстоянии $ h_{} $ от точки $ A_{} $. Полученные точки формируют две кривые, каждую из которых назовем эквидистантой кривой $ \mathbf K_{} $ и будем обозначать $ {\mathbf K}_{+h}^{} $ и $ {\mathbf K}_{-h}^{} $.

Т

Теорема. Эквидистанты кривой $ y=f_{}(x) $, где $ f_{}(x) $ – полином с вещественными коэффициентами, задаются уравнением

$$ \Phi(x,y)=0 \ npu \ \Phi(x,y)= {\mathcal D}_{X}\left(\left[X-x \right]^2 + \left[f(X)-y \right]^2-h^2 \right) \ . $$ Здесь дискриминант берется по переменной $ X_{} $, в то время как остальные переменные считаются параметрами.

П

Пример. Найти уравнение эквидистант параболы $ y=x^{2} $.

Решение. После вычисления дискриминанта, отбросим общий множитель его коэффициентов и сгруппируем полученный полином по степеням $ h_{} $: $$ \begin{array}{rcl} \Phi(x,y)&=&{\mathcal D}_{X}\left(X^4+(1-2y)X^2-2\ xX+x^2+y^2-h^2\right)= \\ &=&(16 y^2+16 x^2-8 y+1)(y-x^2)^2 + \\ &+&\left[8(-4y^2-8yx^2-y+1-8 x^4)(y-x^2)- (4 x^2+1)^3 \right]h^2+ \\ &+&8(2y^2+4 y+6 x^2-1)h^4-16 h^6 \ . \end{array} $$ Уравнение $ \Phi(x,y)=0 $ и дает искомые эквидистанты $ {\mathbf K}_{+h}^{} $ и $ {\mathbf K}_{-h}^{} $ для параболы $ y=x^{2} $.На рисунке показаны эквидистанты параболы для $ h=1_{} $

§

Подробнее об эквидистанте ЗДЕСЬ.

Огибающая

Рассмотрим теперь семейство плоских кривых $ \left\{ \mathbf K(\lambda) \right\}_{} $, зависящих от параметра $ \lambda_{} $, принимающего значения из интервала $ [a,b] \in \mathbb R_{} $. Если существует некоторая кривая $ \mathbf L_{} $, которая в каждой своей точке касается некоторой кривой рассматриваемого семейства, но при этом не совпадает ни с одной из них на протяжении какого-либо своего участка, то эта кривая $ \mathbf L_{} $ называется огибающей семейства кривых $ \left\{ \mathbf K(\lambda) \right\}_{} $.

Пусть кривые семейства $ \left\{ \mathbf K(\lambda) \right\}_{} $ заданы уравнением $$ \Psi(x,y,\lambda)=0 \ , $$ где $ \Psi(x,y,\lambda)_{} $ — функция, непрерывно дифференцируемая по своим аргументам. Геометрическое место точек плоскости, удовлетворяющих условиям $$ \Psi(x,y,\lambda)=0,\ \frac{\partial \Psi(x,y,\lambda)}{\partial \lambda} = 0 $$ называется дискриминантной кривой семейства $ \left\{ \mathbf K(\lambda) \right\}_{} $.

Т

Теорема. Дискриминантная кривая семейства включает в себя огибающую этого семейства, а также, возможно, множество особых точек — таких точек, для которых выполняются условия

$$ \frac{\partial \Psi(x,y,\lambda)}{\partial x} = 0,\ \frac{\partial \Psi(x,y,\lambda)}{\partial y} = 0 \ . $$

П

Пример. Найти огибающую семейства эллипсов $$ \frac{x^2}{a^2}+ \frac{y^2}{(1-a)^2}=1 \ npu \ a \in ]0,1[ \ . $$

Решение. Здесь уравнение дискриминантной кривой получается

исключением параметра $ a_{} $ из системы $$ \frac{x^2}{a^2}+ \frac{y^2}{(1-a)^2}=1,\ \frac{x^2}{a^3}-\frac{y^2}{(1-a)^3} = 0 \ . $$ Выражаем из второго уравнения $ a_{} $: $$ a=\frac{x^{2/3}}{x^{2/3}+y^{2/3}} \ , $$ (здесь существенно ограничение $ 0< a_{} < 1 $ из условия) подставляем в первое: $$ x^{2/3}+y^{2/3}=1 \ . $$ Получившаяся кривая называется астроидой.

Удивительно, что ни в одном современном учебнике по геометрии я не нашел связи понятия дискриминантной кривой с понятием дискриминанта — хотя эта связь очевидна:
Т

Теорема. Если функция $ \Psi(x,y,\lambda) $ является полиномом относительно $ \lambda_{} $, то дискриминантная кривая задается уравнением

$$ {\mathcal D}_{\lambda} (\Psi(x,y,\lambda)) = 0 \ . $$ Здесь $ {\mathcal D}_{} $ — дискриминант полинома, рассматриваемого по переменной $ \lambda_{} $, в то время как остальные переменные считаются параметрами.

П

Пример. Если переписать уравнение семейства эллипсов из предыдущего примера в виде

$$ (1-a)^2x^2+a^2y^2-a^2(1-a)^2=0 \quad \iff $$ $$ \iff -a^4+2\,a^3+(x^2+y^2-1)a^2-2\,x^2a+x^2 =0 \ , $$ то применение теоремы даст представление дискриминантной кривой: $$ -16\,x^2y^2((x^2+y^2-1)^3+27\,x^2y^2)=0 \ . $$ Случаи $ x_{}=0 $ или $ y_{}=0 $ соответствуют значениям параметра $ a_{} $, лежащим на границах рассматриваемого интервала. Тот факт, что оставшийся множитель определяет именно астроиду устанавливается с помощью замены переменных $ u_{}=x^{2/3}, v_{}=y^{2/3} $.

П

Пример. Легко проверить, что рассмотренные в предыдущем пункте эквидистанты кривой $ \mathbf K_{} $ являются огибающими семейства окружностей радиуса $ h_{} $ с центрами, расположенными на этой кривой. Для параболы $ Y=X^{2} $ имеем

$$ \Psi(x,y,X)\equiv (x-X)^2+(y-X^2)^2 - h^2 $$ и роль параметра семейства выполняет $ X_{} $:

§

Подробнее об огибающей ЗДЕСЬ.

Дискриминант полинома от нескольких переменных

Дискриминант квадратичной формы

Для квадратичной формы $$ \begin{array}{rllll} F_2(x_1,\dots,x_n)=&a_{11}x_1^2&+2a_{12}x_1x_2&+ \dots & +2a_{1n}x_1x_n+ \\ & &+a_{22}x_2^2 &+ \dots & +2a_{2n}x_2x_n+ \\ & &+\dots &+2a_{jk}x_jx_k & +\dots + \\ & & & &+a_{nn}x_n^2 \end{array} $$ $$ =(x_1,\dots,x_n) \left( \begin{array}{ccccc} a_{11} & a_{12} & a_{13} & \dots & a_{1n} \\ a_{12} & a_{22} & a_{23} & \dots & a_{2n}\\ a_{13} & a_{23} & a_{33} & \dots & a_{3n} \\ \dots & & & & \dots \\ a_{1n} & a_{2n} & a_{3n} & \dots & a_{nn} \end{array} \right) \left( \begin{array}{c} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \end{array} \right) $$ ее дискриминант получается из условия существования нетривиального решения у системы линейных уравнений $$ \partial F_2/ \partial x_1=0,\dots,\partial F_2/ \partial x_n=0 \ . $$ Иными словами, он совпадает с определителем ее (симметричной) матрицы $$ {\mathcal D}(F_2)= \left| \begin{array}{ccccc} a_{11} & a_{12} & a_{13} & \dots & a_{1n} \\ a_{12} & a_{22} & a_{23} & \dots & a_{2n}\\ a_{13} & a_{23} & a_{33} & \dots & a_{3n} \\ \dots & & & & \dots \\ a_{1n} & a_{2n} & a_{3n} & \dots & a_{nn} \end{array} \right| \ . $$

Задачи

Источники

[1]. Калинина Е.А., Утешев А.Ю. Теория исключения: Учеб. пособие. СПб.: НИИ Химии СПбГУ, 2002. 72 с.

[2]. Джури Э. Инноры и устойчивость динамических систем. М.Наука, 1979

[3]. Encyklopädie der Mathematischen Wissenschaften mit Einschluss ihrer Anwendungen. Bd. I. Arithmetik und Algebra. Редактор — Meyer W.F. 1898-1904. Leipzig, Teubner

[4]. Uteshev A.Yu., Cherkasov T.M. The search for the maximum of a polynomial. J. Symbolic Computation. 1998. Vol. 25, № 5. P. 587-618. Текст ЗДЕСЬ (pdf)

[5]. Weber H. Lehrbuch der Algebra. F.Vieweg & Sohn Verlag, Braunschweig, Bd.I.1898

1)
Discriminant (лат.) — различающий, разделяющий; слово дискриминация происходит от discriminatio — различение.
2)
c вероятностью $ 1_{} $
dets/discrim.txt · Последние изменения: 2024/11/29 11:12 — au