Вспомогательная страница к разделу ПОЛИНОМ
Можно ли выразить корни полинома $ f(x)=a_{0}x^n+a_1x^{n-1}+\dots+a_n $ с комплексными коэффициентами $ a_{0},a_1,\dots,a_n $ в виде «хороших» функций от этих коэффициентов? Вспомним, что для корней квадратного уравнения существует общая формула вычисления корней: $$x^2+ax+b=0 \ \Rightarrow \ \lambda_{1,2}=\frac{-a\pm \sqrt{a^2-4b}}{2} \ . $$ Эта формула включает в себя элементарные алгебраические операции $ +,- ,\times, \div $ и операцию извлечения квадратного корня. По аналогии можно сформулировать и общую задачу.
Задача. Найти выражения корней полинома степени $ n > 2 $ в виде функций его коэффициентов; при этом функции должны представлять конечную комбинацию элементарных алгебраических операций и операций извлечения корней произвольных (целых) степеней.
Поставленная задача называется задачей о разрешимости уравнения в радикалах1).
Пример. Уравнение
$$ x^{m}-1=0 \quad \mbox{при} \ m=2^n, n \in \mathbb N $$ разрешимо в радикалах.
Оказывается, что любое уравнение третьей или четвертой степени разрешимо в радикалах. Перед тем, как изложить способы их решения, сделаем два упрощения. Первое из них заключается в том, что уравнение $ f_{}(x)=0 $ делится на старший коэффициент полинома $ f_{}(x) $.
Полином называется нормализованным, если его старший коэффициент равен $ 1_{} $. Операция деления полинома на его старший коэффициент называется нормализацией полинома.
Очевидно, что нормализованный полином имеет те же корни (и в тех же кратностях ), что и исходный. Для простоты обозначений, будем считать, что полином уже нормализован: $$ f(x)=x^n+a_1x^{n-1}+\dots+a_n \, .$$
Второе упрощение заключается в замене переменной (подстановке): $ x=y +\alpha $. Ее результатом будет новый полином той же степени, что и исходный, относительно переменной $ y $: $ F(y)\equiv f(y+\alpha) $. Корни нового полинома связаны (cм. преобразование 2 ☞ ЗДЕСЬ ) с корнями старого по формуле $ \lambda_j = \Lambda_j+\alpha $; так что, найдя корни одного полинома, легко установим и корни другого. Подберем теперь параметр $ \alpha $ так, чтобы обратить в нуль коэффициент при $ y^{n-1} $ в полиноме $ F(y) $. Используя формулу бинома Ньютона, получаем $$ \begin{matrix} f(x)&=&x^n+a_1x^{n-1}+a_2x^{n-2}+\dots+a_n= \\ &=&(y+\alpha)^n +a_1(y+\alpha)^{n-1}+a_2(y+\alpha)^{n-2}+\dots+a_n = \\ &=&y^n + C_n^1 \alpha y^{n-1} +C_n^2 \alpha^2 y^{n-2}+\dots+ \alpha^n + \\ & & \ \qquad + a_1y^{n-1}+a_1 C_{n-1}^1 \alpha y^{n-2}+\dots +a_1\alpha^{n-1} + \\ & & \quad \qquad \qquad +a_2y^{n-2} + \dots + a_n. \end{matrix} $$ Понятно, что если положить $ \alpha= - a_1/n $, то коэффициент при $ y^{n-1} $ исчезнет. Для простоты обозначений будем считать, что полином уже предварительно подвергнут такому преобразованию: $ f(x)=x^n+a_2x^{n-2}+\dots+a_n $.
Рассмотрим уравнение третьей степени: $$ x^3+p\,x+q=0 $$ Сделаем в этом уравнении замену переменной: $ x=u+v $, введя две неизвестные $ u_{} $ и $ v_{} $; получим: $$ u^3+v^3+3\,uv(u+v)+p(u+v)+q=0 \ . $$ Сгруппируем: $$ u^3+v^3+(3\,uv+p)(u+v)+q=0 \ . $$ Подчиним теперь неизвестные $ u_{} $ и $ v_{} $ условию $$ 3\,uv+p=0 \ \iff \ uv=-\frac{p}{3} \ . $$ Тогда предыдущее уравнение приведется к виду $$u^3+v^3=-q \ . $$ Итак, для определения неизвестных величин $ u_{} $ и $ v_{} $ мы получили систему уравнений $$ u^3+v^3=-q,\ uv=-\frac{p}{3} . $$ Возведя последнее уравнение в куб, получим $$ u^3v^3=-\frac{p^3}{27} \ . $$ Два полученных равенства, связывающие $ u^{3} $ и $ v^{3} $, позволяет утверждать, что эти величины являются решениями квадратного уравнения: $$t^2+q\,t- \frac{p^3}{27}=0 \ .$$
Выражение $$ \Delta = \frac{q^2}{4}+\frac{p^3}{27} $$ называется дискриминантом кубического уравнения.
Решив квадратное уравнение, получим: $$ u^3=-\frac{q}{2}+ \sqrt{\Delta},\ v^3=-\frac{q}{2}- \sqrt{\Delta} \ . $$ В итоге имеем формулу для решений уравнения: $$ x=u+v=\sqrt[3]{-\frac{q}{2}+\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}}+ \sqrt[3]{-\frac{q}{2}-\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}} \ ; $$ она называется формулой Кардано.
Исторические заметки об открытии метода решения кубического уравнения ☞ ЗДЕСЬ.
Формула Кардано не очень удобна для практических вычислений. Дело в том, что корень кубический из комплексного числа принимает три различных значения. Решение же, представленное формулой Кардано, имеет в правой части комбинацию из двух кубических корней. Таким образом, получаем 9 всевозможных комбинаций из значений корней кубических. С другой стороны, основная теорема высшей алгебры утверждает, что кубическое уравнение должно иметь только три решения. Для того, чтобы установить соответствие между значениями $ u_{} $ и $ v_{} $, обратимся к условию $ uv=-p/3 $ . Согласно этому условию, задание значений для $ u_{} $ позволит однозначно восстановить $ v_{} $. Пусть $$ u_1=\sqrt[3]{-\frac{q}{2}+\sqrt{\frac{q^2}{4}+\frac{p^3}{27}}} $$ какое-то одно из трех возможных значений корня кубического. Два оставшихся значения корня кубического получаются домножением $ u_1 $ на корни кубические из единицы (см. ☞ ЗДЕСЬ ): $$u_2=u_1\varepsilon_1, \ u_3=u_1\varepsilon_2 $$ при $$\varepsilon_1=\cos \frac{2\pi}{3} + {\mathbf i} \sin \frac{2\pi}{3}= -\frac{1}{2}+ {\mathbf i} \frac{\sqrt{3}}{2} \ u \ \varepsilon_2=\cos \frac{4\pi}{3} + {\mathbf i} \sin \frac{4\pi}{3}= -\frac{1}{2}- {\mathbf i} \frac{ \sqrt{3}}{ 2} \ . $$ Если теперь взять $$ v_1=-\frac{p}{3u_1} \ , $$ то решения кубического уравнения можно выразить в виде комбинаций $ u_1 $ и $ v_1 $: $$ \begin{array}{ccl} \lambda_1&=&u_1+v_1, \\ \lambda_2&=&u_2+v_2=u_2-\frac{\displaystyle p}{\displaystyle 3u_2}=u_1\varepsilon_1-\frac{\displaystyle p}{\displaystyle 3u_1\varepsilon_1} =u_1\varepsilon_1-\frac{\displaystyle p\varepsilon_2}{\displaystyle 3u_1}=u_1\varepsilon_1+v_1\varepsilon_2,\\ \lambda_3&=&u_3+v_3=u_1\varepsilon_2+v_1\varepsilon_1 \ . \end{array} $$ Окончательно получаем формулы для вычисления корней: $$ \left\{ \begin{array}{lcl} \lambda_1&=&u_1+v_1, \\ \lambda_2&=&-\frac{\scriptstyle 1}{\scriptstyle 2}(u_1+v_1) +{\mathbf i} \frac{\scriptstyle \sqrt{3}}{\scriptstyle 2} (u_1-v_1),\\ \lambda_3&=&-\frac{\scriptstyle 1}{\scriptstyle 2}(u_1+v_1) -{\mathbf i} \frac{\scriptstyle \sqrt{3}}{\scriptstyle 2} (u_1-v_1), \end{array} \right. $$ где $ u_{1} $ — одно из значений корня кубического, а $ v_{1} $ связано с ним соотношением $ v_1=-p/(3u_1) $.
Пример [1]. Решить уравнение $ x^3-6{\mathbf i}\,x^2-10\,x+8 {\mathbf i}=0 $.
Решение. Подстановка $ x=y+2 {\mathbf i} $ приводит уравнение к виду $$y^3+2\,y+4{\mathbf i} =0 \ , $$ т.е. $ p=2,\,q=4 {\mathbf i} $. Далее $$\Delta=-\frac{100}{27} \ \Rightarrow \ \sqrt{\Delta} = \pm \frac{10 {\mathbf i}}{3\sqrt{3}} \ \Rightarrow \ u_1=\sqrt[3]{\left(-2 + \frac{10}{3\sqrt{3}} \right){\mathbf i}} \ . $$ Одно из значений последнего корня: $$u_1=-{\mathbf i}\, \sqrt[3]{-2 + \frac{10}{3\sqrt{3}}} \ , $$ это выражение можно упростить, если повезет заметить, что подкоренное выражение равно $ \left(-1+1/{\sqrt{3}}\right)^3 $: $$u_1={\mathbf i}\left(1-\frac{1}{\sqrt{3}}\right)\ \Rightarrow \ v_1=-\frac{p}{3u_1}= {\mathbf i} \left(1+\frac{1}{\sqrt{3}}\right) \ . $$ Получаем: $$\mu_1=2\, {\mathbf i} ,\ \mu_2=1- {\mathbf i},\ \mu_3=-1- {\mathbf i} \ .$$ Значения корней исходного уравнения получатся «сдвигом» на $ 2 {\mathbf i} $.
Ответ. $ 4{\mathbf i},\, 1 + {\mathbf i},\, -1+ {\mathbf i} $.
Пусть коэффициенты $ p^{} $ и $ q^{} $ уравнения $ x^{3}+p\,x+q=0 $ вещественны. Тогда и дискриминант $$ \Delta = \frac{q^2}{4}+\frac{p^3}{27} $$ этого уравнения — тоже вещественное число. В зависимости от знака этого числа, уравнение будет иметь разное число вещественных корней.
I. Пусть $ \Delta>0 $. Тогда $ \sqrt{\Delta} $ является числом вещественным, и мы будем считать его положительным. В формуле для $ u_1=\sqrt[3]{-q/2+\sqrt{\Delta}} $ в качестве значения кубического корня возьмем единственное его вещественное значение: $$ u_1 \in \mathbb R \ \Rightarrow \ v_1 \in \mathbb R \ .$$
Согласно формулам $$ \begin{array}{ccl} \lambda_1&=&u_1+v_1, \\ \lambda_2&=&u_2+v_2=u_2-\frac{\displaystyle p}{\displaystyle 3u_2}=u_1\varepsilon_1-\frac{\displaystyle p}{\displaystyle 3u_1\varepsilon_1} =u_1\varepsilon_1-\frac{\displaystyle p\varepsilon_2}{\displaystyle 3u_1}=u_1\varepsilon_1+v_1\varepsilon_2,\\ \lambda_3&=&u_3+v_3=u_1\varepsilon_2+v_1\varepsilon_1 \ . \end{array} $$ получим: корень $ \lambda_{1} $ уравнения веществен, а $ \lambda_{2} $ и $ \lambda_{3} $ — мнимы и комплексно-сопряжены.
Пример. Решить уравнение $$ x^3-\frac{1}{2} \, x-\frac{1}{2} =0 . $$
Решение. Здесь $$p=-\frac{1}{2},\ q=-\frac{1}{2},\ \Delta=\frac{25}{432},\ u_1=\sqrt[3]{\frac{1}{4}+\frac{5 \sqrt{3}}{36}} \ , \ v_1=\sqrt[3]{\frac{1}{4}-\frac{5 \sqrt{3}}{36}} \ . $$ Единственный вещественный корень должен получаться в виде суммы чисел $ u_{1} $ и $ v_{1} $ — «сильно» иррациональных, судя по внешнему виду. Тем не менее, этот корень очевиден: $ \lambda = 1 $.
Объяснить эту кажущуюся несуразность можно если заметить, что выражения под кубическими корнями в $ u_{1} $ и $ v_{1} $ представимы в виде кубов: $$\frac{1}{4}+\frac{5 \sqrt{3}}{36}=\left(\frac{1}{2} +\frac{\sqrt{3}}{6} \right)^3 ,\quad \frac{1}{4}-\frac{5 \sqrt{3}}{36}=\left(\frac{1}{2} -\frac{\sqrt{3}}{6} \right)^3 \ .$$ Тогда и два оставшихся корня $ -1/2 \pm 1/2 \, \mathbf i $ получаются из общих формул. ♦
II. Пусть $ \Delta=0 $. Формулы для корней дают $$ \lambda_1=2 \sqrt[3]{-q/2} \ , \ \lambda_2= \sqrt[3]{q/2} , \ , \lambda_3= \sqrt[3]{q/2} \ , $$ т.е. уравнение имеет кратный корень кратности $ 2_{} $ если $ q\ne 0 $ и кратности $ 3_{} $ если $ q=0 $.
III. Пусть $ \Delta <0 $. Квадратный корень из этого числа имеет чисто мнимые значения. Если за $ u_{1} $ мы возьмем одно из значений корня кубического из комплексного числа и посчитаем $ v_{1} $ по формуле $ v_1=-p /(3u_1) $, то формулы для корней дадут нам выражения в виде сумм мнимых чисел.
Теорема. В случае $ \Delta <0 $ все корни полинома вещественны и различны.
Доказательство. Пусть $$ u_1= \sqrt[3]{-q/2+\mathbf i\, \sqrt{-\Delta}}= \alpha + \mathbf i\, \beta \ , (\alpha \ne 0, \beta \ne 0) $$ — одно из значений кубического корня. Тогда соответствующее значение для $ v_{1} $ $$v_1=\sqrt[3]{-\frac{q}{2}-\mathbf i \, \sqrt{-\Delta}}= \tilde{\alpha} + \mathbf i\, \tilde{\beta} \ , $$ связанное с $ u_{1} $ соотношением $ u_1v_{1}=-p/3 $ будет числом комплексно-сопряженным к $ u_{1} $. В самом деле: $$ u_1^3=-\frac{q}{2}+\mathbf i\, \sqrt{-\Delta} \ \iff \ \left\{ \begin{array}{rl} \alpha^3-3\, \alpha \beta^2 &= - q/2, \\ 3\, \alpha^2 \beta - \beta^3 &= \sqrt{-\Delta} \end{array} \right. \ , $$ $$ v_1^3=-\frac{q}{2}- \mathbf i\, \sqrt{-\Delta} \ \iff \ \left\{ \begin{array}{rl} \alpha^3-3\, \tilde{\alpha} \tilde{\beta}^2 &= - q/2, \\ 3\, \tilde{\alpha}^2 \tilde{\beta} - \tilde{\beta}^3 &= -\sqrt{-\Delta} \end{array} \right. \ , $$ Поделим друг на друга соответствующие уравнения получившихся систем: $$ \frac{ \beta^3 \left[ \left( \alpha/\beta \right)^3 -3\, \alpha/\beta \right] } { \tilde{\beta}^3\left[ \left(\tilde{\alpha}/\tilde{\beta} \right)^3- 3\, \tilde{\alpha}/{\tilde{\beta}} \right] }=1 \ , \ \frac{ \alpha^3 \left[ 3\, \beta/\alpha - \left(\beta/\alpha \right)^3 \right] } { \tilde{\alpha}^3\left[ 3\, \tilde{\beta}/\tilde{\alpha} - \left(\tilde{\beta}/\tilde{\alpha} \right)^3 \right] }=-1 $$ и упростим их, воспользовавшись соотношением между $ u_{1} $ и $ v_{1} $: $$ u_1v_1=-\frac{p}{3} \in \mathbb R \ \Rightarrow \ \alpha \tilde{\beta} + \tilde{\alpha} \beta = 0 \ \Rightarrow \ \frac{\alpha}{\beta}=- \frac{\tilde{\alpha}}{\tilde{\beta}} \ . $$ Получим $ \tilde{\alpha}=\alpha,\ \tilde{\beta}=-\beta $.
Корни полинома: $$ \left\{ \begin{array}{lcl} \lambda_1&=&u_1+v_1 = 2\, \alpha, \\ \lambda_2&=&-\frac{\scriptstyle 1}{\scriptstyle 2}(u_1+v_1)+ \mathbf i \frac{\scriptstyle \sqrt{3}}{\scriptstyle 2} (u_1-v_1)= -\alpha-\beta \sqrt{3},\\ \lambda_3&=&-\frac{\scriptstyle 1}{\scriptstyle 2}(u_1+v_1) -\mathbf i \frac{\scriptstyle \sqrt{3}}{\scriptstyle 2} (u_1-v_1)= -\alpha+\beta \sqrt{3}, \end{array} \right. $$ все оказываются вещественными.
Очевидно, что $ \lambda_{2} \ne \lambda_3 $. Если $ \lambda_1=\lambda_2 $, то $ \beta=-\alpha \, \sqrt{3} $, и тогда $$u_1=\alpha (1- \mathbf i \sqrt{3}) \ \quad \ u_1^3=-8\, \alpha^3 \in \mathbb R \ ,$$ т.е. $ u_1^3 $ — вещественное число. Простой проверкой устанавливаем, что это невозможно. Таким образом $ \lambda_1\ne \lambda_2 $ и аналогично устанавливаем, что $ \lambda_1\ne \lambda_3 $.
Пример. Решить уравнение $ x^3-15\,x-4=0 $.
Решение. Здесь $ \Delta=-121 $ и $ u_1=\sqrt[3]{2+ 11\, \mathbf i} $. Для того, чтобы получить корни уравнения в виде вещественных чисел, извлечем корень кубический из комплексного числа: $$ \sqrt[3]{2+ 11\, \mathbf i}=\alpha+ \mathbf i\, \beta \ , \ \{\alpha, \beta \} \in \mathbb R \ \iff \ \left\{ \begin{array}{rl} \alpha^3-3\, \alpha \beta^2 &= 2, \\ 3\, \alpha^2 \beta - \beta^3 &= 11 \end{array} \right. \ \Rightarrow \ 4\, \alpha^3-3\, \alpha \sqrt[3]{4+121} - 2 =0 . $$ Один из корней последнего уравнения угадывается: $ \alpha=2 $; подстановка в систему дает значение для $ \beta $: $ \beta=1 $. Итак, $ \sqrt[3]{2+ 11\, \mathbf i}=2 + \mathbf i $ и по формулам получаем: $ \lambda_1=4,\, \lambda_2=-2+\sqrt{3},\, \lambda_3=-2-\sqrt{3} $. ♦
В только что рассмотренном примере формула Кардано позволяет получить вещественные корни полинома — даже если для их выражения приходится иметь дело с мнимыми числами. Попробуем, однако, применить тот же прием ко следующему примеру.
Пример [2]. Решить уравнение $ x^3-3\,x+1=0 $.
Решение. Здесь $ \Delta=-\frac{3}{4} $ и $ u_1=\sqrt[3]{-\frac{1}{2} + \frac{\sqrt{3}}{2}\, \mathbf i} $. $$\sqrt[3]{-\frac{1}{2} + \frac{\sqrt{3}}{2}\, \mathbf i}= \alpha+ \mathbf i\, \beta \ \Rightarrow \ 4\, \alpha^3-3\, \alpha +\frac{1}{2} =0 \ . $$ Умножив последнее уравнение на $ 2_{} $ и сделав в нем замену переменной $ A = 2\alpha $ мы придем к уравнению $$A^3-3\, A +1 =0 \ , $$ т.е. вернемся к исходному уравнению!
Вывод: все корни полинома вещественны, но в радикалах их можно представить только с помощью мнимых чисел. ♦
Как разрешить этот парадокс?
Как получить вещественный вид для корней полинома? На помощь приходит альтернативный алгебраическому способ извлечения корня кубического из комплексного числа: способ, основанный на представлении этого числа в тригонометрической форме.
Теорема. В случае $ \Delta<0 $ вещественные корни полинома $ x^3+p\,x+q $ задаются формулами: $$ \lambda_1= 2\, \sqrt{- \frac{p}3}\cos \frac{\varphi}3 \ , $$ $$ \lambda_2= 2\, \sqrt{- \frac{p}3}\cos \left(\frac{\varphi}3+\frac{2\,\pi}{3} \right) \ , $$ $$ \lambda_3= 2\, \sqrt{-\frac{p}3}\cos \left(\frac{\varphi}3-\frac{2\,\pi}{3} \right) $$ при $$ \varphi=\operatorname{arccos} \left( \frac{3\,q}{2\,p} \sqrt{-\frac{3}p} \right) \ . $$
Доказательство. Если $ \Delta = q^2/4+p^3/27 < 0 $, то, очевидно, $ p<0 $; таким образом, под корнем квадратным в формулах стоит положительное число. Вычисляем тригонометрическую форму для числа, стоящего под знаком кубического корня в выражении для $ u_{1} $: $$-q/2+\mathbf i\, \sqrt{-\Delta} = r(\cos \varphi + \mathbf i\, \sin \varphi) $$ при $$r^2=(q/2)^2-\Delta=-p^3/27 \ , \cos \varphi=\frac{-q/2}{r}=\frac{3\,q}{2\,p} \sqrt{-\frac{3}p} \ . $$ $$ u_1=\sqrt{-\frac{p}{3}}\left(\cos \frac{\varphi}3 + \mathbf i\, \sin \frac{\varphi}3 \right),\ $$ $$ u_2=\sqrt{-\frac{p}{3}}\left(\cos \left( \frac{\varphi}3+\frac{2\,\pi}3\right) + \mathbf i\, \sin \left(\frac{\varphi}3+\frac{2\,\pi}3\right) \right),\ $$ $$ u_3=\sqrt{-\ \frac{p}{3}}\left(\cos \left( \frac{\varphi}3+\frac{4\,\pi}3 \right) + \mathbf i\, \sin \left(\frac{\varphi}3+\frac{4\,\pi}3\right)\right)= $$ $$ =\sqrt{-\ \frac{p}{3}}\left(\cos \left( \frac{\varphi}3-\frac{2\,\pi}3\right) + \mathbf i\, \sin \left(\frac{\varphi}3-\frac{2\,\pi}3\right)\right) \ . $$ Число, стоящее под знаком кубического корня в выражении для $ v_{1} $, является комплексно-сопряженным к только что приведенному: $$-q/2-\mathbf i\, \sqrt{-\Delta} = r(\cos \varphi - \mathbf i\, \sin \varphi) \ . $$ После извлечения кубических корней, значения $ u_{j} $ и $ v_{j} $ должны оставаться комплексно-сопряженными. Для завершения доказательства достаточно использовать формулу $ \lambda_j=u_j+v_j=2\,\mathfrak{Re} (u_j) $. ♦
Пример. Решить уравнение из предыдущего примера: $ x^3-3\,x+1=0 $.
Решение. Здесь $ p=-3, q=1 $ и $ \displaystyle \varphi = \operatorname{arccos} \left(- \frac{1}{2} \right) =\frac{2\,\pi}{3} $.
Ответ. $$ 2 \cos \frac{2\pi}{9} \approx 1.53208 \ ,\quad 2 \cos \frac{8\pi}{9} \approx -1.87938\ , \quad 2 \cos \frac {-4\pi}{9} \approx 0.34729 \ . $$ Проверка может быть выполнена применением формулы приведения для степени косинуса, приведенной ☞ ЗДЕСЬ.
Пример. Решить уравнение $ x^3-6\,x+3=0 $.
Решение. Здесь $ p=-6, q=3 $ и $ \displaystyle \varphi = \operatorname{arccos} \left(- \frac{3}{4\sqrt{2}} \right) \approx 2.1297861 $.
Ответ. $ \approx 2.145103,\ \approx -2.669079,\ \approx 0.523976 $.
рассмотрим в виде: $$ x^4+p\,x^2+q\,x+r=0 , $$ перепишем его в виде $$x^4=-p\,x^2-q\,x-r $$ и прибавим к обеим частям $ x^2t+t^2/4 $, где $ t $ — новая неизвестная: $$ x^4+x^2t+t^2/4=(t-p)\,x^2-q\,x +(t^2/4-r) \ . $$ Левая часть получившегося уравнения является полным квадратом: $$ \left(x^2+t/2 \right)^2 =(t-p)\,x^2-q\,x+(t^2/4-r) \ . $$ Подберем теперь значение $ t $ так, чтобы и правая часть стала полным квадратом.
Теорема. Для того, чтобы квадратный полином $ Ay^2+By+C $ был квадратом полинома первой степени, необходимо и достаточно, чтобы его дискриминант $ B^2-4\,AC $ был равен нулю.
Доказательство. Необходимость. Если $ Ay^2+By+C\equiv (ky+ \ell)^2 $, то $ A=k^2,\, B=2\,k\ell,\, C=\ell^2 $ и тогда очевидно $ B^2-4\,AC=0 $.
Достаточность. $$Ay^2+By+C\equiv Ay^2+By+\frac{B^2}{4A}+C-\frac{B^2}{4A}\equiv \left(\sqrt{A}y+\frac{B}{2\sqrt{A}} \right)^2 +\frac{4\,AC-B^2}{4A} $$ Если дискриминант равен нулю, то правая часть является полным квадратом. ♦
Применяя этот результат к правой части полученного уравнения, находим условие на параметр $ t $, при котором это выражение станет полным квадратом: $$ q^2-4\,(t-p)(t^2/4-r)=0\ \iff \ t^3-p\,t^2-4\,r\,t+(4\,pr-q^2)=0 $$ Это уравнение называется резольвентой Феррари для уравнения $ x^4+p\,x^2+q\,x+r=0 $.
Поскольку резольвента Феррари является уравнением кубическим, то его можно разрешить в радикалах по методу изложенному ВЫШЕ. Обозначим через $ t_1 $ какой-то из его корней. При этом значении $ t $ правая часть уравнения $$ \left(x^2+t/2 \right)^2 =(t-p)\,x^2-q\,x+(t^2/4-r) \ . $$ будет полным квадратом: $$ (t_1-p)\,x^2-q\,x+(t_1^2/4-r) \equiv \left(Kx+L \right)^2 \quad npu \quad \ K= \sqrt{t_1-p},\, L= -\frac{q}{2\sqrt{t_1-p}} \ . $$ Следовательно, уравнение это уравнение приобретает вид: $$ \left(x^2+ t_1/2 \right)^2 = \left(Kx+L \right)^2 $$ и разлагается на два квадратных: $$ x^2+t_1/2 =Kx+L \quad u \quad x^2+t_1/2 =-Kx-L \ . $$ Последние, по их решении, и дают четыре значения корней уравнения четвертой степени.
Если обозначить корни этих квадратных уравнений через $ x_1,x_2 $ и, соответственно, $ x_3,x_4 $, то они будут связаны с корнем $ t_{1} $ резольвенты Феррари равенством $ t_1=x_1x_2+x_3x_4 $. В самом деле, это равенство следует из двух формул Виета:
$$ x_1x_2=t_1/2-L,\, x_3x_4=t_1/2+L \, .$$ Остальные корни резольвенты получаются в результате перестановок $$ t_2=x_1x_3+x_2x_4,\, t_3=x_1x_4+x_2x_3 \, .$$
Пример [2]. Решить уравнение $ x^4+4\,x-1=0 $ .
Решение. Здесь $ p=0,\,q=4,r=-1 $ и резольвента Феррари имеет вид $$t^3+4\,t-16=0 \ .$$ Последнее уравнение имеет корень $ t_1=2 $. Следовательно, исходное уравнение можно переписать в виде: $$ (x^2+1)^2 =\left(\sqrt{2}x- \sqrt{2}\right)^2 \ . $$ Оно распадается на два квадратных: $$ x^2+1=\sqrt{2}\, x- \sqrt{2} \ u \ x^2+1=-\sqrt{2}\, x + \sqrt{2} \ . $$
Ответ. $ \frac{1\pm \mathbf i \, \sqrt{\sqrt{8}+1 }}{\sqrt{2}},\ \frac{-1\pm \, \sqrt{\sqrt{8}-1 }}{\sqrt{2}} $.
Успех, достигнутый в решении уравнений третьей и четвертой степени побудил исследователей искать подобные формулы для уравнений высших степеней. Методология подхода была очевидна: свести решение уравнения $ n_{} $-й степени к решению уравнения $ (n-1)_{} $-й степени. Одну из возможных вариаций этого подхода поясним на примере.
Пример. Решить уравнение $ x^3+6\,x-2=0 $.
Решение. Обозначим неизвестные корни полинома $ f(x)=x^3+6\,x-2 $ через $ \lambda_1,\lambda_2, \lambda_3 $. Построим полином $ F_{}(y) $, корнями которого являются величины $$ \mu_j=\lambda_j^2+2\, \lambda_j+4 . $$ Выражение $$F(y)= (y-\mu_1)(y-\mu_2)(y-\mu_3)$$ является симметрическим полиномом относительно $ \lambda_1,\lambda_2 $ и $ \lambda_{3} $. Следовательно, по теореме Гаусса о симметрических полиномах, коэффициенты $ F_{}(y) $ должны полиномиально выражаться через коэффициенты $ f_{}(x) $, т.е. быть числами целыми. Опуская промежуточные выкладки, приведем окончательный результат: $$F(y)\equiv y^3-108 .$$ Корни этого полинома легко определить: $$ \mu_1=3\sqrt[3]{4},\ \mu_2= 3\sqrt[3]{4} \left(-\frac{1}{2} +\mathbf i \frac{\sqrt{3}}{2} \right),\ \mu_3= 3\sqrt[3]{4}\left(-\frac{1}{2} -\mathbf i \frac{\sqrt{3}}{2} \right) \ . $$ Теперь находим $ \lambda_{j} $ из квадратных уравнений $$\sqrt[3]{4} - \sqrt[3]{2},\ -2-\sqrt[3]{4} + \sqrt[3]{2},\ $$ $$ \frac{1}{2}\left(-\sqrt[3]{4} + \sqrt[3]{2}\right) + \mathbf i \frac{\sqrt{3}}{2} \left(\sqrt[3]{4} + \sqrt[3]{2}\right),\ -2 + \frac{1}{2}\left(\sqrt[3]{4} - \sqrt[3]{2}\right) - \mathbf i \frac{\sqrt{3}}{2} \left(\sqrt[3]{4} + \sqrt[3]{2}\right),\ $$ $$ \frac{1}{2}\left(-\sqrt[3]{4} + \sqrt[3]{2}\right) - \mathbf i \frac{\sqrt{3}}{2} \left(\sqrt[3]{4} + \sqrt[3]{2}\right),\ -2 + \frac{1}{2}\left(\sqrt[3]{4} - \sqrt[3]{2}\right) + \mathbf i \frac{\sqrt{3}}{2} \left(\sqrt[3]{4} + \sqrt[3]{2}\right). $$ Подстановкой в исходное уравнение выделяем истинные его корни.
Ответ. $ \sqrt[3]{4} - \sqrt[3]{2},\, \frac{\scriptstyle 1}{\scriptstyle 2}\left(-\sqrt[3]{4} + \sqrt[3]{2}\right) \pm \mathbf i \frac{\scriptstyle \sqrt{3}}{\scriptstyle 2} \left(\sqrt[3]{4} + \sqrt[3]{2}\right) $.
Подобное преобразование полинома $ f_{}(x) $ в полином $ F_{}(y) $ той же степени, имеющий корнями числа $ g(\lambda_1),\dots, g(\lambda_n) $ при произвольном полиноме $ g(x)\in \mathbb A[x] $, называется преобразованием Чирнгауза.
Биографические заметки о Чирнгаузе ☞ ЗДЕСЬ.
Задача. Найти такое преобразование Чирнгауза, которое преобразует исходный полином к виду $ y^n-a $. Корни последнего, очевидно, выражаются в радикалах. Если при этом, $ \deg g < n $, то мы сведем решение уравнения $ n_{} $-й степени к уравнению меньшей степени.
Поставленная задача разбивается на две подзадачи:
Первая подзадача достаточно конструктивно решается применением результанта.
Теорема. Существует единственный нормализованный полином $ F_{}(y) $ степени $ n_{} $, решающий задачу:
$$ F(y)\equiv {\mathcal R}_{x}(f(x),y-g(x))/a_0^m \ ; $$ здесь результант рассматривается для полиномов относительно переменной $ x_{} $. Коэффициенты $ F_{}(y) $ рационально зависят от коэффициентов $ f_{}(x) $ и $ g_{}(x) $.
Результант имеет разные детерминантные представления, поэтому и полином $ F_{}(y) $ можно представлять в виде различных определителей.
Пример. Найти преобразование Чирнгауза $ y=x^2+x-1 $ полинома $ f(x)=x^3-2\,x+3 $.
Решение. Если результант вычислять с помощью представления Сильвестра, то получим: $$ F(y)={\mathcal R}(x^3-2\,x+3,\ -x^2-x+(1+y))= $$ $$ =-\left| \begin{array}{rrccc} 1 & 0 & -2 & 3 & 0 \\ 0 & 1 & 0 & -2 & 3 \\ 0 & 0 & -1 & -1 & 1+y \\ 0 & -1 & -1 & 1+y & 0 \\ -1 & -1 & 1+y & 0 & 0 \end{array}\right| =y^3-y^2+6y-4 \ . $$ ♦
Следующий способ нахождения преобразования Чирнгауза является развитием метода Безу вычисления результанта.
Найдем остатки от деления $ x^kg(x) $ на $ f_{}(x) $ $$ g_k(x) = b_{k0}+b_{k1}x+\dots +b_{k,n-2}x^{n-2}+b_{k,n-1}x^{n-1} \quad npu \quad k\in\{0,1,\dots,n-1\} $$ (здесь изменен порядок нумерации коэффициентов по сравнению с тем, что указан при изложении ☞ метода Безу ) и составим матрицу из коэффициентов: $$ B=[b_{kj}]_{k,j=0}^{n-1} \ . $$
Теорема [Эрмит]. Имеем:
$$F(y)=(-1)^{n}\det (B - yE)=(-1)^n\left| \begin{array}{ccccc} b_{00}-y & b_{01} & b_{02} & \dots & b_{0,n-1} \\ b_{1,0} & b_{1,1}-y & b_{1,2} & \dots & b_{1,n-1} \\ \dots & & & & \dots \\ b_{n-1,0} &b_{n-1,1} & b_{n-1,2} & \dots & b_{n-1,n-1}-y \end{array}\right| \ . $$
Доказательство. Равенства $$y=g(x),\, xy=g(x)x,\, \dots, x^{n-1}y=g(x)x^{n-1} \ ,$$ при подстановке корня $ \lambda_j $ полинома $ f(x) $ переходят в $$y=g_0(\lambda_j),\,\lambda_jy=g_1(\lambda_j),\dots, \lambda_j^{n-1}y=g_{n-1}(\lambda_j) \ .$$ Рассмотрим получившиеся уравнения как линейную однородную систему относительно столбца неизвестных $$X=[1,\lambda_j,\dots,\lambda_j^{n-1}]^{\top} \ . $$ Поскольку эта система имеет нетривиальное решение, то (на основании следствия к теореме Кронекера-Капелли ) определитель ее матрицы должен обращаться в нуль. ♦
Пример. Решить предыдущий пример по методу Эрмита.
Решение. Имеем $$g_0(x)\equiv g(x)=-1+x+x^2, \ g_1(x)=-3+x+x^2, \ g_2(x)=-3-x+x^2 $$ и, следовательно, $$F(y)=(-1)^3\left| \begin{array}{ccc} -1-y & 1 & 1 \\ -3 & 1-y & 1 \\ -3 & -1 & 1-y \end{array}\right|=y^3-y^2+6\,y-4 \ . $$
♦
Будем решать теперь вторую из сформулированных выше подзадач: подобрать преобразование Чирнгауза таким образом, чтобы обнулить как можно большее число коэффициентов у полинома $ F_{}(y) $.
Пример. Для полинома $ f(x)=x^3+a_1x^2+a_2x+a_3 \in \mathbb C[x] $ подобрать преобразование Чирнгауза вида $ y=x^2+b_1x+b_2\in \mathbb C[x] $ так, чтобы получившийся в результате преобразования полином имел вид $ F(y)=y^3+c_3 $.
Решение. Преобразование Чирнгауза при первоначально неопределенных $ b_1 $ и $ b_2 $ дает: $$F(y)=y^3+c_1y^2+c_2y+c_3 $$ при4) $$ \begin{array}{ccl} c_1&=&-a_1^2+2\,a_2+a_1b_1-3\,b_2 \ , \\ c_2&=&-a_1a_2b_1+a_2b_1^2-2\,a_1a_3+a_2^2-4\,a_2b_2+3\,a_3b_1+2\,a_1^2b_2 -2\,a_1b_1b_2+3\,b_2^2 \ , \\ c_3&=&a_1b_1b_2^2-a_1^2b_2^2+a_1a_2b_1b_2+a_2a_3b_1-a_3^2+2\,a_2b_2^2 + \\ & &+a_3b_1^3-a_2b_1^2b_2-a_1a_3b_1^2+2\,a_1a_3b_2-b_2^3 -3\,a_3b_1b_2-a_2^2b_2 \ . \end{array} $$ Требуется подобрать $ b_1 $ и $ b_2 $ так, чтобы коэффициенты $ c_1 $ и $ c_2 $ обратились в нуль. Получаем систему из двух уравнений относительно $ b_1 $ и $ b_2 $: первое из них — линейное, второе — квадратное. Эта система разрешима в радикалах: $$ b_1=\frac{2\,a_1^3-7\,a_1a_2 +9\,a_3 \pm \sqrt{-3 {\mathcal D}(f)} }{2(a_1^2-3\,a_2)} $$ а $ b_2 $ выражается через $ b_1 $ по формуле $$ b_2=\frac{1}{3}(a_1b_1-a_1^2+2\,a_2) \ . $$ Здесь $$ {\mathcal D}(f)=a_1^2a_2^2-4a_1^3a_3-4\,a_0a_2^3+18\,a_0a_1a_2a_3-27\,a_0^2a_3^2 \, , $$ т.е. является дискриминантом кубического полинома; предполагается также, что $ a_1^2-3\,a_2\ne 0 $. Итак, преобразование Чирнгауза при указанных значениях параметров $ b_1 $ и $ b_2 $ дает полином $ y^3+c_3 $ (в приведенное выше выражение для $ c_3 $ также следует подставить полученные выражения для $ b_1 $ и $ b_2 $). ♦
Найти преобразование Чирнгауза, позволяющее решить в радикалах уравнение $ x^3+a_1x^2+\frac{1}{3}\, a_1^2x+a_3=0 $.
Следующий результат не имеет непосредственного отношения к задаче настоящего раздела, но куда-то надо было поместить. Каноническое представление полинома в виде разложения по степеням переменной не всегда бывает стартовой точкой в прикладных задачах. В частности, задача вычисления характеристического полинома матрицы является достаточно трудоемкой. Но вот оказывается, что вычисление преобразования Чирнгауза для такого полинома удается свести к задаче вычисления характеристического полинома матрицы того же порядка, что и исходная.
Теорема. Пусть $ A $ — квадратная матрица порядка $ n $, $ E $ — единичная матрица того же порядка и $ f(x)=\det (A-xE) $ — характеристический полином матрицы $ A $. Тогда преобразование Чирнгауза $ y=g(x) $ полинома $ f(x) $ представимо в виде
$$ F(y)=\det (g(A)-yE) \, . $$
Доказательство следует из теоремы 7 ☞ ЗДЕСЬ.
Успех достигнутый в решении уравнений третьей и четвертой степени побудил исследователей искать подобные формулы для уравнений высших степеней. Методология подхода очевидна из предыдущих пунктов: свести решение уравнения $ n_{} $-й степени к решению уравнения $ (n-1) $-й степени. Однако, несмотря на почти трехвековые усилия лучших математиков мира, решить уравнение пятой степени не удавалось. Наконец, в начале XIX века был получен отрицательный результат.
Теорема [Руффини, Абель]. Уравнение степени выше четвертой в общем случае неразрешимо в радикалах.
Пример. Уравнение $ x^5-4\, x -2=0 $ неразрешимо в радикалах.
Установить разрешимо или нет данное конкретное уравнение в радикалах возможно с помощью теории, развитой французским математиком Галуа.
Пример. Уравнение $ x^5+x+1=0 $ разрешимо в радикалах, поскольку $ x^5+x+1\equiv (x^2+x+1)(x^3-x^2+1) $.
Отрицательный характер результата теоремы Руффини-Абеля не должен слишком уж разочаровывать. Он означает только лишь то, что корни полинома нельзя представить в виде формулы, состоящей из конечного набора сравнительно простых функций. Тем не менее, если расширить класс допустимых в формуле функций (или допустить бесконечность числа операций), представление для корня можно найти. Cм., к примеру,
Наконец, для практических задач часто более важна не столько «красивая» аналитическая формула для корня, сколько приближенное его значение с требуемой точностью.
☞ ЗДЕСЬ.
[1]. Журавский А.М. Сборник задач по высшей алгебре. М.-Л.ГТТИ. 1933
[2]. Uspensky J.V. Theory of Equations. New York. McGraw-Hill. 1948
[3]. Калинина Е.А., Утешев А.Ю. Теория исключения: Учеб. пособие. СПб.: НИИ Химии СПбГУ, 2002. 72 с.