Инструменты сайта


§

Вспомогательная страница к разделам ОПРЕДЕЛИТЕЛЬ и ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ

Матрица Якоби и якобиан

В настоящем разделе аргументы и значения рассматриваемых функций предполагаются вещественными.

Определение и основные свойства

Матрицей Якоби системы из $ m_{} $ функций $ \{f_1(x_1,\dots,x_n),\dots,f_m(x_{1},\dots,x_n)\} $ по переменным $ x_{1},\dots,x_n $ называется матрица, составленная из всевозможных частных производных: $$ \mathbf J = \left[ \frac{\partial f_j}{\partial x_k} \right]_{j=1,\dots,m, \atop k=1,\dots,n} = \left( \begin{array}{cccc} {\partial f_1}/{\partial x_1} & {\partial f_1}/{\partial x_2} & \dots & {\partial f_1}/{\partial x_n} \\ {\partial f_2}/{\partial x_1} & {\partial f_2}/{\partial x_2} & \dots & {\partial f_2}/{\partial x_n} \\ \dots & && \dots \\ {\partial f_m}/{\partial x_1} & {\partial f_m}/{\partial x_2} & \dots & {\partial f_m}/{\partial x_n} \end{array} \right) \, . $$ В частном случае $ m_{}=1 $ матрица Якоби состоит из одной строки: этот вектор в $ \mathbb R_{}^{n} $ или $ \mathbb C^{n} $ называется градиентом функции $ f_{} $ (в точке $ (x_1,\dots,x_{n}) $): $$ \operatorname{grad} (f) = \left( \frac{\partial f}{\partial x_1},\dots, \frac{\partial f}{\partial x_n} \right) \ . $$

П

Пример. Для системы линейных функций

$$f_1=a_{11}x_1+\dots+a_{1n}x_n - b_1,\dots, f_m=a_{m1}x_1+\dots+a_{mn}x_n - b_m $$ матрица Якоби будет матрицей коэффициентов при переменных: $$ \mathbf J = \left(\begin{array}{cccc} a_{11} & a_{12} & \dots & a_{1n} \\ \dots & && \dots \\ a_{m1} & a_{m2} & \dots & a_{mn} \end{array} \right) . $$

Откуда возникает матрица Якоби? – Фактически оттуда же, откуда возникает обычная производная: из необходимости исследовать поведение произвольной нелинейной функции. Что делают при исследовании функции одной переменной $ y=f_{}(x) $? — Для нее выписывают формулу Тейлора и в этой формуле $$ f(x) = f(x_0)+f'(x_0)(x-x_0)+\dots $$ оставляют только два первых слагаемых, чтобы нелинейную функцию подменить линейной. Геометрически: график произвольной функции заменяют на график его касательной, и считают, что эти два графика ведут себя почти одинаково — по крайней мере, локально — в окрестности точки $ x_{0} $. То же самое делается и при исследовании функций нескольких переменных. Пусть, например, задано отображение $$ x=f_1(u,v),\ y=f_2(u,v), z=f_3(u,v) $$ некоторой области пространства $ \mathbb{R}^{2} $ в пространство $ \mathbb{R}^{3} $. Это отображение можно геометрически интерпретировать, как задание некоторой поверхности в $ \mathbb{R}^{3} $ параметрически (задание параметров $ u_{} $ и $ v_{} $ однозначно определяет точку $ (x_{},y,z) $ поверхности). Если функции $ f_{j} $ нелинейные, то исследовать поведение такого отображения начинают с его линейного приближения: выписывают для этих функций формулы Тейлора $$ f_j(u,v)=f_j(u_0,v_0) + \frac{\partial f}{\partial u} (u-u_0) + \frac{\partial f}{\partial v} (v-v_0)+\dots $$ (частные производные вычисляются в точке $ (u_{0},v_0) $) и отбрасывают нелинейные по $ u-u_0 $ и $ v-v_0 $ слагаемые. Полученное отображение пространства $ \mathbb{R}^{2} $ в пространство $ \mathbb{R}^{3} $, по его виду, можно было бы назвать линейным, но в алгебре выражение линейное отображение закреплено за более узким классом отображений, а настоящее относится к классу аффинных: $$ \left(\begin{array}{c} x \\ y \\ z \end{array} \right) = \left(\begin{array}{c} x_0 \\ y_0 \\ z_0 \end{array} \right) + \left( \begin{array}{cc} \partial f_1/ \partial u & \partial f_1/ \partial v \\ \partial f_2/ \partial u & \partial f_2/ \partial v \\ \partial f_3/ \partial u & \partial f_3/ \partial v \end{array} \right) \left(\begin{array}{c} u-u_0 \\ v-v_0 \end{array} \right) \ \mbox{ при } \ \left(\begin{array}{c} x_0 \\ y_0 \\ z_0 \end{array} \right)= \left(\begin{array}{c} f_1(u_0,v_0) \\ f_2(u_0,v_0) \\ f_3(u_0,v_0) \end{array} \right) \ . $$ Геометрически: график параметрически заданной поверхности заменяют на график ее касательной плоскости и считают, что эти два графика ведут себя почти одинаково — по крайней мере, локально,— в окрестности точки $ (x_0,y_0,z_0) $.

В частном случае $ m=n_{} $ матрица Якоби становится квадратной и тогда ее определитель называется якобианом или определителем Якоби или функциональным определителем системы из $ n_{} $ функций $ \{f_1(x_1,\dots,x_n),\dots,f_{n}(x_1,\dots,x_n)\} $ по переменным $ x_{1},\dots,x_n $: $$ {\mathfrak J}=\frac{D(f_1,f_2,\dots,f_n)}{D(x_1,x_2,\dots,x_n)}= \left| \begin{array}{cccc} {\partial f_1}/{\partial x_1} & {\partial f_1}/{\partial x_2} & \dots & {\partial f_1}/{\partial x_n} \\ {\partial f_2}/{\partial x_1} & {\partial f_2}/{\partial x_2} & \dots & {\partial f_2}/{\partial x_n} \\ \dots & && \dots \\ {\partial f_n}/{\partial x_1} & {\partial f_n}/{\partial x_2} & \dots & {\partial f_n}/{\partial x_n} \end{array} \right|= \det \left[ \frac{\partial f_j}{\partial x_k} \right]_{j,k=1}^n \ . $$ В этом же случае след матрицы Якоби называется дивергенцией вектора $ (f_1,f_2,\dots,f_n) $: $$ \operatorname{div} (f_1,f_2,\dots,f_n)= {\partial f_1}/{\partial x_1}+ {\partial f_2}/{\partial x_2}+\dots+ {\partial f_n}/{\partial x_n} \ . $$

В англоязычной литературе термин Jacobian часто относится и к матрице Якоби.
Т

Теорема [Якоби]. Если $ A_{j1},\dots,A_{jn} $ — алгебраические дополнения элементов $ j_{} $-й строки якобиана, то $$ \frac{\partial A_{j1}}{\partial x_1}+\frac{\partial A_{j2}}{\partial x_2}+ \dots+\frac{\partial A_{jn}}{\partial x_n} \equiv 0 \, . $$ Предполагается, что производные, входящие в левую часть тождества, существуют.

Функциональная зависимость

Следующая теорема и ее следствия являются прямыми обобщениями соответствующих результатов из линейной алгебры.

Т

Теорема. Якобиан системы функций $ \{ f_{1},f_2,\dots,f_n \} $ тождественно равен нулю в некоторой области $ \mathbb{S}_{} $: $$ \frac{D(f_1,f_2,\dots,f_n)}{D(x_1,x_2,\dots,x_n)} \equiv 0 \mbox{ } \ \mbox{при} \mbox{ } X \in \mathbb{S} $$ тогда и только тогда, когда между этими функциями имеется функциональная зависимость в $ \mathbb{S} $, т.е. существует функция $ G(y_1,y_2,\dots,y_n) \not\equiv 0 $ такая, что $$ G(f_1(X),f_2(X),\dots,f_n(X))\equiv 0 \mbox{ } \mbox{при} \mbox{ } X \in \mathbb{S} \ . $$

В частном случае, когда в качестве $ G(y_1,y_2,\dots,y_n) $ можно выбрать линейный однородный полином $ G(y_1,y_2,\dots,y_n)=a_1y_1+a_2y_2+\dots+a_n y_n $, говорят о линейной зависимости.

Приведем соображения, показывающие необходимость обращения якобиана в нуль для существования функциональной зависимости в системе функций $ \{ f_j \} $. Дополнительно предположим, что у функции $ G $ существуют частные производные по ее аргументам. Продифференцируем тождество $ G(f_1(X),f_2(X),\dots,f_n(X))\equiv 0 $ по $ x_1,\dots,x_n $. Получим систему тождеств $$ \left\{\begin{array}{cccc} \frac{\partial G}{\partial y_1} \frac{\partial f_1}{\partial x_1}+ & \frac{\partial G}{\partial y_2} \frac{\partial f_2}{\partial x_1}+ &\dots + \frac{\partial G}{\partial y_n} \frac{\partial f_n}{\partial x_1} & \equiv 0, \\ \dots & & & \dots \\ \frac{\partial G}{\partial y_1} \frac{\partial f_1}{\partial x_n}+ & \frac{\partial G}{\partial y_2} \frac{\partial f_2}{\partial x_n}+ &\dots + \frac{\partial G}{\partial y_n} \frac{\partial f_n}{\partial x_n} & \equiv 0; \end{array} \right. $$ здесь после вычисления производных $ \{\partial G / \partial y_j \} $ следует произвести подстановку $ y_1=f_1(X),\dots,y_n=f_n(X) $. Получившуюся систему можно рассматривать как линейную однородную относительно этих последних выражений. Хотя бы одна из них не должна быть тождественно нулевой (в противном случае функция $ G $ не содержала бы ни одной функции $ f_j $). Но тогда для совместности системы необходимо, чтобы ее определитель был равен нулю. Этот определитель, с точностью до транспонирования, совпадает с якобианом.

П

Пример. Являются ли полиномы

$$ f_1=x_1+x_2+x_3-1,\quad f_2=x_1x_2+x_1x_3+x_2x_3-2,\quad f_3=x_1^2+x_2^2+x_3^2+3 $$ функционально зависимыми?

Решение. $$ \frac{D(f_1,f_2,f_3)}{D(x_1,x_2,x_3)}= $$ $$ = \left| \begin{array}{ccc} 1 & 1 & 1 \\ x_2+x_3 & x_1+x_3 & x_1+x_2 \\ 2x_1 & 2x_2 & 2x_3 \end{array} \right| = 2 \left| \begin{array}{ccc} 1 & 1 & 1 \\ x_2+x_3 & x_1+x_3 & x_1+x_2 \\ x_1 & x_2 & x_3 \end{array} \right|= $$ $$ = \left| \begin{array}{ccc} 1 & 1 & 1 \\ x_1+x_2+x_3 & x_1+x_2+x_3 & x_1+x_2+x_3 \\ x_1 & x_2 & x_3 \end{array} \right|\equiv 0 $$ (мы воспользовались здесь свойствами 4 и 5 определителя, выписанными ЗДЕСЬ ). Ответ оказывается положительным: рассматриваемые полиномы являются функционально зависимыми. В данном примере эта зависимость сравнительно просто «отлавливается» наметанным взглядом: $$(f_1+1)^2-2(f_2+2)-(f_3-3) \equiv 0 \ . $$

В общем же случае установление конкретной «обнуляющей» формулы $$ G(f_1(X),f_2(X),\dots,f_n(X))\equiv 0 $$ представляет собой отдельную и, как правило, непростую задачу.
=>

Если какие-то $ \mathfrak r $ функций системы $ \{ f_{1}, \dots, f_n \} $ связаны в $ \mathbb{S} $ функциональным соотношением $$ H(f_{j_1}, \dots f_{j_{\mathfrak r}}) \equiv 0 \ , $$ то любой минор порядка $ \mathfrak r $ якобиана, выбранный из соответствующих строк, будет тождественно равен нулю в $ \mathbb{S}_{} $.

=>

Пусть $ \mathfrak r_{} $ обозначает ранг матрицы Якоби системы функций $ \{f_1,\dots,f_{m} \} $ по переменным $ x_{1},\dots,x_n $. Если минор этой матрицы

$$ \frac{D(f_1,\dots,f_{\mathfrak r})}{D(x_1,\dots,x_\mathfrak r)} $$ отличен от нуля в $ \mathbb{S}_{} $, то функции $ f_1,\dots,f_{\mathfrak r} $ функционально независимы в $ \mathbb{S} $, а все оставшиеся функции системы (при условии $ \mathfrak r < m $) могут быть выражены в виде (сложных) функций от этих независимых: $$ f_{\mathfrak r+1}(x_1,\dots,x_n) \equiv G_{\mathfrak r+1}(f_1,\dots,f_{\mathfrak r}),\dots, f_{m}(x_1,\dots,x_n) \equiv G_m(f_1,\dots,f_{\mathfrak r}) \ . $$

Якобиан обладает свойствами, аналогичными свойствам обычной производной для функции одной переменной. Так, следующие результаты являются аналогами правил дифференцирования сложной, обратной и неявной функций.

Т

Теорема. Якобиан системы сложных функций

$$ F_1(x_1,\dots,x_n)=f_1(y_1(x_1,\dots,x_n),\dots,y_n(x_1,\dots,x_n)),\dots,$$ $$ F_n(x_1,\dots,x_n)=f_n(y_1(x_1,\dots,x_n),\dots,y_n(x_1,\dots,x_n)) $$ вычисляется по правилу умножения: $$ \frac{D(F_1,\dots,F_n)}{D(x_1,\dots,x_n)}= \frac{D(f_1,\dots,f_n)}{D(y_1,\dots,y_n)}\cdot \frac{D(y_1,\dots,y_n)}{D(x_1,\dots,x_n)} \ . $$ где производные вычислены в соответствующих точках.

П

Пример [1]. Вычислить якобиан элементарных симметрических полиномов:

$$ f_1=\sum_{1 \le j\le n} x_j = x_1+ \dots+ x_n, $$ $$ f_2=\sum_{1\le j_1<j_2\le n} x_{j_1} x_{j_2}= x_1 x_2 + x_1 x_3 +\dots + x_2 x_3 + \dots+ x_{n-1}x_n, $$ $$ f_3=\sum_{1\le j_1<j_2<j_3\le n} x_{j_1} x_{j_2}x_{j_3}= x_1 x_2 x_3+ x_1 x_2 x_4 + \dots+ x_{n-2} x_{n-1} x_n, $$ $$ \dots $$ $$ f_{n-1}=x_{1} x_{2}\times \dots \times x_{n-1} + x_{1} x_{2} \times \dots \times x_{n-2} x_n + \dots + x_{2} x_{3}\times \dots \times x_n, $$ $$ f_n= x_{1} x_{2}\times \dots \times x_{n} .$$

Решение. Воспользуемся следствием к теореме Варинга. Составим набор новых симметрических полиномов: $$ \{ s_1,\dots,s_n \} \quad npu \quad s_j=x_1^j+x_2^j+\dots+x_n^j \ . $$ Из формул Варинга следует, что $ s_j $ выражаются через $ f_1,\dots,f_j $ по формулам $$ s_j\equiv \Psi(f_1,\dots,f_{j-1}) + j f_j \quad npu \quad j \in \{1,\dots,n \} \ . $$ Воспользуемся теоремой: $$ \frac{D(s_1,\dots,s_n)}{D(x_1,\dots,x_n)} \equiv \frac{D(s_1,\dots,s_n)}{D(f_1,\dots,f_n)}\cdot \frac{D(f_1,\dots,f_n)}{D(x_1,\dots,x_n)} \ ; $$ искомый якобиан определится из этой формулы если мы вычислим два других. Определитель $$ \frac{D(s_1,\dots,s_n)}{D(f_1,\dots,f_n)} $$ является определителем треугольной матрицы: $$ \frac{D(s_1,\dots,s_n)}{D(f_1,\dots,f_n)}= \left| \begin{array}{ccccc} 1 & 0 & 0 & \dots & 0 \\ \ast & 2 & 0 & \dots & 0 \\ \ast & \ast & 3 & \dots & 0 \\ \vdots & & & \ddots & \vdots \\ \ast & \ast & \ast & \dots & n \end{array} \right| \ , $$ а определитель $$ \frac{D(s_1,\dots,s_n)}{D(x_1,\dots,x_n)}= \left| \begin{array}{cccc} 1 & 1 & \dots & 1 \\ 2x_1 & 2x_2 & \dots & 2x_n \\ 3x_1^2 & 3x_2^2 & \dots & 3x_n^2 \\ \vdots & & & \vdots \\ nx_1^{n-1} & nx_2^{n-1} & \dots & nx_n^{n-1} \end{array} \right|= n! \left| \begin{array}{cccc} 1 & 1 & \dots & 1 \\ x_1 & x_2 & \dots & x_n \\ x_1^2 & x_2^2 & \dots & x_n^2 \\ \vdots & & & \vdots \\ x_1^{n-1} & x_2^{n-1} & \dots & x_n^{n-1} \end{array} \right| $$ вычисляется как определитель Вандермонда.

Ответ. $ \displaystyle \prod_{1\le j < k \le n} (x_k-x_j) $.

Замена переменных и обратное отображение

Условие существования функции, обратной к $ y=f(x) $, т.е. функции $ \varphi $ такой, что $ \varphi(f(x))\equiv x $ (или, эквивалентно, $ f(\varphi(y)) \equiv y $), формулируются в математическом анализе.

Т

Теорема. Если $ f(x) $ является непрерывно дифференцируемой функцией в некоторой окрестности точки $ x_0 $ и $ f^{\prime} (x_0) \ne 0 $, то существует окрестность точки $ y_0=f(x_0) $, в которой однозначно определяется обратная функция $ \varphi $ такая, что

$$ f(\varphi(y)) \equiv y,\ \varphi(y_0)=x_0 \, . $$ В этой окрестности функция $ \varphi $ будет непрерывно дифференцируемой и выполняется равенство $$ \varphi^{\prime} (y) = \frac{1}{f^{\prime} (x)} $$ для значений $ x $ и $ y $, связанных равенством $ y=f(x) $.

Конструктивных аналитических способов нахождения функции, обратной к заданной $ y=f(x) $ можно сказать, что и нет. Задача сводится к разрешению этого уравнения относительно $ x $. Однако уже для полиномиальных $ f(x) $ решение такого уравнения в «хороших» функциях, т.е. в радикалах, возможно, в общем случае, только для $ \deg f<5 $. Тем не менее, можно поставить задачу об аппроксимации обратной функции, например, с помощью степенных рядов. Составим формальный ряд $$ \varphi(y)=B_0+B_1(y-y_0) + B_2(y-y_0)^2+ \dots + B_k(y-y_0)^k+ \dots $$ Для значения $ y_0 $ из теоремы получаем два коэффициента этого ряда $$ B_0=x_0, B_1= 1/f^{\prime} (x_0) \, . $$ Как получить следующий коэффициент $ B_2 $? Заметим, что если бы у обратной функции существовала бы вторая производная, то $ B_2 $ был бы следующим коэффициентом ряда Тейлора: $ B_2 = \varphi^{\prime \prime}(y_0)/2 $. Для получения выражения $ \varphi^{\prime \prime}(y_0) $ продифференцируем по $ y $ тождество $ f(\varphi(y)) \equiv y $. Тождество останется справедливым $$ f^{\prime}_x(\varphi(y)) \varphi^{\prime}_y(y)\equiv 1 \, . $$ При подстановке сюда $ y=y_0 $ получаем уже известное нам равенство $ f^{\prime}_x(x_0)\varphi^{\prime}_y(y_0)=1 $. Но если продифференцировать еще раз, то получим $$ f^{\prime \prime}_{x^2}(\varphi(y)) \left(\varphi^{\prime}_y(y)\right)^2+f^{\prime}_x(\varphi(y)) \varphi^{\prime \prime}_{y^2}(y)\equiv 0 \, . $$ При подстановке сюда $ y=y_0 $ получаем $$ \varphi^{\prime \prime}_{y^2}(y_0)=- \frac{f^{\prime \prime}_{x^2}(x_0)}{[f^{\prime}_x(x_0)]^3} $$ в дополнительном предположении, что вторая производная от $ f(x) $ существует. Вычисление остальных старших производных $ \varphi(y) $ в точке $ y_0 $ производится аналогичным приемом — лишь бы только существовали эти производные для функции $ f(x) $. При полиномиальной $ f(x) $ ряд Тейлора для обратной функции всегда может быть построен.

Фактически же задача свелась к решению задачи Коши для обыкновенного дифференциального уравнения. Так, для поиска функции, обратной к $ f(x)= x^3-x+1 $, рассматриваемой в окрестности точки $ x_0=-1 $, мы получаем дифференциальное уравнение $$ \frac{d \varphi } {d\, y} = \frac{1}{3 \varphi^2-1} $$ с начальным условием $ \varphi(y_0)=f(x_0)=1 $. И поиск решения этого уравнения можно производить как в виде ряда, так и каким-нибудь численным методом. Хотя бы и Эйлера

Теорема утверждает, что обратная функция будет определена в окрестности точки $ y_0 $, удовлетворяющей условию. Насколько большой можно сделать эту окрестность? Ограничимся случаем полиномиальных $ f(x) $. При движении от точки $ y_0 $ вправо или влево по числовой оси значения $ \varphi^{\prime}(y) $ меняются непрерывным образом и стремятся к бесконечности только когда соответствующие значения $ x $ стремятся к корням полинома $ f^{\prime}(x) $. Если этот полином имеет вещественные корни, и $ \mu_1 < \mu_2 $ — два соседних, то на интервале между точками $ f(\mu_1) $ и $ f(\mu_2) $ определена обратная функция $ \varphi(y) $, отображающая этот интервал в $ ]\mu_1, \mu_2[ $. Эти границы существования обратной функции можно считать жесткими: если выполняются условия $ f^{\prime \prime}(\mu_1) \ne 0, f^{\prime \prime}(\mu_2) \ne 0 $ (а они, как правило, для случайно выбранного полинома выполняются), то расширение интервала существования невозможно.

Переход к случаю нескольких переменных начнем с линейного случая: равенства $$ \left\{\begin{array}{ccc} y_1 &=&a_{11}x_1 +a_{12}x_2+\ldots+a_{1n}x_n \\ y_2 &=& a_{21}x_1 +a_{22}x_2+\ldots+a_{2n}x_n \\ \ldots& & \ldots \\ y_n &=&a_{n1}x_1 +a_{n2}x_2+\ldots+a_{nn}x_n \end{array}\right. $$ при фиксированных коэффициентах $ \{a_{jk} \} $ задают линейное отображение пространства $ \mathbb R^n $ в пространство $ \mathbb R^n $. Условие существования обратного отображения известно из линейной алгебры: система уравнений однозначно разрешима относительно $ x_1,\dots,x_n $ тогда и только тогда, когда $$ \left| \begin{array}{rrrr} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} & \dots & a_{2n} \\ \dots &&& \dots \\ a_{n1} & a_{n2} & \dots & a_{nn} \end{array} \right| \ne 0 \ . $$ Обратное отображение задается матрицей, обратной матрице $ A=[a_{jk}]_{j,k=1}^n $: $$ \left( \begin{array}{l} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \end{array} \right) = A^{-1} \left( \begin{array}{l} y_{1} \\ y_{2} \\ \vdots \\ y_{n} \end{array} \right) \, . $$ Оба отображения — и прямое и обратное — определены во всем пространстве $ \mathbb R^n $. Аналогичное утверждение справедливо и для обобщения линейных отображений — так называемых, аффинных отображений.

А вот с отображениями, которые задаются нелинейными функциями, дело обстоит значительно хуже.

Т

Теорема. Пусть функции $ u=f(x,y) $ и $ v=g(x,y) $ непрерывно дифференцируемы в некоторой окрестности точки $ (x_0,y_0) $ и якобиан

$$ \frac{D(f,g)}{D(x,y)}=\frac{\partial f}{\partial x}\frac{\partial g}{\partial y}-\frac{\partial f}{\partial y}\frac{\partial g}{\partial x} $$ отличен от нуля в точке $ (x_0,y_0) $. Тогда существует окрестность точки $(u_0,v_0)=(f(x_0,y_0),g(x_0,y_0)) $, в которой определены функции $ \varphi(u,v) $ и $ \psi(u,v) $ такие, что $$ f(\varphi(u,v),\psi(u,v)) \equiv u, \ g(\varphi(u,v),\psi(u,v)) \equiv v, \ \varphi(u_0,v_0)=x_0, \psi(u_0,v_0)=x_0 \, . $$ Функции $ \varphi $ и $ \psi $ непрерывно дифференцируемы в этой окрестности и для их матрицы Якоби выполняется равенство $$ \left(\begin{array}{cc} \partial \varphi/ \partial u & \partial \varphi/ \partial v \\ \partial \psi/ \partial u & \partial \psi/ \partial v \end{array} \right)= \left(\begin{array}{cc} \partial f/ \partial x & \partial f/ \partial y \\ \partial g/ \partial x & \partial g/ \partial y \end{array} \right)^{-1} \, . $$ Левая часть этого матричного равенства вычисляется в точках $ (u,v) $, соответствующих точкам $(x,y) $, в которых вычисляется правая часть (т.е. эти пары подчиняются равенствам $ u=f(x,y),v=g(x,y) $).

Обоснование справедливости матричного равенства, связывающего матрицы Якоби прямого и обратного отображений, можно вывести дифференцированием тождеств $ f(\varphi(u,v),\psi(u,v)) \equiv u, \ g(\varphi(u,v),\psi(u,v)) \equiv v $ по $ u $ и $ v $: $$ \frac{\partial f}{\partial x}\frac{\partial \varphi}{\partial u }+\frac{\partial f}{\partial y}\frac{\partial \psi}{\partial u } \equiv 1, \ \frac{\partial f}{\partial x}\frac{\partial \varphi}{\partial v }+\frac{\partial f}{\partial y}\frac{\partial \psi}{\partial v } \equiv 0, $$ $$ \frac{\partial g}{\partial x}\frac{\partial \varphi}{\partial u }+\frac{\partial g}{\partial y}\frac{\partial \psi}{\partial u } \equiv 0,\ \frac{\partial g}{\partial x}\frac{\partial \varphi}{\partial v }+\frac{\partial g}{\partial y}\frac{\partial \psi}{\partial v } \equiv 1 \, . $$

=>

При выполнении условий теоремы, в соответствующих друг другу точках $ (u,v) $ и $ (x,y) $ выполняется равенство

$$ \frac{D(\varphi,\psi)}{D(u,v)}=\frac{1}{\frac{D(f,g)}{D(x,y)}} \, . $$

П

Пример. Отображение

$$ (u,v)=(e^x \cos y, e^x \sin y \} $$ отображает $ (x,y) $-плоскость $ \mathbb R^2 $ во множество $ \mathbb R^2 \setminus (0,0) $ на плоскости $ (u,v) $. Якобиан $$ \frac{D(u,v)}{D(x,y)} \equiv e^{2x} $$ отличен от нуля во всей плоскости $ (x,y) $. Можно было бы ожидать, что обратное отображение должно быть однозначным во всей области $ \mathbb R^2 \setminus (0,0) $. Но очевидно, что это не так: бесконечное множество $$ \{(x,y)=(0,2\pi k ) \mid k \in \mathbb Z \} $$ отображается в точку $ (u,v)=(1,0) $. Обратное отображение бесконечнозначно. Результат теоремы справедлив если мы рассмотрим отображение любой полосы шириной $ 2 \pi $ плоскости $(x,y) $, параллельной оси $ O x $. Например, полосы $ 0\le y < 2 \pi $ на область $ \mathbb R^2\setminus (0,0) $ плоскости $ (u,v) $:

В этом случае обратное отображение задается явным выражением для $ x $: $$ x=\frac{1}{2} \ln (u^2+v^2), \ $$ и условиями $$ \cos y = \frac{u}{\sqrt{u^2+v^2}}, \ \sin y = \frac{v}{\sqrt{u^2+v^2}}, \ y\in [0,2\pi) $$ для $ y $. Теперь обратное отображение становится однозначным.

Мы в дальнейшем ограничимся случаем полиномиальных функций. Для этого случая хотя бы можно ожидать, что якобиан будет из того же класса, что и сами функции, т.е. полиномом. Ну и можно что-то конструктивное сказать о выражении обратных функций — хотя эти уже, как правило, не будут полиномиальными.

П

Пример. Найти обратное отображение к отображению

$$ \left\{ \begin{array}{ll} u=f(x,y):=&-2\,x^2+5\,xy-3\,y^2-2\,x+y+2,\\ v=g(x,y):=& x^2-2\,xy+y^2-x+y+1\, . \end{array} \right. $$

Решение. Якобиан $$ \frac{D(f,g)}{D (x,y)}=\left| \begin{array}{rr} -4\,x+5\,y-2 & 5\,x-6\,y+1 \\ 2\,x-2\,y-1 & -2\,x+2\,y+1 \end{array} \right|=-2\,x^2+4\,xy-2\,y^2+3\,x -3\,y-1\equiv $$ $$ \equiv (-2x+2y+1)(x-y-1) \, . $$ отличен от нуля во всех точках плоскости, за исключением лежащих на прямых $ y=x-1 $ и $ y=x-1/2 $. Согласно теореме, обратное отображение должно существовать, например, в окрестности точки $ (u,v)=(-5,7)=(f(-1,1),g(-1,1)) $.

Для разрешения системы алгебраических уравнений $ u=f(x,y), v=g(x,y) $ относительно $ x $ и $ y $ применим теорию исключения. Результант системы по переменной $ y $ $$ \mathcal X(x)=(1-v)x^2+(u+11\,v-9)x+u^2-6\,u-34\,v+9\,v^2+6\,uv+21 $$ оказывается квадратным полиномом1) по $ x $. Корни уравнения $ \mathcal X(x) $ следующие: $$ \frac{u+11v-9\pm (u+3v-1)\sqrt{4v-3}}{2(v-1)} \, . $$ Из них только соответствующий знаку минус в числителе, т.е. $$ \varphi(u,v):=\frac{u+11v-9 - (u+3v-1)\sqrt{4v-3}}{2(v-1)} $$ удовлетворяет условию $ \varphi(-5,7)=-1 $. Аналогично находим выражение для $ y $: $$ \psi(u,v):=\frac{u+10v-8 - (u+2v)\sqrt{4v-3}}{2(v-1)} \, . $$ Области определения обеих функций одинаковы: $$ \{(u,v) \in \mathbb R^2 \mid v\ge 3/4, v\ne 1 \} \, . $$ Теперь проверим справедливость формулы, связывающей якобианы. Имеем (в окрестности точки $ (-5,7) $) $$ \frac{D(\varphi,\psi)}{D(u,v)}= \frac{1}{2(1-v)\sqrt{4v-3}}\left[\sqrt{4v-3}-1 \right] \, . $$ Подстановка сюда $ u=f(x,y), v= g(x,y) $ дает (в окрестности точки $ (1,-1) $) $$ \frac{2(y-x)}{2(2y-2x+1)(y-x)(x-y-1)} \equiv \left( \frac{D(f,g)}{D (x,y)} \right)^{-1} \, . $$

Сформулируем обобщение предыдущего результата в $ \mathbb R^n $.

Т

Теорема. Если якобиан системы полиномов $ \{ f_1(X), \dots , f_n(X) \} \subset \mathbb R[X] $ отличен от нуля в некоторой точке $ X_0 \in \mathbb R^n $, то существует окрестность этой точки, в которой уравнения

$$ y_1=f_1(x_1,\dots,x_n),\dots,y_n=f_n(x_1,\dots,x_n) $$ однозначно разрешимы относительно переменных $ x_{1},\dots,x_n $. То есть существует система функций $ \{ \varphi_1(Y),\dots, \varphi_n(Y)\} $, непрерывно дифференцируемых в окрестности точки $$ Y_0=(f_1(X_0),\dots,f_n(X_0)) $$ и таких, что $$ f_1(\varphi_1(Y),\dots, \varphi_n(Y))\equiv y_1,\dots, f_n(\varphi_1(Y),\dots, \varphi_n(Y))\equiv y_n $$ и $$ (\varphi_1(Y_0),\dots, \varphi_n(Y_0))=X_0 \, .$$ Матрицы Якоби систем функций $ \{ f_j \}_{j=1}^n$ и $ \{ \varphi_j \}_{j=1}^n$ связаны равенством: $$ \left( \begin{array}{cccc} {\partial \varphi_1}/{\partial y_1} & {\partial \varphi_1}/{\partial y_2} & \dots & {\partial \varphi_1}/{\partial y_n} \\ \dots & && \dots \\ {\partial \varphi_n}/{\partial y_1} & {\partial \varphi_n}/{\partial y_2} & \dots & {\partial \varphi_n}/{\partial y_n} \end{array} \right)= \left( \begin{array}{cccc} {\partial f_1}/{\partial x_1} & {\partial f_1}/{\partial x_2} & \dots & {\partial f_1}/{\partial x_n} \\ \dots & && \dots \\ {\partial f_n}/{\partial x_1} & {\partial f_n}/{\partial x_2} & \dots & {\partial f_n}/{\partial x_n} \end{array} \right)^{-1} \, . $$ Здесь производные в левых и правых частях равенства вычислены в соответствующих точках.

=>

При выполнении условий теоремы, в соответствующих друг другу точках $ Y $ и $ X $ выполняется равенство

$$ \frac{D(\varphi_1,\dots,\varphi_n)}{D(y_1,\dots,y_n)} = \left(\frac{D(f_1,\dots,f_n)}{D(x_1,\dots,x_n)} \right)^{-1} \ . $$

Еще одну важную сущность якобиана сформулируем в решении следующего примера.

П

Пример. Отображение

$$ \left\{ \begin{array}{ll} u=f(x,y):=&-1/2\,x^2-3/4\,xy-y^2-x-1/2\,y+2,\\ v=g(x,y):=& 1/4\,x^2-1/2\,xy-1/2\,y^2-x+1/2\,y+1 \end{array} \right. $$ отображает окрестность точки $ (x_0,y_0)=(0,1) $ в окрестность точки $ (u_0,v_0)=(1/2,1) $. Квадрат $ 0 \le x \le 1, 0 \le y \le 1$ отображается в область плоскости $ (u,v) $, органиченную параметрически заданными кривыми $$ \{u=f(x,0),v=g(x,0) \mid 0 \le x \le 1\}, \{u=f(x,1),v=g(x,1) \mid 0 \le x \le 1\} , $$ $$ \{u=f(0,y),v=g(0,y) \mid 0 \le y \le 1\}, \{u=f(1,y),v=g(1,y) \mid 0 \le y \le 1\} . $$ Как соотносятся между собой площади двух областей: исходного квадрата и его образа?

Решение. Для ответа на вопрос надо обладать возможностью вычислить точную площадь области, закрашенной оранжевым на рисунке. Я не уверен, что это можно сделать сведением к случаю «табличных» интегралов, но, по крайней мере, численными методами можно найти приближение этой площади. Попробуем получить такое приближение, заменив границу области — криволинейную — на параллелограмм. С этой целью проведем в точке $ (u_0,v_0) $ касательные к ограничивающую область кривым: $$ \{ (u,v)= (u_0+ f^{\prime}_x(x_0,y_0) t, v_0+ g^{\prime}_x(x_0,y_0) t) \mid t \in \mathbb R \} \ \mbox{ и } \ \{ (u,v)=(u_0+ f^{\prime}_y(x_0,y_0) \tau, v_0+ g^{\prime}_y(x_0,y_0) \tau )\mid \tau \in \mathbb R \} \, . $$ и возьмем на них, помимо $ (u_0,v_0) $, точки, соответствующие значениям параметров $ t=1, \tau=1 $.

Почему именно такие значения придаем параметрам? — Потому что $ 1 $ — это размер стороны квадрата, взятого на плоскости $ (x,y) $. Нелинейную функцию $ f(x,y_0) $ приближаем линейной функцией $ f(x_0,y_0)+f^{\prime}_x (x_0,y_0)(x-x_0) $. Точка $ f(x_0+\delta,y_0) $ аппроксимируется значением линейной функции при $ x=\delta $.

Эта аппроксимация, в нашем конкретном случае, очевидно неудачная. Как следствие, площадь получишегося параллелограмма визуально отличается от искомой площади. Однако если уменьшить размеры отображаемого квадрата на плоскости $ (x,y) $ до $ 0 \le x \le 1/2, 1/2\le y \le 1 $, то его образ становится более похожим на параллелограмм построенный по приведенному выше образцу. В общем случае отображения квадрата размера $ \delta \times \delta $ получаем приближение его образа в виде параллелограмма с вершинами $$ (u_0,v_0),\ (u_0+f^{\prime}_x \delta,v_0 +g^{\prime}_x \delta),\ (u_0+f^{\prime}_y \delta,v_0 +g^{\prime}_y \delta) \, , $$ $$ (u_0+f^{\prime}_x \delta++f^{\prime}_y \delta,v_0 +g^{\prime}_x \delta+g^{\prime}_y \delta) \, . $$ Здесь все производные вычислены в точке $ (x_0,y_0) $. Воспользовавшись формулой вычисления площади параллелограмма, получаем выражение в виде абсолютной величины (модуля) выражения $$ \left|\begin{array}{cc} f^{\prime}_x & g^{\prime}_x \\ f^{\prime}_y & g^{\prime}_y \end{array} \right| \delta^2 \, . $$ Чем меньше $ \delta $ тем меньше отклонение этого приближения от образа квадрата при отображении. Если изображать образы точек под воздействием отображения на той же исходной плоскости, то можно сказать, что абсолютная величина якобиана представляет собой коэффициент сжатия (или растяжения) бесконечно малой области вокруг точки, в которой он вычисляется. В настоящем примере $$ \frac{D(f,g)}{D (x,y)} \Bigg|_{(0,1)}= - \frac{23}{8} \ , $$ т.е. малая окрестность точки $ (0,1) $ «резиновой» плоскости сдвинется к точке $ (1,-1) $ и растянется примерно в четыре раза.

В частном случае линейного оператора в $ \mathbb R^n $, результат становится точным и универсальным для любой точки пространства; см. ЗДЕСЬ.
Результат существенно используется в задачах замены переменных в кратных интегралах. $$ \int \int F(x,y) dx dy \ \leftrightarrow \ \sum F(x_j, y_j) \Delta x \Delta y \ \leftrightarrow \ $$ $$ \ \leftrightarrow \ \sum F(\varphi (u_j,v_j), \psi(u_j,v_j) ) \left| \frac{D(\varphi,\psi)}{D (u,v)} \right|_{(u_j,v_j)} \Delta u \Delta v \ \leftrightarrow $$ $$ \ \leftrightarrow \ \int \int F(\varphi (u,v),\psi(u,v)) \left| \frac{D(\varphi,\psi)}{D (u,v)} \right| du dv \, . $$ Последний интеграл вычисляется по области, являющейся образом области, по которой вычисляется первый интеграл, при отображении $ x=\varphi (u,v), y=\psi (u,v) $.

Неявная функция

Обобщением рассмотренного в предыдущем пункте случая, т.е. выражения вектора $ X=(x_1,\dots,x_n) $ через вектор $ Y=(y_1,\dots,y_n) $ при задании многомерного отображения формулами $$ Y= (f_1(X),\dots,f_n(X)) $$ является случай неявной функции.

В линейном случае, эта задача встречается при записи общего решения системы линейных уравнений. Если эта система представлена в виде $$ \left\{ \begin{array}{llllllll} a_{11}y_1 &+a_{12}y_2&+ \ldots&+a_{1n}y_n &+a_{1,n+1}x_{1}&+\ldots & +a_{1,n+m}x_{m} -b_1=0,\\ a_{21}y_1 &+a_{22}y_2&+ \ldots&+a_{2n}y_n &+a_{2,n+1}x_{1}&+\ldots & +a_{2,n+m}x_{m} -b_2=0,\\ \dots & & & & \dots & \dots & & \dots \\ a_{n1}y_1 &+a_{n2}y_2&+ \ldots&+a_{nn}y_n &+a_{n,n+1}x_{1}&+\ldots & +a_{n,n+m}x_{m} -b_n=0 \end{array} \right. $$ при $ m\ge 1 $, то при условии $$ \left| \begin{array}{rrrr} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} & \dots & a_{2n} \\ \dots &&& \dots \\ a_{n1} & a_{n2} & \dots & a_{nn} \end{array} \right| \ne 0 $$ ее можно разрешить относительно переменных $ y_1,\dots,y_n $ — например, по формулам Крамера или посредством обратной матрицы: $$ \left( \begin{array}{l} y_{1} \\ y_{2} \\ \vdots \\ y_{n} \end{array} \right) = - \left( \begin{array}{rrrr} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} & \dots & a_{2n} \\ \dots &&& \dots \\ a_{n1} & a_{n2} & \dots & a_{nn} \end{array} \right)^{-1} \left( \begin{array}{rrr} a_{1,n+1} & \dots & a_{1,n+m} \\ a_{2,n+1} & \dots & a_{2,n+m} \\ \dots && \dots \\ a_{n,n+1} & \dots & a_{n,n+m} \end{array} \right) \left( \begin{array}{l} x_{1} \\ \\ \vdots \\ x_{m} \end{array} \right)+\left( \begin{array}{rrrr} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} & \dots & a_{2n} \\ \dots &&& \dots \\ a_{n1} & a_{n2} & \dots & a_{nn} \end{array} \right)^{-1} \left( \begin{array}{l} b_{1} \\ \\ \vdots \\ b_{m} \end{array} \right) \, . $$

В случае нелинейного уравнения $$ f(x,y)=0 \, $$ критерий существования неявной функции дается следующей теоремой

Т

Теорема [о неявной функции]. Пусть $ f(x_0,y_0)=0 $, функция $ f $ — непрерывно дифференцируема в окрестности точки $ (x_0,y_0) $ и

$$ \partial f /\partial y \mid_{(x_0,y_0)}\ne 0 \, .$$ Тогда существует окрестность точки $ x_0 $, в которой уравнение $ f(x,y)=0 $ имеет единственное решение относительно $ y $, а именно вещественная функция $ \varphi(x) $, такая, что $$ \varphi(x_0)=y_0, \ f(x,\varphi(x)) \equiv 0 $$ (последнее тождество выполняется в заявленной окрестности $ x_0 $). При этом $ \varphi(x) $ является непрерывно дифференцируемой функцией в той же окрестности и выполняется тождество $$ \varphi^{\prime}(x)\equiv-\frac{\partial f /\partial x}{\partial f /\partial y} \Bigg|_{_{(x,\varphi(x))}} \, . $$

Задача о нахождении явного выражения $ y=\varphi(x) $ еще более сложна, чем задача предыдущего пункта о нахождении обратной функции. В случае полиномиальной $ f(x,y) $ решение задачи удается получить в виде степенного ряда (или, в общем случае, ряда Пюизё), сходящегося в некоторой окрестности точки $ x_0 $.

Т

Теорема. Пусть имеется система полиномов

$$ \{ f_1(X,Y), \dots , f_m(X,Y) \} \subset \mathbb R[X,Y] $$ от векторов переменных $ X=(x_1,\dots,x_n) $ и $ Y=(y_1,\dots,y_m) $. Пусть выполнены следующие условия:

  • существует точка $ (X_0,Y_0) \in \mathbb R^{n+m} $ такая, что

$$ f_1(X_0,Y_0)=0, \dots , f_m(X_0,Y_0)=0 \, . $$

  • якобиан

$$ \frac{D(f_1,\dots,f_m)}{D (y_1,\dots,y_m)} $$ отличен от нуля в точке $ (X_0,Y_0) $.

Тогда существует окрестность точки $ X_0 $ и в ней система непрерывных функций $$ \{\varphi_1 (X),\dots, \varphi_m(X) \} $$ такая, что $$ (\varphi_1 (X_0),\dots, \varphi_m(X_0))=Y_0 $$ и $$ f_1(X,\varphi_1 (X),\dots, \varphi_m(X)) \equiv 0, \dots, f_m(X,\varphi_1 (X),\dots, \varphi_m(X)) \equiv 0 \, . $$ Система функций $ \{\varphi_j (X)\}_{j=1}^m $ с указанными свойствами единственна и для нее справедливо матричное равенство $$ \left( \begin{array}{cccc} {\partial \varphi_1}/{\partial x_1} & {\partial \varphi_1}/{\partial x_2} & \dots & {\partial \varphi_1}/{\partial x_n} \\ \dots & & & \dots \\ {\partial \varphi_m}/{\partial x_1} & {\partial \varphi_m}/{\partial x_2} & \dots & {\partial \varphi_m}/{\partial x_n} \end{array} \right) \equiv $$ $$ \equiv - \left( \begin{array}{cccc} {\partial f_1}/{\partial y_1} & \dots & {\partial f_1}/{\partial y_m} \\ \dots & & \dots \\ {\partial f_m}/{\partial y_1} & \dots & {\partial f_m}/{\partial y_m} \end{array} \right)^{-1} \left( \begin{array}{cccc} {\partial f_1}/{\partial x_1} & {\partial f_1}/{\partial x_2} & \dots & {\partial f_1}/{\partial x_n} \\ \dots & && \dots \\ {\partial f_m}/{\partial x_1} & {\partial f_m}/{\partial x_2} & \dots & {\partial f_m}/{\partial x_n} \end{array} \right) \, . $$

=>

Если система полиномов

$$\{f_1(y_1,\dots,y_n,x_1,\dots,x_n),\dots, f_n(y_1,\dots,y_n,x_1,\dots,x_n)\} $$ удовлетворяет условиям теоремы в некоторой точке $ (X_0,Y_0) \in \mathbb R^{2n} $, то существует окрестность точки $ X_0 $, в которой справедливо равенство $$ \frac{D(\varphi_1,\dots,\varphi_n)}{D(x_1,\dots,x_n)}=(-1)^n \frac{D(f_1,\dots,f_n)}{D(x_1,\dots,x_n)} \bigg/ \frac{D(f_1,\dots,f_n)}{D(y_1,\dots,y_n)} \, . $$ Здесь производные вычислены в соответствующих точках.

Геометрические приложения

Т

Теорема. Пусть на плоскости заданы две кривые уравнениями $$ f(x,y)=0 \quad u \quad g(x,y)=0 \ $$ и они пересекаются в точке $ (x_{0},y_0) $. Тогда величина угла $ \gamma $, под которым происходит это пересечение вычисляется по формуле

$$ \operatorname{tg} (\gamma) = \pm \frac{\frac{\partial f}{\partial x} \frac{\partial g} {\partial y} - \frac{\partial f}{\partial y} \frac{\partial g}{\partial x}}{\frac{\partial f}{\partial x} \frac{\partial g}{\partial x} + \frac{\partial f}{\partial y}\frac{\partial g}{\partial y}} $$ где все производные в правой части вычислены в точке $ (x_{0},y_0) $.

Утверждение следует из свойства градиента: вычисленный в точке кривой, он определяет направляющий вектор нормали к этой кривой.

=>

Если $ (x_{0},y_0) $ — точка пересечения кривых $ f(x,y)=0 $ и $ g(x,y)=0 $, то

  • кривые соприкасаются в этой точке, если в ней якобиан функций $ f_{} $ и $ g_{} $ обращается в нуль:

$$\frac{\partial f}{ \partial x} \frac{\partial g}{ \partial y} - \frac{\partial f}{ \partial y} \frac{\partial g}{\partial x}= 0 \ ; $$

  • кривые пересекаются в этой точке под прямым углом, если в ней

$$ \frac{\partial f}{\partial x} \frac{\partial g}{ \partial x} + \frac{\partial f}{ \partial y} \frac{\partial g}{ \partial y} = 0 \ . $$

?

Показать, что если функции $ u_{}(x,y) $ и $ v_{}(x,y) $ связаны соотношениями Коши-Римана (Даламбера-Эйлера):

$$ \frac{\partial u}{ \partial x} \equiv \frac{\partial v}{ \partial y} , \frac{\partial u}{ \partial y} \equiv - \frac{\partial v}{ \partial x} $$ в некоторой области $ \mathbb{S}_{} $, то в этой области их линии уровня, то есть кривые $ u(x,y) = c_1 $ и $ v(x,y) = c_2 $ при $ \{c_1,c_2\} \subset \mathbb R $, могут пересекаться только под прямым углом.

Источники

[1]. Jacobi C.G.J. De Determinantibus functionalibus. J. reine angew. Math. Bd. 22, 1841, S. 319-359

[2]. Задача № 5256 из журнала American Mathematical Monthly, v. 73, N 1, 1966, cc. 93-94

[3]. Гурса Э. Курсъ математическаго анализа. Т.1. М. Издание торгового дома «В.И.Знаменский и Кº».1911

[4]. Зубов В.И. К вопросу существования и приближенного представления неявных функций Вестник Ленингр. ун-та. Сер. математика, механика и астрономия. № 19, вып. 4, 1956 , С.48-54

1)
Вообще, для полиномов $ f $ и $ g $ второй степени можно было ожидать, что $ \deg \mathcal X = 4 $, но в данном примере специальным подбором коэффициентов добиваемся понижения этой степени.
algebra2/dets/jacobian.txt · Последние изменения: 2020/10/27 20:16 — au