Гессиан функции — симметрическая квадратичная форма [ 1] , описывающая поведение функции во втором порядке.
Для функции
f
{\displaystyle f}
, дважды дифференцируемой в точке
x
∈
R
n
{\displaystyle x\in \mathbb {R} ^{n}}
H
(
x
)
=
∑
i
=
1
n
∑
j
=
1
n
a
i
j
x
i
x
j
{\displaystyle H(x)=\sum _{i=1}^{n}\sum _{j=1}^{n}a_{ij}x_{i}x_{j}}
или
H
(
z
)
=
∑
i
=
1
n
∑
j
=
1
n
a
i
j
z
i
z
¯
j
{\displaystyle H(z)=\sum _{i=1}^{n}\sum _{j=1}^{n}a_{ij}z_{i}{\overline {z}}_{j}}
где
a
i
j
=
∂
2
f
/
∂
x
i
∂
x
j
{\displaystyle a_{ij}=\partial ^{2}f/\partial x_{i}\partial x_{j}}
(или
a
i
j
=
∂
2
f
/
∂
z
i
∂
z
¯
j
{\displaystyle a_{ij}=\partial ^{2}f/\partial z_{i}\partial {\overline {z}}_{j}}
) и функция
f
{\displaystyle f}
задана на
n
{\displaystyle n}
-мерном вещественном пространстве
R
n
{\displaystyle \mathbb {R} ^{n}}
(или комплексном пространстве
C
n
{\displaystyle \mathbb {C} ^{n}}
) с координатами
x
1
,
…
,
x
n
{\displaystyle x_{1},\ldots ,x_{n}}
(или
z
1
,
…
,
z
n
{\displaystyle z_{1},\ldots ,z_{n}}
). В обоих случаях гессиан — квадратичная форма, заданная на касательном пространстве , не меняющаяся при линейных преобразованиях переменных. Гессианом также часто называют и определитель матрицы
(
a
i
j
)
,
{\displaystyle (a_{ij}),}
см. ниже.
Матрица этой квадратичной формы образована вторыми частными производными функции. Если все производные существуют, то
H
(
f
)
=
[
∂
2
f
∂
x
1
2
∂
2
f
∂
x
1
∂
x
2
⋯
∂
2
f
∂
x
1
∂
x
n
∂
2
f
∂
x
2
∂
x
1
∂
2
f
∂
x
2
2
⋯
∂
2
f
∂
x
2
∂
x
n
⋮
⋮
⋱
⋮
∂
2
f
∂
x
n
∂
x
1
∂
2
f
∂
x
n
∂
x
2
⋯
∂
2
f
∂
x
n
2
]
{\displaystyle H(f)={\begin{bmatrix}{\frac {\partial ^{2}f}{\partial x_{1}^{2}}}&{\frac {\partial ^{2}f}{\partial x_{1}\,\partial x_{2}}}&\cdots &{\frac {\partial ^{2}f}{\partial x_{1}\,\partial x_{n}}}\\\\{\frac {\partial ^{2}f}{\partial x_{2}\,\partial x_{1}}}&{\frac {\partial ^{2}f}{\partial x_{2}^{2}}}&\cdots &{\frac {\partial ^{2}f}{\partial x_{2}\,\partial x_{n}}}\\\\\vdots &\vdots &\ddots &\vdots \\\\{\frac {\partial ^{2}f}{\partial x_{n}\,\partial x_{1}}}&{\frac {\partial ^{2}f}{\partial x_{n}\,\partial x_{2}}}&\cdots &{\frac {\partial ^{2}f}{\partial x_{n}^{2}}}\end{bmatrix}}}
Определитель этой матрицы называется определителем Гессе , или просто гессианом [источник не указан 4368 дней ] .
Матрицы Гессе используются в задачах оптимизации методом Ньютона .
Полное вычисление матрицы Гессе может быть затруднительно, поэтому были разработаны квазиньютоновские алгоритмы, основанные на приближённых выражениях для матрицы Гессе. Наиболее известный из них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно .
Смешанные производные функции f — это элементы матрицы Гессе, стоящие не на главной диагонали . Если они непрерывны, то порядок дифференцирования не важен:
∂
∂
x
i
(
∂
f
∂
x
j
)
=
∂
∂
x
j
(
∂
f
∂
x
i
)
{\displaystyle {\frac {\partial }{\partial x_{i}}}\left({\frac {\partial f}{\partial x_{j}}}\right)={\frac {\partial }{\partial x_{j}}}\left({\frac {\partial f}{\partial x_{i}}}\right)}
Это можно также записать как
f
x
i
x
j
=
f
x
j
x
i
,
∀
i
,
j
∈
{
1
,
…
,
n
}
.
{\displaystyle f_{x_{i}x_{j}}=f_{x_{j}x_{i}},\quad \forall i,j\in \{1,\ldots ,n\}.}
В этом случае матрица Гессе симметрична .
Если
f
{\displaystyle f}
— вектор-функция , то есть
f
=
(
f
1
,
f
2
,
…
,
f
n
)
,
{\displaystyle f=(f_{1},f_{2},\dots ,f_{n}),}
то её вторые частные производные образуют не матрицу, а тензор ранга 3, который можно рассматривать как массив из
n
{\displaystyle n}
матриц Гессе:
H
(
f
)
=
(
H
(
f
1
)
,
…
,
H
(
f
n
)
)
.
{\displaystyle H(f)=\left(H(f_{1}),\ldots ,H(f_{n})\right).}
При
n
=
1
{\displaystyle n=1}
данный тензор вырождается в обычную матрицу Гессе.
При решении задачи нахождения условного экстремума функции
f
:
R
n
→
R
{\displaystyle f:\mathbb {R} ^{n}\rightarrow \mathbb {R} }
с ограничениями
{
g
1
(
x
)
=
0
,
⋮
g
m
(
x
)
=
0
,
{\displaystyle \left\{{\begin{array}{c}g_{1}(x)=0,\\\vdots \\g_{m}(x)=0,\end{array}}\right.}
где
x
∈
R
n
{\displaystyle x\in \mathbb {R} ^{n}}
,
m
<
n
{\displaystyle m<n}
, для проверки достаточных условий экстремума можно использовать так называемый окаймлённый гессиан функции Лагранжа
L
(
x
,
λ
)
{\displaystyle L(x,\lambda )}
, который будет иметь вид[ 2]
(
∂
2
L
∂
x
2
∂
2
L
∂
x
∂
λ
(
∂
2
L
∂
x
∂
λ
)
T
∂
2
L
∂
λ
2
)
=
(
∂
2
L
∂
x
1
2
…
∂
2
L
∂
x
1
∂
x
n
∂
g
1
∂
x
1
…
∂
g
m
∂
x
1
⋮
⋱
⋮
⋮
⋱
⋮
∂
2
L
∂
x
n
∂
x
1
…
∂
2
L
∂
x
n
2
∂
g
1
∂
x
n
…
∂
g
m
∂
x
n
∂
g
1
∂
x
1
…
∂
g
1
∂
x
n
0
…
0
⋮
⋱
⋮
⋮
⋱
⋮
∂
g
m
∂
x
1
…
∂
g
m
∂
x
n
0
…
0
)
.
{\displaystyle \left({\begin{array}{cc}{\dfrac {\partial ^{2}L}{\partial x^{2}}}&{\dfrac {\partial ^{2}L}{\partial x\partial \lambda }}\\\left({\dfrac {\partial ^{2}L}{\partial x\partial \lambda }}\right)^{\mathrm {T} }&{\dfrac {\partial ^{2}L}{\partial \lambda ^{2}}}\end{array}}\right)=\left({\begin{array}{cccccc}{\dfrac {\partial ^{2}L}{\partial x_{1}^{2}}}&\ldots &{\dfrac {\partial ^{2}L}{\partial x_{1}\partial x_{n}}}&{\dfrac {\partial g_{1}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{1}}}\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\{\dfrac {\partial ^{2}L}{\partial x_{n}\partial x_{1}}}&\ldots &{\dfrac {\partial ^{2}L}{\partial x_{n}^{2}}}&{\dfrac {\partial g_{1}}{\partial x_{n}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{n}}}\\{\dfrac {\partial g_{1}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{1}}{\partial x_{n}}}&0&\ldots &0\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\{\dfrac {\partial g_{m}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{n}}}&0&\ldots &0\end{array}}\right).}
Проверка достаточных условий экстремума заключается в вычислении знаков детерминантов определённого набора подматриц окаймлённого гессиана. Именно, если существуют
x
∗
∈
R
n
{\displaystyle x^{*}\in \mathbb {R} ^{n}}
и
λ
∗
∈
R
m
{\displaystyle \lambda ^{*}\in \mathbb {R} ^{m}}
такие, что
∇
L
(
x
∗
,
λ
∗
)
=
0
{\displaystyle \nabla L(x^{*},\lambda ^{*})=0}
и
(
−
1
)
m
det
(
∂
2
L
∂
x
1
2
…
∂
2
L
∂
x
1
∂
x
p
∂
g
1
∂
x
1
…
∂
g
m
∂
x
1
⋮
⋱
⋮
⋮
⋱
⋮
∂
2
L
∂
x
p
∂
x
1
…
∂
2
L
∂
x
p
2
∂
g
1
∂
x
p
…
∂
g
m
∂
x
p
∂
g
1
∂
x
1
…
∂
g
1
∂
x
p
0
…
0
⋮
⋱
⋮
⋮
⋱
⋮
∂
g
m
∂
x
1
…
∂
g
m
∂
x
p
0
…
0
)
>
0
{\displaystyle (-1)^{m}{\mbox{det}}\left({\begin{array}{cccccc}{\dfrac {\partial ^{2}L}{\partial x_{1}^{2}}}&\ldots &{\dfrac {\partial ^{2}L}{\partial x_{1}\partial x_{p}}}&{\dfrac {\partial g_{1}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{1}}}\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\{\dfrac {\partial ^{2}L}{\partial x_{p}\partial x_{1}}}&\ldots &{\dfrac {\partial ^{2}L}{\partial x_{p}^{2}}}&{\dfrac {\partial g_{1}}{\partial x_{p}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{p}}}\\{\dfrac {\partial g_{1}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{1}}{\partial x_{p}}}&0&\ldots &0\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\{\dfrac {\partial g_{m}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{p}}}&0&\ldots &0\end{array}}\right)>0}
для
p
=
m
+
1
,
…
,
n
{\displaystyle p=m+1,\ldots ,n}
, то в точке
x
∗
{\displaystyle x^{*}}
функция
f
{\displaystyle f}
имеет строгий условный минимум. Если же
(
−
1
)
p
det
(
∂
2
L
∂
x
1
2
…
∂
2
L
∂
x
1
∂
x
p
∂
g
1
∂
x
1
…
∂
g
m
∂
x
1
⋮
⋱
⋮
⋮
⋱
⋮
∂
2
L
∂
x
p
∂
x
1
…
∂
2
L
∂
x
p
2
∂
g
1
∂
x
p
…
∂
g
m
∂
x
p
∂
g
1
∂
x
1
…
∂
g
1
∂
x
p
0
…
0
⋮
⋱
⋮
⋮
⋱
⋮
∂
g
m
∂
x
1
…
∂
g
m
∂
x
p
0
…
0
)
>
0
{\displaystyle (-1)^{p}{\mbox{det}}\left({\begin{array}{cccccc}{\dfrac {\partial ^{2}L}{\partial x_{1}^{2}}}&\ldots &{\dfrac {\partial ^{2}L}{\partial x_{1}\partial x_{p}}}&{\dfrac {\partial g_{1}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{1}}}\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\{\dfrac {\partial ^{2}L}{\partial x_{p}\partial x_{1}}}&\ldots &{\dfrac {\partial ^{2}L}{\partial x_{p}^{2}}}&{\dfrac {\partial g_{1}}{\partial x_{p}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{p}}}\\{\dfrac {\partial g_{1}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{1}}{\partial x_{p}}}&0&\ldots &0\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\{\dfrac {\partial g_{m}}{\partial x_{1}}}&\ldots &{\dfrac {\partial g_{m}}{\partial x_{p}}}&0&\ldots &0\end{array}}\right)>0}
для
p
=
m
+
1
,
…
,
n
{\displaystyle p=m+1,\ldots ,n}
, то в точке
x
∗
{\displaystyle x^{*}}
функция
f
{\displaystyle f}
имеет строгий условный максимум[ 3] .
Камынин Л.И. Математический анализ. Т. 1, 2. - 2001.
Кудрявцев Л.Д «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с. — ISBN 5-9221-0185-4 . Или любое другое издание.
Голубицкий М., Гийемин В. Устойчивые отображения и их особенности, — М.: Мир, 1977.