Гессиан функции — симметрическая квадратичная форма[1], описывающая поведение функции во втором порядке.

Для функции , дважды дифференцируемой в точке

или

где (или ) и функция задана на -мерном вещественном пространстве (или комплексном пространстве ) с координатами (или ). В обоих случаях гессиан — квадратичная форма, заданная на касательном пространстве, не меняющаяся при линейных преобразованиях переменных. Гессианом также часто называют и определитель матрицы см. ниже.

Матрица Гессе

править

Матрица этой квадратичной формы образована вторыми частными производными функции. Если все производные существуют, то

 

Определитель этой матрицы называется определителем Гессе, или просто гессианом[источник не указан 4390 дней].

Матрицы Гессе используются в задачах оптимизации методом Ньютона. Полное вычисление матрицы Гессе может быть затруднительно, поэтому были разработаны квазиньютоновские алгоритмы, основанные на приближённых выражениях для матрицы Гессе. Наиболее известный из них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.

Симметрия матрицы Гессе

править

Смешанные производные функции f — это элементы матрицы Гессе, стоящие не на главной диагонали. Если они непрерывны, то порядок дифференцирования не важен:

 

Это можно также записать как

 

В этом случае матрица Гессе симметрична.

Критические точки функции

править

Если градиент   (её векторная производная) равен нулю в некоторой точке  , то эта точка называется критической. Достаточным условием существования экстремума в этой точке является знакоопределённость гессиана f (понимаемого в данном случае как квадратичная форма), а именно:

  • если гессиан положительно определён, то   — точка локального минимума функции  ,
  • если гессиан отрицательно определён, то   — точка локального максимума функции  ,
  • если гессиан не является знакоопределённым (принимает как положительные, так и отрицательные значения) и невырожден  , то   — седловая точка функции  .

Вариации и обобщения

править

Вектор-функции

править

Если   — вектор-функция, то есть

 

то её вторые частные производные образуют не матрицу, а тензор ранга 3, который можно рассматривать как массив из   матриц Гессе:

 

При   данный тензор вырождается в обычную матрицу Гессе.

Окаймлённый гессиан

править

При решении задачи нахождения условного экстремума функции   с ограничениями

 

где  ,  , для проверки достаточных условий экстремума можно использовать так называемый окаймлённый гессиан функции Лагранжа  , который будет иметь вид[2]

 

Проверка достаточных условий экстремума заключается в вычислении знаков детерминантов определённого набора подматриц окаймлённого гессиана. Именно, если существуют   и   такие, что   и

 

для  , то в точке   функция   имеет строгий условный минимум. Если же

 

для  , то в точке   функция   имеет строгий условный максимум[3].

История

править

Понятие введено Людвигом Отто Гессе (1844), который использовал другое название. Термин «гессиан» был введён Джеймсом Джозефом Сильвестром.

См. также

править

Примечания

править
  1. Гессиан. Дата обращения: 2 апреля 2016. Архивировано 15 апреля 2016 года.
  2. Hallam, Arne Econ 500: Quantitative Methods in Economic Analysis I. Iowa State (7 октября 2004). Дата обращения: 14 апреля 2021. Архивировано 19 апреля 2021 года.
  3. Neudecker, Heinz. Matrix Differential Calculus with Applications in Statistics and Econometrics / Heinz Neudecker, Jan R. Magnus. — New York : John Wiley & Sons, 1988. — P. 136. — ISBN 978-0-471-91516-4.

Ссылки

править
  • Камынин Л.И. Математический анализ. Т. 1, 2. - 2001.
  • Кудрявцев Л.Д «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с. — ISBN 5-9221-0185-4. Или любое другое издание.
  • Голубицкий М., Гийемин В. Устойчивые отображения и их особенности, — М.: Мир, 1977.