f-дивергенция

f-дивергенцией (f-расхождением) называется класс функционалов , определяющих в общем случае несимметричную меру расхождения между двумя распределениями вероятностей и . Обычно применяется в теории информации и теории вероятностей. Функционал однозначно определяется (порождается) функцией , удовлетворяющей определённым условиям.

Данный класс дивергенций был введён и изучался независимо друг от друга учёными Чисара[1], Моримото[2], а также Али и Силви[3]. Поэтому иногда можно встретить названия f-дивергенция Чисара, дивергенция Чисара—Моримото или расстояние Али—Силви.

Определение

править

Пусть   и   — распределения вероятностей, заданные на множестве  , такие что   абсолютно непрерывно по отношению к  . Пусть функция   выпукла при   и  . Тогда функция   задаёт f-дивергенцию   относительно   следующим образом:

 

Если   — любая мера на  , и оба распределения   и   непрерывны относительно  , т.е. существуют функции   и  , тогда f-дивергенция может быть записана как

 

В случае лебеговой меры   распределения имеют плотности   и  , тогда f-дивергенция принимает вид

 

Для дискретных распределений   и  , где  ,

 

Функция   определена с точностью до слагаемого  , где   — произвольная константа. Действительно, вид f-дивергенции не зависит от выбора  , поскольку слагаемое   функции   даёт нулевой вклад в значение интеграла. Кроме того, функция   может содержать положительную мультипликативную константу  , которая определяет единицу измерения дивергенции. В связи с этим некоторые авторы (например, Бассевиль[4]) указывают дополнительные ограничения, налагаемые на функцию  :

 
 

Первое из этих ограничений фиксирует константу  , второе — константу  . Условие   может быть полезно тем, что в этом случае   с минимумом в точке   (см. Лизе и Вайда[5]), и выражение для f-дивергенции интуитивно проще воспринимается. Однако такой способ конкретизировать функцию   не всегда удобен: например, для существования непрерывной версии f-энтропии, связанной с данной f-дивергенцией, может потребоваться другое значение константы  .

f-дивергенция может быть разложена в ряд Тейлора и записана в виде взвешенной суммы расстояний χ-типа (см. Нильсен и Нок[6]).

Частные случаи f-дивергенции

править

Многие известные дивергенции, такие как дивергенция Кульбака—Лейблера, квадрат расстояния Хеллингера, расстояние хи-квадрат и ряд других, являются частными случаями f-дивергенции, которым соответствует определённый выбор функции  . В следующей таблице приведены некоторые распространённые виды дивергенций между распределениями вероятностей и соответствующая им функция   (см. Лизе и Вайда[5]).

Дивергенция Порождающая функция  
Дивергенция Кульбака—Лейблера  
Обратная Дивергенция Кульбака—Лейблера  
Квадрат расстояния Хеллингера  
Расстояние полной вариации  
Расстояние   Пирсона  
Расстояние   Неймана  
Альфа-дивергенция  
Альфа-дивергенция (другие обозначения)  

Свойства

править
  • Неотрицательность: ƒ-дивергенция всегда неотрицательна, и равна нулю, только если распределения   и   совпадают. Это непосредственно следует из неравенства Йенсена:
     
  • Монотонность: если   — произвольная переходная вероятность, которая переводит меры   и   соответственно в   и  , тогда
     
    Равенство здесь имеет место тогда и только тогда, когда переход порождается достаточной статистикой по отношению к  .
  • Совместная выпуклость: для любого  
     
    Это следует из выпуклости отображения   на  .
  • Самодвойственность: если   является f-дивергенцией, то   тоже является f-дивергенцией, т.е. класс f-дивергенций содержит как прямые, так и обратные (двойственные) дивергенции. Действительно,
     
    где   — двойственная порождающая функция. Нетрудно видеть, что  ,   непрерывна (кроме, быть может, точки  ) и   почти всюду на   в силу выпуклости  , т.е. функция   удовлетворяет условиям порождающей функции f-дивергенции.

С учётом последнего свойства класс f-дивергенций можно было бы эквивалентным образом определить как  . Подобное определение встречается, например, у Чжана[7]. Таким образом, интерпретация распределения   как истинного, которая следует из определения f-дивергенции, не является её фундаментальным свойством, а является лишь следствием соглашения о порядке следования аргументов в определении. Иными словами, аргументы   и   концептуально равноправны.

f-дивергенция является безразмерной величиной независимо от размерности множества  .

Связанные понятия

править

Кроме f-дивергенции, И. Чисар определил связанное с ней понятие f-энтропии (Чисар[8]).

Примечания

править

Литература

править