Лучшие вопросы
Таймлайн
Чат
Перспективы
F-дивергенция
Из Википедии, свободной энциклопедии
Remove ads
f-дивергенцией (f-расхождением) называется класс функционалов , определяющих в общем случае несимметричную меру расхождения между двумя распределениями вероятностей и . Обычно применяется в теории информации и теории вероятностей. Функционал однозначно определяется (порождается) функцией , удовлетворяющей определённым условиям.
Данный класс дивергенций был введён и изучался независимо друг от друга учёными Чисара[1], Моримото[2], а также Али и Силви[3]. Поэтому иногда можно встретить названия f-дивергенция Чисара, дивергенция Чисара—Моримото или расстояние Али—Силви.
Remove ads
Определение
Суммиров вкратце
Перспектива
Пусть и — распределения вероятностей, заданные на множестве , такие что абсолютно непрерывно по отношению к . Пусть функция выпукла при и . Тогда функция задаёт f-дивергенцию относительно следующим образом:
Если — любая мера на , и оба распределения и непрерывны относительно , т.е. существуют функции и , тогда f-дивергенция может быть записана как
В случае лебеговой меры распределения имеют плотности и , тогда f-дивергенция принимает вид
Для дискретных распределений и , где ,
Функция определена с точностью до слагаемого , где — произвольная константа. Действительно, вид f-дивергенции не зависит от выбора , поскольку слагаемое функции даёт нулевой вклад в значение интеграла. Кроме того, функция может содержать положительную мультипликативную константу , которая определяет единицу измерения дивергенции. В связи с этим некоторые авторы (например, Бассевиль[4]) указывают дополнительные ограничения, налагаемые на функцию :
Первое из этих ограничений фиксирует константу , второе — константу . Условие может быть полезно тем, что в этом случае с минимумом в точке (см. Лизе и Вайда[5]), и выражение для f-дивергенции интуитивно проще воспринимается. Однако такой способ конкретизировать функцию не всегда удобен: например, для существования непрерывной версии f-энтропии, связанной с данной f-дивергенцией, может потребоваться другое значение константы .
f-дивергенция может быть разложена в ряд Тейлора и записана в виде взвешенной суммы расстояний χ-типа (см. Нильсен и Нок[6]).
Remove ads
Частные случаи f-дивергенции
Многие известные дивергенции, такие как дивергенция Кульбака—Лейблера, квадрат расстояния Хеллингера, расстояние хи-квадрат и ряд других, являются частными случаями f-дивергенции, которым соответствует определённый выбор функции . В следующей таблице приведены некоторые распространённые виды дивергенций между распределениями вероятностей и соответствующая им функция (см. Лизе и Вайда[5]).
Remove ads
Свойства
- Неотрицательность: ƒ-дивергенция всегда неотрицательна, и равна нулю, только если распределения и совпадают. Это непосредственно следует из неравенства Йенсена:
- Монотонность: если — произвольная переходная вероятность, которая переводит меры и соответственно в и , тогда
- Совместная выпуклость: для любого
- Самодвойственность: если является f-дивергенцией, то тоже является f-дивергенцией, т.е. класс f-дивергенций содержит как прямые, так и обратные (двойственные) дивергенции. Действительно,
С учётом последнего свойства класс f-дивергенций можно было бы эквивалентным образом определить как . Подобное определение встречается, например, у Чжана[7]. Таким образом, интерпретация распределения как истинного, которая следует из определения f-дивергенции, не является её фундаментальным свойством, а является лишь следствием соглашения о порядке следования аргументов в определении. Иными словами, аргументы и концептуально равноправны.
f-дивергенция является безразмерной величиной независимо от размерности множества .
Remove ads
Связанные понятия
Кроме f-дивергенции, И. Чисар определил связанное с ней понятие f-энтропии (Чисар[8]).
Примечания
Литература
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads