Топ питань
Часова шкала
Чат
Перспективи

Поточкова взаємна інформація

З Вікіпедії, вільної енциклопедії

Remove ads

Пото́чкова взає́мна інформа́ція (ПВІ, англ. pointwise mutual information, PMI),[1] або то́чкова взає́мна інформа́ція (англ. point mutual information) — це міра пов'язаності, що використовується в теорії інформації та статистиці. На відміну від взаємної інформації (ВІ), що будується на ПВІ, вона стосується одиничних подій, тоді як ВІ стосується усереднення всіх можливих подій.

Remove ads

Визначення

Узагальнити
Перспектива

ПВІ пари результатів x та y, що належать дискретним випадковим змінним X та Y, дає кількісну оцінку розбіжності між імовірністю їхнього збігу за заданого їхнього спільного розподілу, та їхніми особистими розподілами за умови їхньої незалежності. Математично:

Взаємна інформація (ВІ) випадкових змінних X та Y є математичним сподіванням значення ПВІ над усіма можливими результатами (по відношенню до спільного розподілу ).

Ця міра є симетричною (). Вона може набувати додатних та від'ємних значень, але є нульовою, якщо X та Y є незалежними. Зауважте, що хоча ПВІ й може бути додатною або від'ємною, її математичне сподівання над усіма спільними подіями (ВІ) є додатним. ПВІ досягає максимуму тоді, коли X та Y є цілком пов'язаними (тобто, або ), даючи наступні межі:

Нарешті, збільшуватиметься за незмінної , але зменшуваної .

Ось приклад для ілюстрації:

Більше інформації x, y ...

Використовуючи цю таблицю, ми можемо здійснити відособлювання, щоби отримати наступну додаткову таблицю для особистих розподілів:

Більше інформації p(x), p(y) ...

У цьому прикладі ми можемо обчислити чотири значення . Із застосуванням логарифмів за основою 2:

pmi(x=0;y=0)=1
pmi(x=0;y=1)=0.222392
pmi(x=1;y=0)=1.584963
pmi(x=1;y=1)=-1.584963

(Для довідки, взаємною інформацією тоді буде 0.2141709)

Remove ads

Схожості зі взаємною інформацією

Узагальнити
Перспектива

Поточкова взаємна інформація має багато відношень, однакових зі взаємною інформацією. Зокрема,

де є власною інформацією, або .

Remove ads

Нормалізована поточкова взаємна інформація (НПВІ)

Поточкову взаємну інформацію може бути нормалізовано в проміжку [-1,+1], що дає в результаті -1 (у границі) для спільної появи ніколи, 0 — для незалежності та +1 — для цілковито спільної появи[en].[2]

Варіанти ПВІ

На додачу до наведеної вище НПВІ, ПВІ має багато інших цікавих варіантів. Порівняльне дослідження цих варіантів можна знайти в [3]

Ланцюгове правило для ПВІ

Узагальнити
Перспектива

Як і взаємна інформація,[4] поточкова взаємна інформація слідує ланцюговому правилу, тобто,

Це може бути легко доведено як

Remove ads

Застосування

Узагальнити
Перспектива

В математичній лінгвістиці ПВІ використовували для знаходження сполучень та пов'язаності слів. Наприклад, підрахунок[en] появ та спільних появ[en] слів у корпусі текстів можна використовувати для наближення ймовірностей та відповідно. Наступна таблиця показує кількості пар слів, що отримали найвищі та найнижчі рівні ПВІ у перших 50 мільйонах слів англомовної Вікіпедії (дамп від жовтня 2015 року), відфільтрованих за 1 000 чи більше спільних появ. Частоту кожної з кількостей можна отримати діленням її значення на 50 000 952. (Зауваження: в цьому прикладі для обчислення значень ПВІ використано натуральний логарифм замість логарифму за основою 2)

Більше інформації слово 1, слово 2 ...

Добре сполучені пари мають високу ПВІ, оскільки ймовірність спільної появи є лише трошки нижчою за ймовірності появи кожного зі слів. З іншого боку, пара слів, ймовірності появи яких є значно вищими за ймовірність їхньої спільної появи, отримує низький рівень ПВІ.

Remove ads

Примітки

Література

Посилання

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads