Топ питань
Часова шкала
Чат
Перспективи
Пробіт
З Вікіпедії, вільної енциклопедії
Remove ads
У теорії ймовірностей та статистиці про́біт (англ. probit, від англ. probability unit) — це квантильна функція , що відповідає стандартному нормальному розподілу. Її застосовують в аналізі даних і машинному навчанні, зокрема у розвідувальних статистичних графіках та спеціалізованому регресійному моделюванні бінарних змінних відгуку .
![]() | Цю статтю написано занадто професійним стилем зі специфічною термінологією, що може бути незрозумілим для більшості читачів. (червень 2025) |

Математично пробіт — це обернення інтегральної функції стандартного нормального розподілу, яку позначують через , отже пробіт визначають як
- для .
Значною мірою завдяки центральній граничній теоремі, стандартний нормальний розподіл відіграє фундаментальну роль у теорії ймовірностей та статистиці. Якщо врахувати загальновідомий факт, що стандартний нормальний розподіл зосереджує 95 % імовірності між −1.96 і 1.96 і є симетричним відносно нуля, виходить, що
Функція пробіта виконує «обернене» обчислення, повертаючи значення стандартної нормально розподіленої випадкової величини для заданої інтегральної ймовірності. Продовжуючи приклад,
- .
Загалом:
- і
Remove ads
Розвиток концепції
Узагальнити
Перспектива
Ідею функції пробіта опублікував 1934 року Честер Іттнер Блісс у журналі Science у статті про обробку таких даних як відсоток шкідників, знищених пестицидом.[1] Блісс запропонував перетворювати відсоток знищених у англ. "probability unit" (або англ. "probit", «пробіт»), лінійно пов'язаний із сучасним визначенням (він визначив його довільно, як рівний 0 для 0.0001 і 1 для 0.9999):[2]
Ці довільні одиниці ймовірності названо «пробітами» ...
Оригінальний текст (англ.)These arbitrary probability units have been termed "probits" ...
Він додав таблицю для допомоги іншим дослідникам у перетворенні їхніх відсотків знищених у пробіти, які потім можливо було би відкласти навпроти логарифма дози і, як сподівалися, отримати більш-менш пряму лінію. Така так звана пробітова модель і досі є важливою в токсикології, а також в інших галузях. Цей підхід особливо виправданий, якщо дисперсію відгуку можливо пояснити логнормальним розподілом толерантності серед досліджуваних об'єктів, де толерантність конкретного об'єкта — це доза, достатня для отримання потрібного ефекту.
Метод, запропонований Бліссом, було розвинуто далі в книзі Probit Analysis, важливому тексті з токсикологічних застосувань авторства Д. Дж. Фінні .[3][4] Табличні значення, наведені Фінні, можливо отримати з пробітів, як їх визначено тут, додаванням 5. Цю відмінність підсумовує Коллетт (с. 55):[5] «Початкове визначення пробіта [з доданою 5] було створено насамперед для уникнення роботи з від'ємними пробітами; … Це визначення все ще використовують у деяких колах, але в основних статистичних програмних пакунках для так званого про́бітового ана́лізу (англ. probit analysis) пробіти визначають без додавання 5.» Методологію пробітів, включно з чисельною оптимізацією для наближення функції пробіта, запровадили ще до широкого поширення електронних обчислень. При використанні таблиць було зручно мати завжди додатні пробіти. Звичні галузі застосування не вимагають додатних пробітів.
Remove ads
Діагностування відхилення розподілу від нормальності
Окрім того, що вона є основою для важливих типів регресії, функція пробіта корисна в статистичному аналізі для діагностування відхилень від нормального розподілу за допомогою методу графіка Q-Q. Якщо набір даних насправді є вибіркою з нормального розподілу, графік цих значень, відкладених проти відповідних оцінок пробітів, буде приблизно лінійним. Конкретні відхилення від нормальності, як-от асиметрію, важкі хвости чи двомодовість, можливо діагностувати на основі виявляння характерних відхилень від лінійності. Хоча графік Q-Q можливо використовувати для порівняння з будь-яким типом розподілу (не лише нормальним), нормальний графік Q-Q є відносно стандартною процедурою розвідувального аналізу даних, оскільки припущення нормальності часто є відправною точкою аналізу.
Remove ads
Обчислення
Узагальнити
Перспектива
ІФР нормального розподілу та її обернена функція не мають замкненого вигляду, тому їх обчислення вимагає обережного застосування чисельних методів. Водночас, ці функції широко доступні в програмному забезпеченні для статистики та ймовірнісного моделювання, а також у табличних редакторах. Наприклад, у Microsoft Excel функція пробіта доступна як norm.s.inv(p)
. В обчислювальних середовищах, де доступні чисельні втілення оберненої функції похибки, функцію пробіта можливо отримати так:
Одним з прикладів є MATLAB, де доступна функція erfinv
. Мова Mathematica втілює InverseErf
. Інші середовища безпосередньо втілюють функцію пробіта, як показано в наступному сеансі мови програмування R:
> qnorm(0.025)
[1] -1.959964
> pnorm(-1.96)
[1] 0.02499790
Докладну інформацію щодо обчислення оберненої функції похибки можливо знайти в . Вічура пропонує швидкий алгоритм для обчислення функції пробіта з точністю до 16 знаків після коми; саме його втілено в R для породжування випадкових величин для нормального розподілу.[6]
Звичайне диференціальне рівняння для функції пробіта
Інший підхід до обчислення ґрунтується на формуванні нелінійного звичайного диференціального рівняння (ЗДР) для пробіта за методом Штайнбрехера і Шоу.[7] Якщо позначити функцію пробіта через , то це ЗДР:
де — функція густини ймовірності w.
У випадку гауссового розподілу:
Диференціюємо ще раз:
із початковими умовами
Це рівняння можна розв'язати кількома методами, включно з класичним підходом степеневого ряду. Відтак можна побудувати розв'язки довільно високої точності на основі підходу Штайнбрехера до цього ряду для оберненої функції похибки. Розв'язок у вигляді степеневого ряду задається як
де коефіцієнти задовольняють нелінійне рекурентне співвідношення
при . У такому вигляді при .
Remove ads
Логіт
Узагальнити
Перспектива

Тісно пов'язані з функцією пробіта (та пробітовою моделлю ) — функція логіта й логітова модель. Обернення логістичної функції задається як
Аналогічно пробітовій моделі, можна припустити, що така величина лінійно пов'язана з набором предикторів, що дає в результаті логітову модель, яка, зокрема, лежить в основі логістичної регресії — найпоширенішої форми регресійного аналізу для категорійних даних відгуку. У сучасній статистичній практиці пробітові та логітові моделі регресії часто розглядають як випадки узагальненої лінійної моделі .
Remove ads
Див. також
- Графіки компромісу помилок виявлення (англ. detection error tradeoff, DET, альтернатива графікам РХП)
- Логістична регресія (відома також як логітова модель)
- Логіт
- Пробітова модель
- Багатозначний пробіт
- Графік Q-Q
- Неперервна функція
- Монотонна функція
- Квантильна функція
- Сигмоїдна функція
- Рангітовий аналіз, також розроблений Честером Бліссом
- Рідітне оцінювання
Remove ads
Примітки
Посилання
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads