Лучшие вопросы

Таймлайн

Чат

Перспективы

P-значение

величина, используемая при тестировании статистических гипотез Из Википедии, свободной энциклопедии

Remove ads

P-значение (англ. P-value), p-уровень значимости, p-критерий — вероятность получить для данной вероятностной модели распределения значений случайной величины такое же или более экстремальное значение статистики (среднего арифметического, медианы и др.), по сравнению с ранее наблюдаемым, при условии, что нулевая гипотеза верна.

Особенностью P-значений является их неустойчивость на эквивалентных выборках, что может стать препятствием для воспроизводимости результатов эксперимента^[1]^[2]^[3]. Альтернативы использованию P-значений включают такие методы, как статистика оценки и коэффициент Байеса^[4]^[5]^[6].

Remove ads

Формальное определение и процедура тестирования

Суммиров вкратце

Перспектива

Thumb — Пример вычисления P-значения. Вертикальная координата — плотность вероятности каждого результата, вычисленная для нулевой гипотезы $H_{0}$ . Величина P-значения — область под кривой, ограниченной по оси абсцисс наблюдаемой точкой данных.

Пусть $T(X)$ — статистика, используемая при тестировании некоторой нулевой гипотезы $H_{0}$ . Предполагается, что если нулевая гипотеза справедлива, то распределение этой статистики известно. Обозначим функцию распределения $F(t)=P(T<t)$ . P-значение чаще всего (при проверке правосторонней альтернативы) определяется как:

$P(t)=P(T>t)=1-F(t)$

При проверке левосторонней альтернативы,

$P_{0}(t)=P(T<t)=F(t)$

В случае двустороннего теста p-значение равно:

$P(t)=2\min(P_{0},P)$

Если p(t) меньше заданного уровня значимости, то нулевая гипотеза отвергается в пользу альтернативной. В противном случае она не отвергается.

Преимуществом данного подхода является то, что видно при каком уровне значимости нулевая гипотеза будет отвергнута, а при каких принята, то есть виден уровень надежности статистических выводов, точнее вероятность ошибки при отвержении нулевой гипотезы. При любом уровне значимости больше $p$ нулевая гипотеза отвергается, а при меньших значениях — нет.

Remove ads

Критика

Использование p-значений для проверки нулевых гипотез в работах по медицине, естественным наукам подвергается критике со стороны многих специалистов. Отмечается, что их использование нередко приводят к ошибкам первого рода (ложноположительным заключениям)^[7]. В частности, журнал Basic and Applied Social Psychology (BASP) в 2015 году вовсе запретил публикацию статей, в которых используются p-значения. Редакторы журнала объяснили это тем, что провести исследование, в котором получено p < 0,05, не очень сложно, и такие низкие значения p слишком часто становятся оправданием для низкокачественных исследований^[8].

Remove ads

Неправильная интерпретация P-значений

Широко распространено мнение о том, что P-значения часто неверно интерпретируются и неправильно используются^[9]^[10]^[11]. Одна из практик, подвергшихся особой критике, заключается в принятии альтернативной гипотезы для любого P-значения, номинально меньшего 0,05 без других подтверждающих доказательств. Хотя P-значения полезны при оценке того, насколько несовместимы данные с данной статистической моделью, необходимо также учитывать контекстуальные факторы, такие как «дизайн исследования, качество измерений, внешние доказательства изучаемого явления и обоснованность предположений, лежащих в основе анализа данных»^[11]. Еще одна проблема заключается в том, что P-значение часто неверно понимается как вероятность того, что нулевая гипотеза верна^[11]^[12]. Некоторые специалисты предложили заменить P-значения на альтернативные метрики доказательности^[11], такие как доверительный интервал^[13]^[14], отношение правдоподобий^[15]^[16] или коэффициент Байеса^[17]^[18]^[19], однако продолжается острая дискуссия о возможности применения таких альтернатив^[20]^[21]. Другие специалисты предложили убрать фиксированные пороговые значения значимости и интерпретировать P-значения как непрерывные величины, характеризующие величину доказательств, направленных против правдоподобия нулевой гипотезы^[22]^[23].

См. также

Примечания

Loading content...

Литература

Loading content...

Ссылки

Loading content...

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads

Remove ads