Лучшие вопросы
Таймлайн
Чат
Перспективы

Критерий согласия Пирсона

Из Википедии, свободной энциклопедии

Remove ads

Критерий согласия Пирсона или критерий согласия (хи-квадрат) — непараметрический метод, который позволяет оценить значимость различий между фактическим (выявленным в результате исследования) количеством исходов или качественных характеристик выборки, попадающих в каждую категорию, и теоретическим количеством, которое можно ожидать в изучаемых группах при справедливости нулевой гипотезы. Выражаясь проще, метод позволяет оценить статистическую значимость различий двух или нескольких относительных показателей (частот, долей).

Является наиболее часто употребляемым критерием для проверки гипотезы о принадлежности наблюдаемой выборки объёмом некоторому теоретическому закону распределения .

Критерий хи-квадрат для анализа таблиц сопряжённости был разработан и предложен в 1900 году основателем математической статистики английским учёным Карлом Пирсоном.

Критерий может использоваться при проверке простых гипотез вида

где  — известный вектор параметров теоретического закона, и при проверке сложных гипотез вида

когда оценка скалярного или векторного параметра распределения вычисляется по той же самой выборке.

Remove ads

Статистика критерия

Суммиров вкратце
Перспектива

Процедура проверки гипотез с использованием критериев типа предусматривает группирование наблюдений. Область определения случайной величины разбивают на непересекающихся интервалов необязательно одинаковой длины, которые задаются граничными точками

где  — нижняя грань области определения случайной величины;  — верхняя грань.

  • количество интервалов должно быть не менее 8 (если число параметров больше 7, то требуется большее количество интервалов . Однако, чаще всего , когда распределение определяется двумя параметрами - средним значением и параметром разброса );
  • в каждый интервал должно попасть не менее 7-8 значений, желательно одинаковое количество;
  • если область определения бесконечна, то в качестве крайних интервалов берутся полупрямые.

В соответствии с заданным разбиением подсчитывают число выборочных значений, попавших в -й интервал, и вероятности попадания в интервал

соответствующие теоретическому закону с функцией распределения

При этом

и

При проверке простой гипотезы известны как вид закона , так и все его параметры (известен скалярный или векторный параметр ).

В основе статистик, используемых в критериях согласия типа , лежит измерение отклонений от .

Статистика критерия согласия Пирсона определяется соотношением

В случае проверки простой гипотезы, в пределе при эта статистика подчиняется -распределению с степенями свободы, если верна проверяемая гипотеза . Плотность -распределения, которое является частным случаем гамма-распределения, описывается формулой

Проверяемая гипотеза отклоняется при больших значениях статистики, когда вычисленное по выборке значение статистики больше критического значения

или достигнутый уровень значимости (p-значение) меньше заданного уровня значимости (заданной вероятности ошибки 1-го рода) .

Remove ads

Проверка сложных гипотез

При проверке сложных гипотез, если параметры закона по этой же выборке оцениваются в результате минимизации статистики или по сгруппированной выборке методом максимального правдоподобия, то статистика при справедливости проверяемой гипотезы подчиняется -распределению с степенями свободы, где  — количество оценённых по выборке параметров.

Если параметры оцениваются по исходной негруппированной выборке, то распределение статистики не будет являться -распределением[1]. Более того, распределения статистики при справедливости гипотезы будут зависеть от способа группирования, то есть от того, как область определения разбивается на интервалы[2].

При оценивании методом максимального правдоподобия параметров по негруппированной выборке можно воспользоваться модифицированными критериями типа [3][4][5][6].

Remove ads

О мощности критерия

При использовании критериев согласия, как правило, не задают конкурирующих гипотез: рассматривается принадлежность выборки конкретному закону, а в качестве конкурирующей гипотезы — принадлежность любому другому. Естественно, что критерий по-разному будет способен отличать от закона, соответствующего , близкие или далёкие от него законы. Если задать конкурирующую гипотезу и соответствующий ей некоторый конкурирующий закон , то можно рассуждать уже об ошибках двух видов: не только об ошибке 1-го рода (отклонении проверяемой гипотезы при её справедливости) и вероятности этой ошибки , но и об ошибке 2-го рода (неотклонении при справедливости ) и вероятности этой ошибки .

Мощность критерия по отношению к конкурирующей гипотезе характеризуется величиной . Критерий тем лучше распознаёт пару конкурирующих гипотез и , чем выше его мощность.

Мощность критерия согласия Пирсона существенно зависит от способа группирования[7][8] и от выбранного числа интервалов[8][9].

При асимптотически оптимальном группировании, при котором максимизируются различные функционалы от информационной матрицы Фишера по группированным данным (минимизируются потери, связанные с группированием), критерий согласия Пирсона обладает максимальной мощностью относительно «(очень) близких» конкурирующих гипотез[10][8][9].

При проверке простых гипотез и использовании асимптотически оптимального группирования критерий согласия Пирсона имеет преимущество в мощности по сравнению с непараметрическими критериями согласия. При проверке сложных гипотез мощность непараметрических критериев возрастает и такого преимущества нет[11][12]. Однако для любой пары конкурирующих гипотез (конкурирующих законов) за счёт выбора числа интервалов и способа разбиения области определения случайной величины на интервалы можно максимизировать мощность критерия[13].

Remove ads

См. также

Примечания

Литература

См. также

Ссылки

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads