Тест на пригодность по хи-квадрату

критерий пригодности хи-квадрат является вариацией более общего критерия хи-квадрат. Параметр для этого теста - это единичная категориальная переменная, которая может иметь много уровней. Часто в этой ситуации мы имеем в виду теоретическую модель для категориальной переменной. С помощью этой модели мы ожидаем, что определенные доли населения попадут в каждый из этих уровней. Проверка пригодности определяет, насколько хорошо ожидаемые пропорции в нашей теоретической модели соответствуют реальности.

Мы начинаем с категориальной переменной с N уровни и пусть пя быть доля населения на уровне я. Наша теоретическая модель имеет значения Qя для каждой из пропорций. Утверждение нулевой и альтернативной гипотезы следующие:

Для проверки пригодности у нас есть теоретическая модель того, как наши данные должны быть пропорциональны. Мы просто умножаем эти пропорции на размер выборки N чтобы получить наши ожидаемые результаты.

Статистика хи-квадрат для проверки пригодности определяется путем сравнения фактических и ожидаемых значений для каждого уровня нашей категориальной переменной. Шаги для вычисления статистики хи-квадрат для проверки пригодности следующие:

instagram viewer

Если наша теоретическая модель полностью соответствует наблюдаемым данным, то ожидаемые значения не будут отклоняться от наблюдаемых значений нашей переменной. Это будет означать, что у нас будет статистика хи-квадрат, равная нулю. В любой другой ситуации статистика хи-квадрат будет положительным числом.

Рассчитанная нами статистика хи-квадрат соответствует определенному месту в распределении хи-квадрат с соответствующим числом степеней свободы. р-значение определяет вероятность получения тестовой статистики этой крайности, предполагая, что нулевая гипотеза верна. Мы можем использовать таблицу значений для распределения хи-квадрат, чтобы определить p-значение нашей проверки гипотезы. Если у нас есть статистическое программное обеспечение, это можно использовать для получения более точной оценки p-значения.

Мы принимаем решение о том, следует ли отвергать нулевую гипотезу на основе заранее определенного уровня значимости. Если наше значение p меньше или равно этому уровню значимости, мы отвергаем нулевую гипотезу. В противном случае мы не отклонить нулевая гипотеза.

instagram story viewer