При проведении теста значимости или проверка гипотезыЕсть два числа, которые легко спутать. Эти числа легко спутать, потому что они оба числа от нуля до единицы, и обе вероятности. Одно число называется p-значением тестовой статистики. Другое число интереса - уровень значимости или альфа. Мы рассмотрим эти две вероятности и определим разницу между ними.
Альфа-ценности
Число альфа это пороговое значение, которое мы измеряем р-значение против. Он говорит нам, насколько экстремальными должны быть наблюдаемые результаты, чтобы отклонить нулевую гипотезу теста значимости.
Значение альфа связано с уровнем достоверности нашего теста. Ниже перечислены некоторые уровни достоверности с соответствующими значениями альфа:
- Для результатов с уровнем достоверности 90 процентов значение альфа составляет 1 - 0,90 = 0,10.
- Для результатов с 95 процентами уровень довериязначение альфа составляет 1 - 0,95 = 0,05.
- Для результатов с уровнем достоверности 99 процентов значение альфа составляет 1 - 0,99 = 0,01.
- И вообще, для результатов с доверительным уровнем C, значение альфа равно 1 - C / 100.
Хотя в теории и на практике многие числа могут быть использованы для альфа, наиболее часто используется 0,05. Причина этого заключается в том, что консенсус показывает, что этот уровень является подходящим во многих случаях, и исторически он был принят в качестве стандарта. Однако во многих случаях следует использовать меньшее значение альфа. Там нет ни одного значения альфа это всегда определяет статистическую значимость.
Альфа-значение дает нам вероятность ошибка типа I. Ошибки типа I возникают, когда мы отвергаем нулевую гипотезу, которая на самом деле верна. Таким образом, в конечном итоге, для теста с уровень значимости 0,05 = 1/20, истинная нулевая гипотеза будет отвергнута одна из каждых 20 раз.
P-значение
Другое число, которое является частью критерия значимости, является p-значением. Значение p также является вероятностью, но оно исходит из другого источника, чем альфа. Каждая тестовая статистика имеет соответствующую вероятность или р-значение. Это значение является вероятностью того, что наблюдаемая статистика произошла случайно, предполагая, что нулевая гипотеза верна.
Поскольку существует ряд различных статистических данных о тестах, существует несколько различных способов найти значение p. В некоторых случаях нам нужно знать распределение вероятностей населения.
Значение p тестовой статистики - это способ сказать, насколько экстремальной является эта статистика для наших выборочных данных. Чем меньше значение p, тем более маловероятно наблюдаемый образец.
Разница между P-значением и альфа
Чтобы определить, является ли наблюдаемый результат статистически значимым, мы сравниваем значения альфа и р-значения. Появляются две возможности:
- Значение р меньше или равно альфа. В этом случае мы отвергаем нулевую гипотезу. Когда это происходит, мы говорим, что результат является статистически значимым. Другими словами, мы достаточно уверены, что есть что-то, кроме одного случая, которое дало нам наблюдаемую выборку.
- Значение р больше, чем альфа. В этом случае мы не можем отклонить нулевая гипотеза. Когда это происходит, мы говорим, что результат не является статистически значимым. Другими словами, мы достаточно уверены, что наши наблюдаемые данные могут быть объяснены только случайностью.
Следствием вышесказанного является то, что чем меньше значение альфа, тем сложнее утверждать, что результат является статистически значимым. С другой стороны, чем больше значение альфа, тем легче утверждать, что результат является статистически значимым. Однако с этим связана более высокая вероятность того, что то, что мы наблюдали, можно отнести к случайности.