Не все результаты проверки гипотезы равны. проверка гипотезы или критерий статистической значимости, как правило, имеет определенный уровень значимости. Этот уровень значимости является числом, которое обычно обозначается Греческая буква альфа. Один вопрос, который возникает в классе статистики: «Какое значение альфа следует использовать для проверки гипотез?»
Ответ на этот вопрос, как и во многих других вопросах статистики: «Это зависит от ситуации». Мы рассмотрим, что мы подразумеваем под этим. Многие журналы в разных дисциплинах определяют, что статистически значимыми являются результаты, для которых альфа равна 0,05 или 5%. Но главное, на что следует обратить внимание, это то, что не существует универсального значения альфа, которое следует использовать для всех статистические тесты.
Часто используемые значения Уровни значимости
Число, представленное альфа, является вероятностью, поэтому оно может принимать значение любого неотрицательного настоящий номер меньше одного Хотя теоретически любое число от 0 до 1 может использоваться для альфа, в статистической практике это не так. Из всех уровней значимости значения 0,10, 0,05 и 0,01 являются наиболее часто используемыми для альфа. Как мы увидим, могут быть причины для использования значений альфа, отличных от наиболее часто используемых чисел.
Уровень значимости и ошибки типа I
Одно соображение относительно значения «один размер подходит всем» для альфы связано с тем, какова вероятность этого числа. Уровень значимости проверки гипотезы в точности равен вероятности Ошибка типа I. Ошибка типа I состоит из неправильно отвергая нулевая гипотеза когда нулевая гипотеза действительно верна. Чем меньше значение альфа, тем менее вероятно, что мы отвергаем истинную нулевую гипотезу.
Существуют разные случаи, когда более приемлемо иметь ошибку типа I. Более высокое значение альфа, даже одно больше 0,10, может быть целесообразным, когда меньшее значение альфа приводит к менее желательному результату.
При медицинском обследовании на заболевание рассмотрите возможности теста, который ложно дает положительный результат теста на болезнь, и теста, который ложно дает отрицательный результат на заболевание. Ложный положительный результат вызовет беспокойство для нашего пациента, но приведет к другим тестам, которые определят, что вердикт нашего теста действительно был неверным. Ложное отрицание даст нашему пациенту неверное предположение, что у него нет болезни, когда он на самом деле. В результате болезнь не лечится. Если бы у нас был выбор, мы бы предпочли условия, которые приводят к ложному положительному результату, а не к ложному отрицательному.
В этой ситуации мы с радостью примем большее значение для альфа, если это приведет к снижению вероятности ложного отрицания.
Уровень значимости и P-значения
Уровень значимости - это значение, которое мы устанавливаем для определения статистической значимости. Это в конечном итоге является стандартом, по которому мы измеряем вычисленное значение p нашей тестовой статистики. Сказать, что результат является статистически значимым на уровне альфа, просто означает, что значение р меньше, чем альфа. Например, для значения альфа = 0,05, если значение р больше 0,05, мы не можем отклонить нулевую гипотезу.
Есть несколько случаев, когда нам понадобится очень маленький р-значение отвергнуть нулевую гипотезу. Если наша нулевая гипотеза касается чего-то, что широко признано истинным, то должно быть большое количество доказательств в пользу отклонения нулевой гипотезы. Это обеспечивается значением p, которое намного меньше, чем обычно используемые значения для альфа.
Вывод
Не существует единственного значения альфа, определяющего статистическую значимость. Хотя числа, такие как 0,10, 0,05 и 0,01, являются значениями, обычно используемыми для альфа, переопределения не существует математическая теорема это говорит о том, что это единственные уровни значимости, которые мы можем использовать. Как и во многих вещах в статистике, мы должны подумать, прежде чем рассчитывать и, прежде всего, использовать здравый смысл