Проверка гипотезы или проверка значимости включают вычисление числа, известного как p-значение. Это число очень важно для заключения нашего теста. Значения P связаны с тестовой статистикой и дают нам оценку доказательств против нулевой гипотезы.
Нулевые и альтернативные гипотезы
Тесты статистической значимости все начинаются с нулевая и альтернативная гипотеза. Нулевая гипотеза - это заявление об отсутствии эффекта или утверждение общепринятого положения дел. Альтернативная гипотеза - это то, что мы пытаемся доказать. Рабочим допущением в тесте на гипотезу является то, что нулевая гипотеза верна.
Тестовая статистика
Предположим, что условия выполнены для конкретного теста, с которым мы работаем. простая случайная выборка дает нам пример данных. Из этих данных мы можем рассчитать статистику теста. Статистика теста сильно варьируется в зависимости от того, к каким параметрам относится наш тест гипотезы. Некоторые общие статистические данные теста включают в себя:
- Z - статистика для проверки гипотез относительно среднего населения, когда мы знаем стандартное отклонение населения.
- T - статистика для проверки гипотез относительно среднего населения, когда мы не знаем стандартное отклонение населения.
- T - статистика для проверки гипотез относительно разницы двух независимых средних значений, когда мы не знаем стандартное отклонение одной из двух групп населения.
- Z - статистика для проверки гипотез относительно доли населения.
- Хи-квадрат - статистика для проверки гипотез о разнице между ожидаемым и фактическим количеством для категориальных данных.
Расчет P-значений
Статистика теста полезна, но может быть более полезным назначить p-значение для этой статистики. Значение p - это вероятность того, что если бы нулевая гипотеза была верной, мы бы наблюдали статистику, по крайней мере, такую же экстремальную, как и наблюдаемая. Для расчета значения p мы используем соответствующее программное обеспечение или статистическую таблицу, которая соответствует нашей статистике теста.
Например, мы бы использовали стандартное нормальное распределение при расчете Z тестовая статистика. Значения Z с большими абсолютными значениями (такими, как значения выше 2,5) не очень распространены и дают небольшое значение р. Значения Z которые ближе к нулю, более распространены и дадут гораздо большие значения p.
Интерпретация P-значения
Как мы уже отмечали, p-значение - это вероятность. Это означает, что это действительное число от 0 до 1. В то время как тестовая статистика является одним из способов измерения экстремальности статистики для конкретной выборки, p-значения являются еще одним способом измерения этого.
Когда мы получаем статистическую выборку, мы всегда должны задаться вопросом: «Является ли эта выборка случайной? наедине с истинной нулевой гипотезой или нулевая гипотеза ложная? Если наше р-значение мало, то это может означать одно из двух вещи:
- Нулевая гипотеза верна, но нам просто очень повезло в получении нашей наблюдаемой выборки.
- Наш пример таков, что нулевая гипотеза неверна.
В общем, чем меньше значение p, тем больше у нас доказательств против нашей нулевой гипотезы.
Насколько мало достаточно мало?
Насколько мало р-значения нам нужно для того, чтобы отвергнуть нулевую гипотезу? Ответ на это: «Это зависит». Общее правило состоит в том, что значение p должно быть меньше или равно 0,05, но в этом значении нет ничего универсального.
Как правило, прежде чем проводить проверку гипотезы, мы выбираем пороговое значение. Если у нас есть какое-либо значение p, которое меньше или равно этому порогу, мы отвергаем нулевую гипотезу. В противном случае мы не сможем отвергнуть нулевую гипотезу. Этот порог называется уровнем значимости нашего теста гипотезы и обозначается греческой буквой альфа. Здесь нет значение альфа это всегда определяет статистическую значимость.