Что такое P-значение

Проверка гипотезы или проверка значимости включают вычисление числа, известного как p-значение. Это число очень важно для заключения нашего теста. Значения P связаны с тестовой статистикой и дают нам оценку доказательств против нулевой гипотезы.

Нулевые и альтернативные гипотезы

Тесты статистической значимости все начинаются с нулевая и альтернативная гипотеза. Нулевая гипотеза - это заявление об отсутствии эффекта или утверждение общепринятого положения дел. Альтернативная гипотеза - это то, что мы пытаемся доказать. Рабочим допущением в тесте на гипотезу является то, что нулевая гипотеза верна.

Тестовая статистика

Предположим, что условия выполнены для конкретного теста, с которым мы работаем. простая случайная выборка дает нам пример данных. Из этих данных мы можем рассчитать статистику теста. Статистика теста сильно варьируется в зависимости от того, к каким параметрам относится наш тест гипотезы. Некоторые общие статистические данные теста включают в себя:

  • Z - статистика для проверки гипотез относительно среднего населения, когда мы знаем стандартное отклонение населения.
  • instagram viewer
  • T - статистика для проверки гипотез относительно среднего населения, когда мы не знаем стандартное отклонение населения.
  • T - статистика для проверки гипотез относительно разницы двух независимых средних значений, когда мы не знаем стандартное отклонение одной из двух групп населения.
  • Z - статистика для проверки гипотез относительно доли населения.
  • Хи-квадрат - статистика для проверки гипотез о разнице между ожидаемым и фактическим количеством для категориальных данных.

Расчет P-значений

Статистика теста полезна, но может быть более полезным назначить p-значение для этой статистики. Значение p - это вероятность того, что если бы нулевая гипотеза была верной, мы бы наблюдали статистику, по крайней мере, такую ​​же экстремальную, как и наблюдаемая. Для расчета значения p мы используем соответствующее программное обеспечение или статистическую таблицу, которая соответствует нашей статистике теста.

Например, мы бы использовали стандартное нормальное распределение при расчете Z тестовая статистика. Значения Z с большими абсолютными значениями (такими, как значения выше 2,5) не очень распространены и дают небольшое значение р. Значения Z которые ближе к нулю, более распространены и дадут гораздо большие значения p.

Интерпретация P-значения

Как мы уже отмечали, p-значение - это вероятность. Это означает, что это действительное число от 0 до 1. В то время как тестовая статистика является одним из способов измерения экстремальности статистики для конкретной выборки, p-значения являются еще одним способом измерения этого.

Когда мы получаем статистическую выборку, мы всегда должны задаться вопросом: «Является ли эта выборка случайной? наедине с истинной нулевой гипотезой или нулевая гипотеза ложная? Если наше р-значение мало, то это может означать одно из двух вещи:

  1. Нулевая гипотеза верна, но нам просто очень повезло в получении нашей наблюдаемой выборки.
  2. Наш пример таков, что нулевая гипотеза неверна.

В общем, чем меньше значение p, тем больше у нас доказательств против нашей нулевой гипотезы.

Насколько мало достаточно мало?

Насколько мало р-значения нам нужно для того, чтобы отвергнуть нулевую гипотезу? Ответ на это: «Это зависит». Общее правило состоит в том, что значение p должно быть меньше или равно 0,05, но в этом значении нет ничего универсального.

Как правило, прежде чем проводить проверку гипотезы, мы выбираем пороговое значение. Если у нас есть какое-либо значение p, которое меньше или равно этому порогу, мы отвергаем нулевую гипотезу. В противном случае мы не сможем отвергнуть нулевую гипотезу. Этот порог называется уровнем значимости нашего теста гипотезы и обозначается греческой буквой альфа. Здесь нет значение альфа это всегда определяет статистическую значимость.

instagram story viewer