Доверительные интервалы: 4 распространенных ошибки

Доверительные интервалы являются ключевой частью логической статистики. Мы можем использовать некоторую вероятность и информацию из распределение вероятностей оценить популяционный параметр с использованием выборки. Заявление доверительный интервал сделано так, что его легко понять неправильно. Мы рассмотрим правильную интерпретацию доверительных интервалов и исследуем четыре ошибки, которые сделаны в этой области статистики.

Что такое доверительный интервал?

Доверительный интервал может быть выражен либо в виде диапазона значений, либо в следующей форме:

Оценить ± Граница ошибки

Доверительный интервал обычно указывается с уровнем достоверности.Общие уровни доверия 90%, 95% и 99%.

Мы рассмотрим пример, в котором мы хотим использовать выборочное среднее значение, чтобы вывести среднее значение популяции. Предположим, что это приводит к доверительному интервалу от 25 до 30. Если мы говорим, что мы на 95% уверены, что неизвестное население жадный содержится в этом интервале, тогда мы действительно говорим, что мы нашли интервал, используя метод, который успешно дает правильные результаты 95% времени. В конечном счете наш метод будет неудачным 5% времени. Другими словами, нам не удастся собрать истинную численность населения только один из каждых 20 раз.

instagram viewer

Ошибка № 1

Теперь мы рассмотрим ряд различных ошибок, которые могут быть допущены при работе с доверительными интервалами. Одно неверное утверждение, которое часто делается о доверительном интервале при уровне достоверности 95%, состоит в том, что существует 95% -ная вероятность того, что доверительный интервал содержит истинное среднее значение популяции.

Причина того, что это ошибка, на самом деле довольно неуловима. Основная идея, относящаяся к доверительному интервалу, заключается в том, что используемая вероятность входит в картину с Метод, который используется при определении доверительного интервала, заключается в том, что он относится к методу, который используемый.

Ошибка № 2

Вторая ошибка - интерпретировать 95-процентный доверительный интервал как указание на то, что 95% всех значений данных в совокупности попадают в этот интервал. Опять же, 95% говорят о методе теста.

Чтобы понять, почему приведенное выше утверждение неверно, мы могли бы рассмотреть нормальное население с среднеквадратичное отклонение 1 и в среднем 5. Выборка, которая имела две точки данных, каждая со значениями 6, имеет среднее значение выборки 6. 95% доверительный интервал для среднего значения по населению будет 4,6-7,4. Это явно не совпадает с 95% нормальное распределение, поэтому он не будет содержать 95% населения.

Ошибка № 3

Третья ошибка заключается в том, что 95% доверительный интервал подразумевает, что 95% всех возможных выборочных средств попадают в диапазон интервала. Пересмотрите пример из последнего раздела. Любая выборка второго размера, состоящая только из значений менее 4,6, будет иметь среднее значение менее 4,6. Таким образом, эти выборочные средства выходят за пределы этого конкретного доверительного интервала Образцы, которые соответствуют этому описанию, составляют более 5% от общей суммы. Поэтому ошибочно утверждать, что этот доверительный интервал охватывает 95% всех выборочных средних.

Ошибка № 4

Четвертая ошибка в работе с доверительными интервалами - думать, что они являются единственным источником ошибок. Хотя с доверительным интервалом существует предел погрешности, существуют и другие места, в которые ошибки могут попасть в статистический анализ. Пара примеров ошибок такого рода может быть из-за неправильного плана эксперимента, смещения в выборке или невозможности получить данные из определенной подгруппы населения.

instagram story viewer