Одной из основных частей логической статистики является разработка способов расчета доверительные интервалы. Доверительные интервалы дают нам возможность оценить население параметр. Вместо того, чтобы говорить, что параметр равен точному значению, мы говорим, что параметр попадает в диапазон значений. Этот диапазон значений, как правило, является оценкой, наряду с допустимой погрешностью, которую мы добавляем и вычитаем из оценки.
К каждому интервалу прикреплен уровень уверенности. Уровень достоверности дает оценку того, как часто в долгосрочной перспективе метод, используемый для получения нашего доверительного интервала, фиксирует истинный параметр совокупности.
Это полезно при изучении статистики, чтобы увидеть некоторые примеры. Ниже мы рассмотрим несколько примеров доверительных интервалов о среднем по населению. Мы увидим, что метод, который мы используем для построения доверительного интервала о среднем, зависит от дополнительной информации о нашей популяции. В частности, подход, который мы используем, зависит от того, знаем ли мы стандартное отклонение населения или нет.
Постановка проблем
Мы начнем с простой случайной выборки из 25 видов тритонов и определим их хвосты. Средняя длина хвоста нашего образца составляет 5 см.
- Если мы знаем, что 0,2 см - это стандартное отклонение длин хвостов всех тритонов в популяции, то каков 90-процентный доверительный интервал для средней длины хвостов всех тритонов в популяции?
- Если мы знаем, что 0,2 см - это стандартное отклонение длин хвостов всех тритонов в популяции, то каков 95-процентный доверительный интервал для средней длины хвостов всех тритонов в популяции?
- Если мы обнаружим, что эти 0,2 см являются стандартным отклонением длин хвоста тритонов в нашем образце, то есть 90% доверительный интервал для средней длины хвоста всех тритонов в Население?
- Если мы обнаружим, что эти 0,2 см являются стандартным отклонением длин хвоста тритонов в нашем образце, то есть 95% доверительный интервал для средней длины хвоста всех тритонов в Население?
Обсуждение проблем
Мы начнем с анализа каждой из этих проблем. В первых двух проблемах мы знать значение стандартного отклонения населения. Разница между этими двумя проблемами заключается в том, что уровень достоверности выше у # 2, чем у # 1.
Во втором две проблемы стандартное отклонение населения неизвестно. Для этих двух задач мы оценим этот параметр с помощью выборки. среднеквадратичное отклонение. Как мы видели в первых двух проблемах, здесь мы также имеем разные уровни доверия.
Решения
Мы рассчитаем решения для каждой из вышеперечисленных проблем.
- Поскольку мы знаем стандартное отклонение популяции, мы будем использовать таблицу z-показателей. Значение Z что соответствует 90% доверительному интервалу 1,645. Используя формула для погрешности у нас есть доверительный интервал от 5 - 1,645 (0,2 / 5) до 5 + 1,645 (0,2 / 5). (5 в знаменателе здесь, потому что мы взяли квадратный корень из 25). После проведения арифметики мы получаем от 4,934 см до 5,066 см в качестве доверительного интервала для среднего населения.
- Поскольку мы знаем стандартное отклонение популяции, мы будем использовать таблицу z-показателей. Значение Z что соответствует 95% доверительному интервалу 1.96. Используя формулу для предела погрешности, мы получаем доверительный интервал от 5 - 1,96 (0,2 / 5) до 5 + 1,96 (0,2 / 5). После проведения арифметики мы получаем от 4,922 см до 5,078 см в качестве доверительного интервала для среднего населения.
- Здесь мы не знаем стандартное отклонение населения, только выборочное стандартное отклонение. Таким образом, мы будем использовать таблицу t-показателей. Когда мы используем таблицу T баллы нам нужно знать сколько у нас степеней свободы. В этом случае существует 24 степени свободы, что на единицу меньше размера выборки 25. Значение T что соответствует 90% доверительному интервалу 1.71. Используя формулу для предела погрешности, мы получаем доверительный интервал от 5 - 1,71 (0,2 / 5) до 5 + 1,71 (0,2 / 5). После проведения арифметики мы получаем от 4,932 см до 5,068 см в качестве доверительного интервала для среднего населения.
- Здесь мы не знаем стандартное отклонение населения, только выборочное стандартное отклонение. Таким образом, мы снова будем использовать таблицу t-показателей. Существует 24 степени свободы, что на единицу меньше размера выборки 25. Значение T что соответствует 95% доверительному интервалу 2,06. Используя формулу для предела погрешности, мы получаем доверительный интервал от 5 - 2,06 (0,2 / 5) до 5 + 2,06 (0,2 / 5). После проведения арифметики мы получаем от 4,912 см до 5,082 см в качестве доверительного интервала для среднего населения.
Обсуждение решений
При сравнении этих решений следует отметить несколько моментов. Во-первых, в каждом случае, когда наш уровень доверия повышался, Z или T что мы закончили с. Причина этого заключается в том, что для того, чтобы быть более уверенными в том, что мы действительно зафиксировали среднее значение популяции в нашем доверительном интервале, нам нужен более широкий интервал.
Другая особенность, которую следует отметить, заключается в том, что для определенного доверительного интервала те, которые используют T шире, чем те, с Z. Причина этого заключается в том, что T распределение имеет большую изменчивость в своих хвостах, чем стандартное нормальное распределение.
Ключом к правильному решению этих типов проблем является то, что если мы знаем стандартное отклонение населения, мы используем таблицу Z-scores. Если мы не знаем стандартное отклонение населения, то мы используем таблицу T баллы.