Выведенный статистика получает свое название от того, что происходит в этой отрасли статистики. Вместо того, чтобы просто описать набор данных, логическая статистика стремится сделать вывод о населении на основе статистическая выборка. Одна конкретная цель в выводной статистике включает определение стоимости неизвестного населения параметр. Диапазон значений, который мы используем для оценки этого параметра, называется доверительным интервалом.
Форма доверительного интервала
Доверительный интервал состоит из двух частей. Первая часть - это оценка параметра населения. Мы получаем эту оценку, используя простая случайная выборка. Из этого примера мы вычисляем статистику, которая соответствует параметру, который мы хотим оценить. Например, если бы нас интересовал средний рост всех первоклассников в Соединенных Штатах, мы бы использовать простую случайную выборку первоклассников США, измерить их все, а затем вычислить среднюю высоту нашего образец.
Вторая часть доверительного интервала - это предел погрешности. Это необходимо, поскольку одна наша оценка может отличаться от истинного значения параметра совокупности. Чтобы учесть другие потенциальные значения параметра, нам нужно создать диапазон чисел. Допустимая погрешность делает это, и каждый доверительный интервал имеет следующую форму:
Оценка ± погрешность
Оценка находится в центре интервала, а затем мы вычитаем и добавляем погрешность из этой оценки, чтобы получить диапазон значений для параметра.
Уровень доверия
К каждому доверительному интервалу прикреплен уровень доверия. Это вероятность или процент, который указывает, насколько мы должны быть уверены в нашем доверительном интервале. Если все другие аспекты ситуации идентичны, чем выше уровень достоверности, тем шире доверительный интервал.
Этот уровень доверия может привести к некоторой путанице. Это не утверждение о процедуре отбора проб или населении. Вместо этого он дает представление об успешности процесса построения доверительного интервала. Например, доверительные интервалы с достоверностью 80 процентов в конечном итоге будут пропускать истинный параметр популяции один из каждых пяти раз.
Любое число от нуля до единицы теоретически может быть использовано для уровня достоверности. На практике 90 процентов, 95 процентов и 99 процентов являются общими уровнями доверия.
Граница ошибки
Предел погрешности уровня достоверности определяется парой факторов. Мы можем убедиться в этом, изучив формулу погрешности. Погрешность имеет вид:
Погрешность = (Статистика уровня достоверности) * (Стандартное отклонение / Ошибка)
Статистика уровня достоверности зависит от того, что распределение вероятностей используется и какой уровень доверия мы выбрали. Например, если Снаш уровень доверия, и мы работаем с нормальное распределение, тогда С площадь под кривой между -Z* в Z*. этот номер Z* число в нашей формуле погрешности.
Стандартное отклонение или стандартная ошибка
Другой термин, необходимый в нашей погрешности, - это стандартное отклонение или стандартная ошибка. Стандартное отклонение дистрибутива, с которым мы работаем, здесь предпочтительнее. Однако обычно параметры от населения неизвестны. Это число обычно недоступно при формировании доверительных интервалов на практике.
Чтобы справиться с этой неопределенностью, зная стандартное отклонение, мы вместо этого используем стандартную ошибку. Стандартная ошибка, которая соответствует стандартному отклонению, является оценкой этого стандартного отклонения. Что делает стандартную ошибку настолько мощной, так это то, что она вычисляется из простой случайной выборки, которая используется для расчета нашей оценки. Никакой дополнительной информации не требуется, так как образец делает всю оценку для нас.
Разные доверительные интервалы
Есть множество различных ситуаций, которые требуют доверительных интервалов. Эти доверительные интервалы используются для оценки ряда различных параметров. Хотя эти аспекты различны, все эти доверительные интервалы объединены одним и тем же общим форматом. Некоторые общие доверительные интервалы - это средние значения популяции, дисперсии населения, доли населения, разницы двух средних значений населения и разницы двух пропорций населения.