Пример доверительного интервала для дисперсии

Дисперсия населения дает представление о том, как распределить набор данных. К сожалению, обычно невозможно точно знать, что это за популяционный параметр. Чтобы восполнить недостаток знаний, мы используем тему логической статистики, которая называется доверительные интервалы. Мы увидим пример того, как рассчитать доверительный интервал для дисперсии населения.

Формула доверительного интервала

Формула для (1 - α) доверительный интервал о дисперсии населения. Дается следующая строка неравенств:

[ (N - 1)s2] / В < σ2 < [ (N - 1)s2] / .

Вот N размер выборки, s2 выборочная дисперсия. Число является точкой распределения хи-квадрат с N -1 степень свободы, при которой ровно α / 2 площади под кривой находится слева от . Аналогичным образом, число В является точкой того же распределения хи-квадрат с точно α / 2 площади под кривой справа от В.

прелиминарии

Начнем с набора данных с 10 значениями. Этот набор значений данных был получен простой случайной выборкой:

97, 75, 124, 106, 120, 131, 94, 97,96, 102

instagram viewer

Некоторый исследовательский анализ данных будет необходим, чтобы показать, что нет никаких выбросов. Строя ствол и листовой участок мы видим, что эти данные скорее всего из распределения, которое приблизительно нормально распределено. Это означает, что мы можем приступить к нахождению 95% доверительного интервала для дисперсии населения.

Выборочная дисперсия

Нам нужно оценить дисперсию населения с выборочной дисперсией, обозначенной как s2. Итак, начнем с вычисления этой статистики. По сути, мы усредняем сумма квадратов отклонений от среднего. Однако вместо того, чтобы делить эту сумму на N мы делим это на N - 1.

Мы находим, что среднее значение выборки составляет 104,2. Используя это, мы получаем сумму квадратов отклонений от среднего значения, выраженного как:

(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6

Мы делим эту сумму на 10 - 1 = 9, чтобы получить выборочную дисперсию 277.

Распределение хи-квадрат

Теперь перейдем к нашему распределению хи-квадрат. Так как у нас есть 10 значений данных, у нас есть 9 степени свободы. Поскольку нам нужны средние 95% нашего распределения, нам нужно 2,5% в каждом из двух хвостов. Мы обращаемся к таблице хи-квадрат или программному обеспечению и видим, что значения таблиц 2.7004 и 19.023 охватывают 95% площади распределения. Эти цифры и Всоответственно.

Теперь у нас есть все, что нам нужно, и мы готовы установить наш доверительный интервал. Формула для левой конечной точки: [(N - 1)s2] / В. Это означает, что наша левая конечная точка:

(9 х 277) / 19,023 = 133

Правильная конечная точка найдена путем замены В с :

(9 х 277) / 2,7004 = 923

И поэтому мы на 95% уверены, что численность населения колеблется между 133 и 923.

Стандартное отклонение населения

Конечно, поскольку стандартное отклонение является квадратным корнем из дисперсии, этот метод можно использовать для построения доверительного интервала для стандартного отклонения совокупности. Все, что нам нужно сделать, это получить квадратные корни конечных точек. Результатом будет 95% доверительный интервал для среднеквадратичное отклонение.

instagram story viewer