Различия между населением и образцом стандартных отклонений

При рассмотрении стандартных отклонений может быть сюрпризом то, что на самом деле есть два, которые можно рассмотреть. Существует стандартное отклонение популяции и выборочное стандартное отклонение. Мы будем различать два из них и выделять их различия.

Качественные отличия

Хотя оба стандартных отклонения измеряют изменчивость, существуют различия между популяцией и стандартное отклонение образца. Первое связано с различием между статистика и параметры. Стандартное отклонение населения - это параметр, который является фиксированной величиной, рассчитанной для каждого человека в популяции.

Примером стандартного отклонения является статистика. Это означает, что он рассчитывается только от некоторых людей в популяции. Поскольку стандартное отклонение образца зависит от образца, оно имеет большую изменчивость. Таким образом, стандартное отклонение выборки больше, чем у населения.

Количественная разница

Мы увидим, как эти два типа стандартных отклонений численно отличаются друг от друга. Для этого мы рассмотрим формулы как для стандартного отклонения выборки, так и для стандартного отклонения населения.

instagram viewer

Формулы для расчета обоих этих стандартных отклонений практически идентичны:

Рассчитать среднее.
Вычтите среднее значение из каждого значения, чтобы получить отклонения от среднего.
Квадрат каждого из отклонений.
Сложите все эти квадратные отклонения.

Теперь расчет этих стандартных отклонений отличается:

Если мы рассчитываем стандартное отклонение населения, то мы делим на п, количество значений данных.
Если мы рассчитываем стандартное отклонение выборки, то мы делим на N -1, на единицу меньше количества значений данных.

Последний шаг в любом из двух рассматриваемых нами случаев заключается в извлечении квадратного корня из отношения предыдущего шага.

Чем больше значение N чем ближе к населению и выборке стандартные отклонения.

Пример расчета

Чтобы сравнить эти два вычисления, мы начнем с того же набора данных:

1, 2, 4, 5, 8

Далее мы выполним все шаги, которые являются общими для обоих расчетов. После этого наши расчеты будут отличаться друг от друга, и мы будем различать стандартные отклонения совокупности и выборки.

Среднее значение (1 + 2 + 4 + 5 + 8) / 5 = 20/5 = 4.

Отклонения находят вычитанием среднего значения из каждого значения:

1 - 4 = -3
2 - 4 = -2
4 - 4 = 0
5 - 4 = 1
8 - 4 = 4.

Квадрат отклонений:

(-3)² = 9
(-2)² = 4
0² = 0
1² = 1
4² = 16

Теперь мы добавим эти квадратичные отклонения и увидим, что их сумма равна 9 + 4 + 0 + 1 + 16 = 30.

В нашем первом расчете мы будем рассматривать наши данные, как если бы они были всей совокупностью. Мы делим на количество точек данных, которое составляет пять. Это означает, что население дисперсия 30/5 = 6. Стандартное отклонение населения - квадратный корень из 6. Это примерно 2,4495.

Во втором нашем расчете мы будем рассматривать наши данные, как если бы они были выборкой, а не всей совокупностью. Делим на единицу меньше, чем количество точек данных. Итак, в этом случае мы делим на четыре. Это означает, что выборочная дисперсия составляет 30/4 = 7,5. Стандартное отклонение выборки - квадратный корень из 7,5. Это примерно 2,7386.

Из этого примера очень очевидно, что существует разница между стандартными отклонениями совокупности и выборки.