При рассмотрении стандартных отклонений может быть сюрпризом то, что на самом деле есть два, которые можно рассмотреть. Существует стандартное отклонение популяции и выборочное стандартное отклонение. Мы будем различать два из них и выделять их различия.
Качественные отличия
Хотя оба стандартных отклонения измеряют изменчивость, существуют различия между популяцией и стандартное отклонение образца. Первое связано с различием между статистика и параметры. Стандартное отклонение населения - это параметр, который является фиксированной величиной, рассчитанной для каждого человека в популяции.
Примером стандартного отклонения является статистика. Это означает, что он рассчитывается только от некоторых людей в популяции. Поскольку стандартное отклонение образца зависит от образца, оно имеет большую изменчивость. Таким образом, стандартное отклонение выборки больше, чем у населения.
Количественная разница
Мы увидим, как эти два типа стандартных отклонений численно отличаются друг от друга. Для этого мы рассмотрим формулы как для стандартного отклонения выборки, так и для стандартного отклонения населения.
Формулы для расчета обоих этих стандартных отклонений практически идентичны:
- Рассчитать среднее.
- Вычтите среднее значение из каждого значения, чтобы получить отклонения от среднего.
- Квадрат каждого из отклонений.
- Сложите все эти квадратные отклонения.
Теперь расчет этих стандартных отклонений отличается:
- Если мы рассчитываем стандартное отклонение населения, то мы делим на п, количество значений данных.
- Если мы рассчитываем стандартное отклонение выборки, то мы делим на N -1, на единицу меньше количества значений данных.
Последний шаг в любом из двух рассматриваемых нами случаев заключается в извлечении квадратного корня из отношения предыдущего шага.
Чем больше значение N чем ближе к населению и выборке стандартные отклонения.
Пример расчета
Чтобы сравнить эти два вычисления, мы начнем с того же набора данных:
1, 2, 4, 5, 8
Далее мы выполним все шаги, которые являются общими для обоих расчетов. После этого наши расчеты будут отличаться друг от друга, и мы будем различать стандартные отклонения совокупности и выборки.
Среднее значение (1 + 2 + 4 + 5 + 8) / 5 = 20/5 = 4.
Отклонения находят вычитанием среднего значения из каждого значения:
- 1 - 4 = -3
- 2 - 4 = -2
- 4 - 4 = 0
- 5 - 4 = 1
- 8 - 4 = 4.
Квадрат отклонений:
- (-3)2 = 9
- (-2)2 = 4
- 02 = 0
- 12 = 1
- 42 = 16
Теперь мы добавим эти квадратичные отклонения и увидим, что их сумма равна 9 + 4 + 0 + 1 + 16 = 30.
В нашем первом расчете мы будем рассматривать наши данные, как если бы они были всей совокупностью. Мы делим на количество точек данных, которое составляет пять. Это означает, что население дисперсия 30/5 = 6. Стандартное отклонение населения - квадратный корень из 6. Это примерно 2,4495.
Во втором нашем расчете мы будем рассматривать наши данные, как если бы они были выборкой, а не всей совокупностью. Делим на единицу меньше, чем количество точек данных. Итак, в этом случае мы делим на четыре. Это означает, что выборочная дисперсия составляет 30/4 = 7,5. Стандартное отклонение выборки - квадратный корень из 7,5. Это примерно 2,7386.
Из этого примера очень очевидно, что существует разница между стандартными отклонениями совокупности и выборки.