Когда мы измеряем изменчивость набора данных, есть две тесно связанные статистики, связанные с этим: дисперсия и среднеквадратичное отклонение, которые оба указывают, насколько разбросаны значения данных, и включают в себя аналогичные шаги при их расчете. Однако основное различие между этими двумя статистическими анализами заключается в том, что стандартное отклонение представляет собой квадратный корень из дисперсии.
Чтобы понять различия между этими двумя наблюдениями статистического разброса, необходимо сначала понять, что представляет каждое из них: Дисперсия представляет все точки данных в наборе. и рассчитывается путем усреднения квадрата отклонения каждого среднего значения, в то время как стандартное отклонение является мерой разброса вокруг среднего значения, когда центральная тенденция рассчитывается через жадный.
В результате дисперсия может быть выражена как среднеквадратичное отклонение значений от среднего или [возведение в квадрат отклонение от среднего значения], деленное на количество наблюдений и стандартное отклонение, может быть выражено как квадратный корень из дисперсия.
Конструкция Дисперсии
Чтобы полностью понять разницу между этими статистическими данными, нам нужно понять расчет дисперсии. Шаги для расчета выборочной дисперсии следующие:
- Рассчитать среднее значение выборки данных.
- Найти разницу между средним и каждым из значений данных.
- Урегулируйте эти различия.
- Добавьте квадратичные различия вместе.
- Разделите эту сумму на единицу меньше, чем общее количество значений данных.
Причины каждого из этих шагов следующие:
- Среднее обеспечивает центральную точку или средний данных.
- Отличия от среднего значения помогают определить отклонения от этого среднего. Значения данных, которые далеки от среднего, будут давать большее отклонение, чем значения, близкие к среднему.
- Различия возводятся в квадрат, потому что, если различия добавляются без возведения в квадрат, эта сумма будет равна нулю.
- сложение этих квадратов отклонений обеспечивает измерение общего отклонения.
- Деление на единицу меньше размера выборки дает своего рода среднее отклонение. Это сводит на нет эффект наличия множества точек данных, каждая из которых вносит вклад в измерение разброса.
Как указывалось ранее, стандартное отклонение просто рассчитывается путем нахождения квадратного корня этого результата, который обеспечивает абсолютный стандарт отклонения независимо от общего числа значений данных.
Дисперсия и стандартное отклонение
Когда мы рассматриваем дисперсию, мы понимаем, что есть один существенный недостаток ее использования. Когда мы следуем шагам вычисления дисперсии, это показывает, что дисперсия измеряется в единицах квадрата, потому что мы добавили квадратные различия в нашем расчете. Например, если наши выборочные данные измеряются в метрах, то единицы для дисперсии будут даны в квадратных метрах.
Чтобы стандартизировать нашу меру разброса, нам нужно взять квадратный корень из дисперсии. Это устранит проблему квадратов и даст нам меру разброса, которая будет иметь те же единицы, что и наша исходная выборка.
В математической статистике есть много формул, которые имеют более привлекательные формы, когда мы формулируем их в терминах дисперсии вместо стандартного отклонения.