Как оценить стандартные отклонения (SD)

Стандартное отклонение и диапазон являются мерами распространение набора данных. Каждое число по-своему говорит нам, насколько разнесены данные, так как они оба являются мерой вариации. Хотя между диапазон и стандартное отклонение, Существует практическое правило это может быть полезно, чтобы связать эти две статистики. Это отношение иногда называют правилом диапазона для стандартного отклонения.

Правило диапазона говорит нам, что стандартное отклонение выборки приблизительно равно одной четверти диапазона данных. Другими словамиs = (Максимум - Минимум) / 4. Это очень простая в использовании формула, и ее следует использовать только как очень грубую оценка стандартного отклонения.

Пример

Чтобы увидеть пример того, как работает правило диапазона, мы рассмотрим следующий пример. Предположим, мы начнем со значений данных 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. Эти значения имеют жадный 17 и стандартное отклонение около 4,1. Если вместо этого мы сначала рассчитаем диапазон наших данных как 25 - 12 = 13, а затем разделить это число на четыре, мы оцениваем стандартное отклонение как 13/4 = 3,25. Это число относительно близко к истинному стандартному отклонению и подходит для приблизительной оценки.

instagram viewer

Почему это работает?

Может показаться, что правило дальности немного странно. Почему это работает? Разве не кажется совершенно произвольным просто разделить диапазон на четыре? Почему бы нам не разделить на другое число? На самом деле за кулисами происходит какое-то математическое обоснование.

Напомним, свойства кривая колокола и вероятности от стандартное нормальное распределение. Одна особенность связана с объемом данных, который находится в пределах определенного числа стандартных отклонений:

  • Примерно 68% данных находятся в пределах одного стандартного отклонения (выше или ниже) от среднего значения.
  • Приблизительно 95% данных находятся в пределах двух стандартных отклонений (выше или ниже) от среднего значения.
  • Примерно 99% находится в пределах трех стандартных отклонений (выше или ниже) от среднего значения.

Число, которое мы будем использовать, связано с 95%. Можно сказать, что 95% от двух стандартных отклонений ниже среднего до двух стандартных отклонений выше среднего, мы имеем 95% наших данных. Таким образом, почти все наше нормальное распределение будет растягиваться на отрезке, который в общей сложности будет иметь четыре стандартных отклонения.

Не все данные обычно распределяются и имеют форму кривой колокола. Но большинство данных достаточно хорошо себя ведут, и отклонение от среднего значения на два стандартных отклонения охватывает почти все данные. Мы оцениваем и говорим, что четыре стандартных отклонения приблизительно равны размеру диапазона, и поэтому диапазон, разделенный на четыре, является приблизительным приближением к стандартному отклонению.

Использует для правила дальности

Правило диапазона полезно для ряда настроек. Во-первых, это очень быстрая оценка стандартного отклонения. Стандартное отклонение требует от нас сначала найти среднее значение, а затем вычесть это среднее значение из каждой точки данных, квадрат Различия, сложите их, разделите на единицу меньше, чем количество точек данных, затем (наконец) возьмите квадрат корень. С другой стороны, правило диапазона требует только одного вычитания и одного деления.

Другие места, где правило диапазона полезно, когда у нас есть неполная информация. Формулы, такие как, чтобы определить размер выборки, требуют трех частей информации: желаемый предел погрешности, уровень доверия и стандартное отклонение населения, которое мы исследуем. Много раз невозможно узнать, что такое население среднеквадратичное отклонение является. С помощью правила диапазона мы можем оценить эту статистику, а затем узнать, насколько велика должна быть наша выборка.

instagram story viewer