Диапазон статистических наборов данных

В статистике и математике диапазон представляет собой разницу между максимальным и минимальным значениями набора данных и служит одной из двух важных характеристик набора данных. Формула для диапазона - это максимальное значение за вычетом минимального значения в наборе данных, что позволяет статистикам лучше понять, насколько разнообразен набор данных.

Две важные особенности набора данных включают в себя центр данных и распространение данных, и центр может бытьизмеряется несколькими способами: самыми популярными из них являются средние, медиана, mode и midrange, но аналогичным образом, существуют разные способы вычисления степени разброса набора данных, а самая простая и грубая мера разброса называется range.

Расчет диапазона очень прост. Все, что нам нужно сделать, - это найти разницу между наибольшим значением данных в нашем наборе и наименьшим значением данных. Проще говоря, у нас есть следующая формула: Диапазон = Максимальное значение – Минимальное значение. Например, набор данных 4, 6, 10, 15, 18 имеет максимум 18, минимум 4 и диапазон 18-4 = 14.

instagram viewer

Диапазон является очень грубым измерением разброса данных, поскольку он чрезвычайно чувствителен к выбросам, и, как следствие, существуют определенные ограничения полезности истинного диапазона набора данных для статистиков, потому что одно значение данных может сильно повлиять на значение ассортимент.

Например, рассмотрим набор данных 1, 2, 3, 4, 6, 7, 7, 8. Максимальное значение 8, минимальное 1 и диапазон 7. Затем рассмотрим тот же набор данных, только с включенным значением 100. Диапазон теперь становится 100-1 = 99 при этом добавление одной дополнительной точки данных сильно повлияло на значение диапазона. Стандартное отклонение является еще одной мерой распространения, которая менее восприимчива к выбросам, но недостатком является то, что расчет стандартного отклонения гораздо сложнее.

Диапазон также ничего не говорит нам о внутренних особенностях нашего набора данных. Например, мы рассматриваем набор данных 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10, где диапазон для этого набора данных 10-1 = 9. Если затем сравнить это с набором данных 1, 1, 1, 2, 9, 9, 9, 10. Здесь диапазон, опять же, девять, однако, для этого второго набора и в отличие от первого набора данные сгруппированы вокруг минимума и максимума. Другие статистические данные, такие как первый и третий квартили, необходимо будет использовать для обнаружения некоторых из этой внутренней структуры.

Диапазон - это хороший способ получить общее представление о том, насколько разбросаны числа в наборе данных, потому что легко рассчитать, поскольку это требует только основной арифметической операции, но есть также несколько других применений диапазона набора данных в статистика.

Диапазон может также использоваться для оценки другого показателя разброса, стандартного отклонения. Вместо того, чтобы пройти довольно сложную формулу, чтобы найти стандартное отклонение, мы можем вместо этого использовать то, что называется правило диапазона. Диапазон является основным в этом расчете.

Диапазон также происходит в boxplotили коробка и усы сюжет. Максимальное и минимальное значения отображаются в конце усов графика, а общая длина усов и прямоугольников равна диапазону.

instagram story viewer