Межквартильный диапазон (IQR) - это разница между первым квартилем и третьим квартилем. Формула для этого:
IQR = Q3 - Q1
Существует много измерений изменчивости набора данных. Оба ассортимент и среднеквадратичное отклонение расскажите нам, насколько распространены наши данные. Проблема этих описательных статистических данных заключается в том, что они достаточно чувствительны к выбросам. Измерением разброса набора данных, который является более устойчивым к присутствию выбросов, является межквартильный диапазон.
Определение межквартильного диапазона
Как видно выше, межквартильный диапазон строится на основе расчета других статистических данных. Прежде чем определить межквартильный диапазон, нам нужно знать значения первого и третьего квартилей. (Конечно, первый и третий квартили зависят от значения медианы).
Как только мы определили значения первого и третьего квартилей, межквартильный диапазон очень легко вычислить. Все, что нам нужно сделать, это вычесть первый квартиль из третьего квартиля. Это объясняет использование термина межквартильный диапазон для этой статистики.
пример
Чтобы увидеть пример расчета межквартильного диапазона, рассмотрим набор данных: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9. пятизначное резюме для этого набора данных:
- Минимум 2
- Первый квартиль 3,5
- Медиана 6
- Третий квартиль из 8
- Максимум 9
Таким образом, мы видим, что межквартильный диапазон составляет 8 - 3,5 = 4,5.
Значение межквартильного диапазона
Диапазон дает нам измерение того, насколько разбросан весь наш набор данных. Межквартильный диапазон, который говорит нам, как далеко друг от друга первый и третий квартиль есть, указывает, насколько разбросаны средние 50% нашего набора данных.
Устойчивость к выбросам
Основное преимущество использования межквартильного диапазона, а не диапазона для измерения разброса набора данных, заключается в том, что межквартильный диапазон не чувствителен к выбросам. Чтобы увидеть это, мы рассмотрим пример.
Исходя из набора данных выше, мы имеем межквартильный диапазон 3,5, диапазон 9-2 = 7 и стандартное отклонение 2,34. Если мы заменим самое высокое значение 9 экстремальным выбросом в 100, то стандартное отклонение станет 27,37, а диапазон - 98. Даже при том, что у нас есть довольно резкие сдвиги этих значений, первый и третий квартили не затронуты и, следовательно, межквартильный диапазон не изменяется.
Использование Interquartile Range
Помимо того, что межквартильный диапазон является менее чувствительным показателем распространения набора данных, он имеет еще одно важное применение. Из-за устойчивости к выбросам межквартильный диапазон полезен для определения, когда значение является выбросом.
правило межквартильного диапазона это то, что сообщает нам, есть ли у нас мягкий или сильный выброс. Чтобы искать выбросы, мы должны смотреть ниже первого квартиля или выше третьего квартиля. Как далеко мы должны идти, зависит от значения межквартильного диапазона.