Что такое первый и третий квартили?

Первый и третий квартили являются описательной статистикой, которая представляет собой измерения положения в наборе данных. Подобно тому, как медиана обозначает среднюю точку набора данных, первый квартиль отмечает четверть или точку 25%. Приблизительно 25% значений данных меньше или равны первому квартилю. Третий квартиль аналогичен, но для верхних 25% значений данных. Мы рассмотрим эти идеи более подробно в дальнейшем.

Медиана

Есть несколько способов измерить центр набора данных. Среднее, медиана, мод и средний диапазон имеют свои преимущества и ограничения в выражении середины данных. Из всех этих способов найти среднее значение медиана является наиболее устойчивым к выбросам. Он обозначает середину данных в том смысле, что половина данных меньше медианы.

Первый квартиль

Мы не должны останавливаться на поиске только середины. Что, если мы решили продолжить этот процесс? Мы могли бы рассчитать медиану нижней половины наших данных. Половина 50% составляет 25%. Таким образом, половина половины или одна четверть данных будет ниже этого. Поскольку мы имеем дело с четвертью исходного набора, эта медиана нижней половины данных называется первым квартилем и обозначается как

instagram viewer
Q1.

Третий квартиль

Нет никаких причин, почему мы смотрели на нижнюю половину данных. Вместо этого мы могли бы взглянуть на верхнюю половину и выполнить те же шаги, что и выше. Медиана этой половины, которую мы будем обозначать как Q3 также разбивает набор данных на кварталы. Тем не менее, это число обозначает верхнюю четверть данных. Таким образом, три четверти данных ниже нашего числа Q3. Вот почему мы называем Q3 третий квартиль.

Пример

Чтобы все это было понятно, давайте рассмотрим пример. Может быть полезно сначала рассмотреть, как рассчитать медиану некоторых данных Начните со следующего набора данных:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Всего в наборе двадцать точек данных. Начнем с нахождения медианы. Поскольку существует четное число значений данных, медиана является средним из десятого и одиннадцатого значений. Другими словами, медиана это:

(7 + 8)/2 = 7.5.

Теперь посмотрим на нижнюю половину данных. Медиана этой половины находится между пятым и шестым значениями:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Таким образом, первый квартиль оказывается равным Q1 = (4 + 6)/2 = 5

Чтобы найти третий квартиль, посмотрите на верхнюю половину исходного набора данных. Нам нужно найти медиану:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Здесь медиана равна (15 + 15) / 2 = 15. Таким образом, третий квартиль Q3 = 15.

Межквартильный диапазон и пять номеров

Квартили помогают нам дать более полную картину нашего набора данных в целом. Первый и третий квартили дают нам информацию о внутренней структуре наших данных. Средняя половина данных находится между первым и третьим квартилями и сосредоточена вокруг медианы. Разница между первым и третьим квартилями, называемая межквартильный размах, показывает, как устроены данные о медиане. Небольшой межквартильный диапазон указывает на данные, которые сгруппированы относительно медианы. Больший межквартильный диапазон показывает, что данные более распространены.

Более детальную картину данных можно получить, зная самое высокое значение, называемое максимальным значением, и самое низкое значение, называемое минимальным значением. Минимум, первый квартиль, медиана, третий квартиль и максимум представляют собой набор из пяти значений, называемых пятизначное резюме. Эффективный способ отображения этих пяти чисел называется боксплот или граф с усами.