Вот как сделать Boxplot

Бокплоты получают свое имя от того, на что они похожи. Они иногда упоминаются как участки коробки и усов. Эти типы графиков используются для отображения диапазона, медианаи квартили. Когда они завершены, поле содержит первый и третий квартили. Усы распространяются от коробки до минимальных и максимальных значений данных.

На следующих страницах будет показано, как составить коробку для набора данных с минимальным 20, первым квартилем 25, медианой 32, третьим квартилем 35 и максимумом 43.

Нарисуйте пять вертикальных линий над числовой линией, по одной для каждого значения минимума, первый квартиль, медиана, третий квартиль и максимум. Обычно линии для минимума и максимума короче, чем линии для квартилей и медианы.

По нашим данным, минимум равен 20, первый квартиль равен 25, медиана равна 32, третий квартиль равен 35, а максимум равен 43. Линии, соответствующие этим значениям, нарисованы выше.

Затем мы рисуем прямоугольник и используем некоторые из линий, чтобы направлять нас. Первый квартиль - это левая сторона нашей коробки. Третий квартиль - это правая часть нашей коробки. Медиана падает где-нибудь внутри коробки.

instagram viewer

По определению первого и третьего квартилей, половина всех значений данных содержится в рамке.

Теперь мы видим, как граф box и whisker получает вторую часть своего имени. Усы нарисованы, чтобы продемонстрировать диапазон данных. Нарисуйте горизонтальную линию от линии минимума до левой стороны поля в первом квартиле. Это один из наших усов. Нарисуйте вторую горизонтальную линию от правой стороны прямоугольника в третьем квартиле до линии, представляющей максимум данных. Это наш второй усы.

Наш график «усы и усы», или блокпост, готов. На первый взгляд, мы можем определить диапазон значений данных и степень, в которой все сгруппировано. Следующий шаг показывает, как мы можем сравнить и сопоставить два коробочных графика.

Графики прямоугольников и усов отображают сводку из пяти чисел набора данных. Таким образом, можно сравнить два разных набора данных, изучив их боксовые диаграммы вместе. Над вторым боксплотом был нарисован выше того, который мы построили.

Есть пара особенностей, которые заслуживают упоминания. Во-первых, медианы обоих наборов данных идентичны. Вертикальная линия внутри обоих полей находится в том же месте на числовой линии. Второе, на что следует обратить внимание в отношении двух прямоугольников и графов усов, это то, что верхний график не так разбросан по нижнему. Верхняя коробка меньше, а усы не доходят так далеко.

Рисование двух прямоугольников над одной и той же числовой линией предполагает, что данные за каждым заслуживают сравнения. Не имеет смысла сравнивать коробку высот третьего класса с весами собак в местном приюте. Хотя оба содержат данные в соотношении уровень измеренияНет причин сравнивать данные.

С другой стороны, имело бы смысл сравнивать коробочные диаграммы высот третьего класса, если один участок представлял данные от мальчиков в школе, а другой график представлял данные от девочек в школа.

instagram story viewer