В статистикаЕсть много терминов, которые имеют тонкие различия между ними. Одним из примеров этого является разница между частота и относительная частота. Несмотря на то, что существует много вариантов использования относительных частот, в частности, используется гистограмма относительных частот. Это тип графика, который связан с другими темами статистики и математической статистики.
Определение
Гистограммы представляют собой статистические графики, которые выглядят как гистограммы. Обычно, однако, термин гистограмма зарезервирован для количественный переменные. Горизонтальная ось гистограммы является числовой линией, содержащей классы или бункеры одинаковой длины. Эти ячейки представляют собой интервалы числовой строки, в которые могут попадать данные, и могут состоять из одного числа (обычно для дискретный наборы данных, которые являются относительно небольшими) или диапазон значений (для больших наборов дискретных данных и непрерывный данные).
Например, нам может быть интересно рассмотреть распределение баллов по 50-балльной викторине для класса студентов. Одним из возможных способов построения бинов было бы иметь разные бины на каждые 10 очков.
Вертикальная ось гистограммы представляет счетчик или частоту, в которой значение данных встречается в каждом из столбцов. Чем выше планка, тем больше значений данных попадают в этот диапазон значений бина. Чтобы вернуться к нашему примеру, если у нас есть пять студентов, которые набрали более 40 баллов в викторине, то планка, соответствующая корзине 40–50, будет иметь высоту пять единиц.
Сравнение частотной гистограммы
Относительная частотная гистограмма является незначительной модификацией типичной частотной гистограммы. Вместо того чтобы использовать вертикальную ось для подсчета значений данных, попадающих в заданную ячейку, мы используем эту ось для представления общей доли значений данных, попадающих в эту ячейку. Поскольку 100% = 1, все столбцы должны иметь высоту от 0 до 1. Кроме того, высота всех столбцов в нашей гистограмме относительной частоты должна быть равна 1.
Таким образом, в приведенном нами примере, предположим, что в нашем классе 25 учеников, а пятеро набрали более 40 баллов. Вместо того чтобы строить стержень высотой пять для этого мусорного ведра, у нас был бы стержень высотой 5/25 = 0,2.
Сравнивая гистограмму с гистограммой относительной частоты, каждая с одинаковыми ячейками, мы кое-что заметим. Общая форма гистограмм будет одинаковой. Гистограмма относительной частоты не выделяет общее количество в каждом бине. Вместо этого этот тип графика фокусируется на том, как число значений данных в ячейке связано с другими ячейками. Этот способ показывает это отношение в процентах от общего числа значений данных.
Массовые функции вероятности
Мы можем задаться вопросом, в чем смысл определения гистограммы относительной частоты. Одно ключевое приложение относится к дискретным случайным переменным, где наши ячейки имеют ширину один и сосредоточены вокруг каждого неотрицательного целого числа. В этом случае мы можем определить кусочную функцию со значениями, соответствующими вертикальной высоте столбцов в нашей гистограмме относительной частоты.
Этот тип функции называется функцией вероятности массы. Причиной построения функции таким образом является то, что кривая, определяемая функцией, имеет прямую связь с вероятность. Площадь под кривой от значений в б вероятность того, что случайная величина имеет значение из в б.
Связь между вероятностью и областью под кривой является той, которая неоднократно проявляется в математической статистике. Использование функции вероятности массы для моделирования относительной частоты гистограммы является еще одной такой связью.