Мерами центральной тенденции являются числа, которые описывают то, что является средним или типичным в распределении данных. Существует три основных показателя центральной тенденции: среднее значение, медианаи режим. Хотя все они являются мерами центральной тенденции, каждый рассчитывается по-разному и измеряет что-то отличное от других.
Значение
Среднее значение является наиболее распространенной мерой центральной тенденции, используемой исследователями и людьми во всех видах профессий. Это мера центральной тенденции, которая также упоминается как средний. Исследователь может использовать среднее значение для описания распределения данных переменные измеряются как интервалы или отношения. Это переменные, которые включают численно соответствующие категории или диапазоны (например, гонка, учебный класс, Полили уровень образования), а также переменные, измеряемые численно по шкале, которая начинается с нуля (например, доход домохозяйства или количество детей в семье).
Среднее значение очень легко вычислить. Нужно просто добавить все значения данных или «баллы», а затем разделить эту сумму на общее количество баллов в распределении данных. Например, если в пяти семьях соответственно 0, 2, 2, 3 и 5 детей, среднее число детей является (0 + 2 + 2 + 3 + 5) / 5 = 12/5 = 2,4. Это означает, что пять домашних хозяйств имеют в среднем 2,4 дети.
Медиана
Медиана - это значение в середине распределения данных, когда эти данные организованы от самого низкого до самого высокого значения. Эта мера центральной тенденции может быть рассчитана для переменных, которые измеряются с помощью порядковых, интервальных или относительных шкал.
Вычисление медианы также довольно просто. Предположим, у нас есть следующий список чисел: 5, 7, 10, 43, 2, 69, 31, 6, 22. Во-первых, мы должны расположить числа в порядке от самого низкого до самого высокого. Результат таков: 2, 5, 6, 7, 10, 22, 31, 43, 69. Медиана равна 10, потому что это точное среднее число. Четыре цифры ниже 10 и четыре цифры выше 10.
Если в вашем распределении данных имеется четное число случаев, что означает отсутствие точной середины, вы просто слегка корректируете диапазон данных, чтобы рассчитать медиану. Например, если мы добавим число 87 в конец нашего списка чисел, приведенного выше, в нашем распределении будет 10 полных чисел, поэтому единого среднего числа не будет. В этом случае берется среднее значение для двух средних чисел. В нашем новом списке два средних числа - 10 и 22. Итак, мы берем среднее из этих двух чисел: (10 + 22) / 2 = 16. Нашей медиане сейчас 16 лет.
Режим
Режим - это мера центральной тенденции, которая определяет категорию или оценку, которая чаще всего встречается при распределении данных. Другими словами, это самая распространенная оценка или оценка, которая появляется наибольшее количество раз в распределении. Режим может быть рассчитан для любого типа данных, в том числе измеренных в виде номинальных переменных или по имени.
Например, допустим, что мы смотрим на домашних животных, принадлежащих 100 семьям, и распределение выглядит следующим образом:
животноеКоличество семей, которым он принадлежит
- Собака: 60
- Кот: 35
- Рыба: 17
- Хомяк: 13
- Змея: 3
Режим здесь - "собака", так как больше семей владеет собакой, чем любое другое животное. Обратите внимание, что режим всегда выражается как категория или оценка, а не частота этой оценки. Например, в приведенном выше примере режим «собака», а не 60, то есть количество раз, когда собака появляется.
Некоторые дистрибутивы вообще не имеют режима. Это происходит, когда каждая категория имеет одинаковую частоту. Другие дистрибутивы могут иметь более одного режима. Например, когда в распределении есть две оценки или категории с одинаковой наивысшей частотой, его часто называют «бимодальный."