Что такое двусторонняя таблица категориальных переменных?

Одной из целей статистики является упорядочение данных. Двусторонние таблицы являются важным способом организации определенного типа парные данные. Как и при построении любых графиков или таблиц в статистике, очень важно знать типы переменных, с которыми мы работаем. Если у нас есть количественные данные, то график, такой как гистограмма или ствол и листовой участок должен быть использован. Если у нас есть категориальные данные, то гистограмма или круговая диаграмма является целесообразным.

При работе с парными данными мы должны быть осторожны. Диаграмма рассеяния существует для парных количественных данных, но какой график существует для парных количественных данных категорический данные? Всякий раз, когда у нас есть две категориальные переменные, мы должны использовать двустороннюю таблицу.

Описание двухстороннего стола

Во-первых, напомним, что категориальные данные относятся к признакам или категориям. Он не количественный и не имеет числовых значений.

Двусторонняя таблица включает в себя список всех значений или уровней для двух категориальных переменных. Все значения для одной из переменных перечислены в вертикальном столбце. Значения для другой переменной перечислены вдоль горизонтальной строки. Если первая переменная имеет

instagram viewer
м значения и вторая переменная имеет N значения, то будет в общей сложности Миннесота Записи в таблице. Каждая из этих записей соответствует определенному значению для каждой из двух переменных.

По каждой строке и по каждому столбцу суммируются записи. Эти итоги важны при определении предельных и условных распределений. Эти итоги также важны, когда мы проводим тест хи-квадрат на независимость.

Пример двусторонней таблицы

Например, мы рассмотрим ситуацию, в которой мы рассмотрим несколько разделов курса статистики в университете. Мы хотим построить двустороннюю таблицу, чтобы определить, какие различия, если таковые имеются, существуют между мужчинами и женщинами в курсе. Чтобы достичь этого, мы подсчитываем число каждой буквенной оценки, полученной представителями каждого пола.

Мы отмечаем, что первая категориальная переменная - это пол, и есть два возможных значения в исследовании мужчин и женщин. Вторая категориальная переменная - это буквенная оценка, и есть пять значений, которые задаются A, B, C, D и F. Это означает, что у нас будет двусторонняя таблица с 2 x 5 = 10 записей, плюс дополнительная строка и дополнительный столбец, которые понадобятся для табулирования итогов строки и столбца.

Наше исследование показывает, что:

  • 50 мужчин получили оценку A, а 60 женщин получили оценку A.
  • 60 мужчин получили B, а 80 женщин получили B.
  • 100 мужчин получили C, а 50 женщин получили C.
  • 40 мужчин получили D, а 50 женщин получили D.
  • 30 мужчин получили F, а 20 женщин получили F.

Эта информация вводится в двустороннюю таблицу ниже. Итого по каждой строке говорит нам, сколько баллов было получено. В итоговых столбцах указывается количество мужчин и женщин.

Важность двусторонних таблиц

Двусторонние таблицы помогают организовать наши данные, когда у нас есть две категориальные переменные. Эта таблица может помочь нам сравнить две разные группы в наших данных. Например, мы могли бы рассмотреть относительную производительность мужчин в курсе статистики по сравнению с результатами женщин в курсе.

Следующие шаги

После формирования двусторонней таблицы следующим шагом может стать статистический анализ данных. Мы можем спросить, являются ли переменные, которые находятся в исследовании, независимыми друг от друга или нет. Чтобы ответить на этот вопрос, мы можем использовать критерий хи-квадрат на двусторонней таблице.

Двусторонний стол для классов и полов

мужчина женский Общее количество
50 60 110
В 60 80 140
С 100 50 150
D 40 50 90
F 30 20 50
Общее количество 280 260 540