Что такое парные данные в статистике?

Парные данные в статистике, часто называемые упорядоченными парами, относятся к двум переменным в отдельных лицах совокупности, которые связаны между собой для определения корреляции между ними. Для того чтобы набор данных считался парными данными, оба эти значения данных должны быть присоединены или связаны друг с другом, а не рассматриваться отдельно.

Идея парных данных контрастирует с обычной ассоциацией одного числа для каждой точки данных, как в других количественные данные устанавливает, что каждая отдельная точка данных связана с двумя числами, предоставляя график, который позволяет статистикам наблюдать взаимосвязь между этими переменными в совокупности.

Этот метод парных данных используется, когда в исследовании предполагается сравнить две переменные в отдельных популяциях, чтобы сделать какое-то заключение о наблюдаемой корреляции. При наблюдении этих точек данных порядок спаривания важен, потому что первое число является мерой одного, а второе - мерой чего-то совершенно другого.

instagram viewer

Пример парных данных

Чтобы увидеть пример парных данных, предположим, что учитель подсчитывает количество домашних заданий для каждого учащегося. сдал для определенной единицы и затем соединяет это число с процентом каждого студента на модульном тесте. Пары следующие:

  • Человек, выполнивший 10 заданий, заработал 95% на своем тесте. (10, 95%)
  • Человек, выполнивший 5 заданий, заработал 80% на своем тесте. (5, 80%)
  • Человек, выполнивший 9 заданий, заработал 85% на своем тесте. (9, 85%)
  • Человек, выполнивший 2 задания, заработал 50% на своем тесте. (2, 50%)
  • Человек, выполнивший 5 заданий, заработал 60% на своем тесте. (5, 60%)
  • Человек, выполнивший 3 задания, заработал 70% на своем тесте. (3, 70%)

В каждом из этих наборов парных данных мы видим, что число назначений всегда идет первым в упорядоченная пара, в то время как процент, заработанный на тесте, занимает второе место, как видно в первом случае (10, 95%).

Хотя статистический анализ этих данных также может быть использован для расчета среднего числа выполненные домашние задания или средний балл теста, могут возникнуть другие вопросы данные. В этом случае учитель хочет знать, есть ли какая-либо связь между количеством домашних заданий и тест на производительность, и учитель должен сохранить данные в паре, чтобы ответить на этот вопрос вопрос.

Анализ парных данных

статистические методы из корреляция и регрессия используются для анализа парных данных, где коэффициент корреляции количественно определяет, насколько близко данные лежат вдоль прямой линии, и измеряет силу линейных отношений.

Регрессия, с другой стороны, используется для нескольких приложений, в том числе для определения того, какая линия лучше всего подходит для нашего набора данных. Эта линия может, в свою очередь, использоваться для оценки или прогнозирования Y значения для значений Икс которые не были частью нашего исходного набора данных.

Существует специальный тип графиков, который особенно хорошо подходит для парных данных, называемый диаграммой рассеяния. В этом тип графикаодна координатная ось представляет одно количество парных данных, в то время как другая координатная ось представляет другое количество парных данных.

Диаграмма рассеяния для вышеуказанных данных будет иметь ось X для обозначения количества включенных назначений, тогда как ось Y будет обозначать баллы в модульном тесте.

instagram story viewer