Наклон линии регрессии и коэффициент корреляции

Много раз в изучении статистика важно установить связь между разными темами. Мы увидим пример этого, в котором наклон линии регрессии напрямую связан с коэффициент корреляции. Поскольку оба эти понятия связаны с прямыми линиями, естественно задать вопрос: «Каковы коэффициент корреляции и линия наименьших квадратов Связанный?"

Во-первых, мы рассмотрим некоторые из этих двух тем.

Подробности относительно корреляции

Важно помнить детали, относящиеся к коэффициенту корреляции, который обозначается как р. Эта статистика используется, когда мы в паре количественные данные. Из диаграммы рассеяния парные данныеМы можем искать тенденции в общем распределении данных. Некоторые парные данные имеют линейную или прямолинейную структуру. Но на практике данные никогда не падают точно по прямой линии.

Несколько человек смотрят на одно и то же рассеивания парных данных не согласились бы с тем, насколько близко это было к показу общей линейной тенденции. В конце концов, наши критерии для этого могут быть несколько субъективными. Масштаб, который мы используем, также может повлиять на наше восприятие данных. По этим и другим причинам нам нужна какая-то объективная мера, чтобы сказать, насколько близки наши парные данные к линейности. Коэффициент корреляции достигает этого для нас.

instagram viewer

Несколько основных фактов о р включают:

  • Значение р колеблется между любым действительным числом от -1 до 1.
  • Значения р близкие к 0 подразумевают, что между данными практически нет линейной зависимости.
  • Значения р значение 1 означает, что между данными существует положительная линейная зависимость. Это означает, что как Икс увеличивает это Y также увеличивается.
  • Значения р близкие к -1 означают, что между данными существует отрицательная линейная связь. Это означает, что как Икс увеличивает это Y уменьшается.

Наклон линии наименьших квадратов

Последние два элемента в приведенном выше списке указывают нам на наклон линии наименьших квадратов, которая наилучшим образом подходит. Напомним, что наклон линии - это показатель того, сколько единиц она поднимает или опускает на каждую единицу, которую мы перемещаем вправо. Иногда это определяется как подъем линии, разделенной на пробег, или изменение Y значения, разделенные на изменение Икс ценности.

Как правило, прямые линии имеют наклоны, которые являются положительными, отрицательными или нулевыми. Если бы мы исследовали наши линии регрессии наименьших квадратов и сравнили соответствующие значения рмы бы заметили, что каждый раз, когда наши данные имеют коэффициент отрицательной корреляциинаклон линии регрессии отрицателен. Аналогично, для каждого положительного коэффициента корреляции наклон линии регрессии является положительным.

Из этого наблюдения должно быть очевидно, что существует определенная связь между знаком коэффициента корреляции и наклоном линии наименьших квадратов. Осталось объяснить, почему это так.

Формула для склона

Причина связи между значением р и наклон линии наименьших квадратов имеет отношение к формуле, которая дает нам наклон этой линии. Для парных данных (х, у) мы обозначаем среднеквадратичное отклонение из Икс данные по sИкс и стандартное отклонение Y данные по sY.

Формула для наклона линии регрессии это:

  • a = r (sY/ sИкс)

Вычисление стандартного отклонения включает в себя получение положительного квадратного корня из неотрицательного числа. В результате оба стандартных отклонения в формуле для наклона должны быть неотрицательными. Если мы предположим, что в наших данных есть некоторые различия, мы сможем игнорировать вероятность того, что любое из этих стандартных отклонений равно нулю. Поэтому знак коэффициента корреляции будет таким же, как знак наклона линии регрессии.

instagram story viewer