Что такое остатки?

Линейная регрессия - это статистический инструмент, который определяет, насколько хорошо прямая линия соответствует набору парные данные. Прямая линия, которая лучше всего соответствует этим данным, называется линией регрессии наименьших квадратов. Эта строка может быть использована несколькими способами. Одним из таких применений является оценка значения ответной переменной для заданного значения пояснительной переменной. С этой идеей связана идея остаточного.

(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)

Рассчитать остаток по точкам Икс = 5, мы вычитаем прогнозируемое значение из нашего наблюдаемого значения. Так как Y координата нашей точки данных была 9, это дает остаток 9 - 10 = -1.

Есть несколько вариантов использования остатков. Один из способов - помочь нам определить, есть ли у нас набор данных с общей линейной тенденцией или нам следует рассмотреть другую модель. Причина этого заключается в том, что остатки помогают усилить любую нелинейную картину в наших данных. То, что может быть трудно увидеть, глядя на диаграмму рассеяния, можно легче наблюдать, исследуя остатки и соответствующий график остатков.

instagram viewer

Еще одна причина для рассмотрения остатков - это проверка выполнения условий для линейной регрессии. После проверки линейного тренда (путем проверки остатков) мы также проверяем распределение остатков. Чтобы иметь возможность выполнить регрессионный вывод, мы хотим, чтобы остатки в нашей линии регрессии были приблизительно нормально распределены. гистограмма или stemplot из остатков поможет проверить, что это условие было выполнено.