Что такое линейная регрессия?

Линейная регрессия — статистический метод для моделирования зависимости между независимой переменной (x) и зависимой переменной (y).

Уравнение: y = mx + b

  • m = наклон (изменение y на единицу x)
  • b = точка пересечения с осью y (y при x = 0)

Формулы

m = (nΣxy − ΣxΣy) / (nΣx² − (Σx)²)

b = (Σy − mΣx) / n

Решённый пример

x y xy
1 2 2 1
2 4 8 4
3 5 15 9
4 4 16 16
5 5 25 25
Σ=15 Σ=20 Σ=66 Σ=55

m = (5×66 − 15×20) / (5×55 − 225) = 30/50 = 0.6

b = (20 − 0.6×15) / 5 = 11/5 = 2.2

Результат: y = 0.6x + 2.2

Интерпретация

Наклон (m = 0.6): y увеличивается на 0.6 при каждом увеличении x на 1.

Точка пересечения (b = 2.2): y = 2.2 при x = 0.

R²: измеряет качество подгонки (от 0 до 1).

Применения

  • Прогнозирование продаж
  • Оценка цен на недвижимость
  • Анализ успеваемости
  • Демографические прогнозы