¿Qué es la regresión lineal?

La regresión lineal es un método estadístico para modelar la relación entre una variable independiente (x) y una variable dependiente (y). El objetivo es encontrar la mejor línea recta que pase por los puntos de datos.

Ecuación de la línea de regresión: y = mx + b

  • m es la pendiente (cambio de y por unidad de x)
  • b es la intersección con el eje y (y cuando x = 0)

Fórmulas de cálculo

m = (nΣxy − ΣxΣy) / (nΣx² − (Σx)²)

b = (Σy − mΣx) / n

Ejemplo resuelto

x y xy
1 2 2 1
2 4 8 4
3 5 15 9
4 4 16 16
5 5 25 25
Σ=15 Σ=20 Σ=66 Σ=55

m = (5×66 − 15×20) / (5×55 − 225) = 30/50 = 0.6

b = (20 − 0.6×15) / 5 = 11/5 = 2.2

Resultado: y = 0.6x + 2.2

Interpretación

Pendiente (m = 0.6): y aumenta 0.6 por cada unidad de aumento en x.

Intersección (b = 2.2): y = 2.2 cuando x = 0.

R²: mide el ajuste del modelo a los datos (0 a 1).

Aplicaciones

  • Predicción de ventas según publicidad
  • Estimación de precios de viviendas
  • Análisis de rendimiento académico
  • Proyecciones de población