Qu'est-ce que la régression linéaire ?

La régression linéaire est une méthode statistique pour modéliser la relation entre une variable indépendante (x) et une variable dépendante (y). L'objectif est de trouver la meilleure droite passant par les points de données.

Équation de la droite de régression : y = mx + b

  • m est la pente (variation de y par unité de x)
  • b est l'ordonnée à l'origine (y quand x = 0)

Formules de calcul

m = (nΣxy − ΣxΣy) / (nΣx² − (Σx)²)

b = (Σy − mΣx) / n

Exemple résolu

x y xy
1 2 2 1
2 4 8 4
3 5 15 9
4 4 16 16
5 5 25 25
Σ=15 Σ=20 Σ=66 Σ=55

m = (5×66 − 15×20) / (5×55 − 225) = 30/50 = 0.6

b = (20 − 0.6×15) / 5 = 11/5 = 2.2

Résultat : y = 0.6x + 2.2

Interprétation

Pente (m = 0.6) : y augmente de 0.6 pour chaque unité d'augmentation de x.

Ordonnée à l'origine (b = 2.2) : y = 2.2 quand x = 0.

R² : mesure la qualité d'ajustement du modèle (0 à 1).

Applications

  • Prévision des ventes selon publicité
  • Estimation des prix immobiliers
  • Analyse des résultats scolaires
  • Projections démographiques