Wat is lineaire regressie?

Lineaire regressie is een statistische methode voor het modelleren van de relatie tussen een onafhankelijke variabele (x) en een afhankelijke variabele (y).

Vergelijking: y = mx + b

  • m = helling (verandering in y per eenheid x)
  • b = y-snijpunt (y wanneer x = 0)

Formules

m = (nΞ£xy βˆ’ Ξ£xΞ£y) / (nΞ£xΒ² βˆ’ (Ξ£x)Β²)

b = (Ξ£y βˆ’ mΞ£x) / n

Opgelost voorbeeld

x y xy xΒ²
1 2 2 1
2 4 8 4
3 5 15 9
4 4 16 16
5 5 25 25
Ξ£=15 Ξ£=20 Ξ£=66 Ξ£=55

m = (5Γ—66 βˆ’ 15Γ—20) / (5Γ—55 βˆ’ 225) = 30/50 = 0.6

b = (20 βˆ’ 0.6Γ—15) / 5 = 11/5 = 2.2

Resultaat: y = 0.6x + 2.2

Interpretatie

Helling (m = 0.6): y neemt toe met 0.6 voor elke eenheid toename in x.

Y-snijpunt (b = 2.2): y = 2.2 wanneer x = 0.

RΒ²: meet de kwaliteit van de aanpassing (0 tot 1).

Toepassingen

  • Verkoopprognoses op basis van reclame
  • Schatting van huizenprijzen
  • Analyse van studieresultaten
  • Bevolkingsgroeiprognoses