Mikä on lineaarinen regressio?

Lineaarinen regressio on tilastollinen menetelmä, jolla mallinnetaan riippumattoman muuttujan (x) ja riippuvan muuttujan (y) välistä suhdetta.

Yhtälö: y = mx + b

  • m = kulmakerroin (y:n muutos per x:n yksikkö)
  • b = y-akselin leikkauspiste (y kun x = 0)

Kaavat

m = (nΣxy − ΣxΣy) / (nΣx² − (Σx)²)

b = (Σy − mΣx) / n

Esimerkki

x y xy
1 2 2 1
2 4 8 4
3 5 15 9
4 4 16 16
5 5 25 25
Σ=15 Σ=20 Σ=66 Σ=55

m = (5×66 − 15×20) / (5×55 − 225) = 30/50 = 0.6

b = (20 − 0.6×15) / 5 = 11/5 = 2.2

Tulos: y = 0.6x + 2.2

Tulkinta

Kulmakerroin (m = 0.6): y kasvaa 0.6:lla jokaista x:n kasvuyksikköä kohti.

Leikkauspiste (b = 2.2): y = 2.2 kun x = 0.

R²: mittaa mallin sopivuutta dataan (0–1).

Sovellukset

  • Myynnin ennustaminen mainoskulujen perusteella
  • Asuntohintojen arviointi
  • Oppimistulosten analyysi
  • Väestöennusteet