Was ist lineare Regression?
Die lineare Regression ist eine statistische Methode zur Modellierung der Beziehung zwischen einer unabhängigen Variable (x) und einer abhängigen Variable (y). Das Ziel ist es, die beste Gerade durch die Datenpunkte zu finden.
Gleichung der Regressionsgeraden: y = mx + b
- m ist die Steigung (Änderung von y pro Einheit x)
- b ist der y-Achsenabschnitt (y bei x = 0)
Berechnungsformeln
m = (nΣxy − ΣxΣy) / (nΣx² − (Σx)²)
b = (Σy − mΣx) / n
Gelöstes Beispiel
| x | y | xy | x² |
|---|---|---|---|
| 1 | 2 | 2 | 1 |
| 2 | 4 | 8 | 4 |
| 3 | 5 | 15 | 9 |
| 4 | 4 | 16 | 16 |
| 5 | 5 | 25 | 25 |
| Σ=15 | Σ=20 | Σ=66 | Σ=55 |
m = (5×66 − 15×20) / (5×55 − 225) = 30/50 = 0.6
b = (20 − 0.6×15) / 5 = 11/5 = 2.2
Ergebnis: y = 0.6x + 2.2
Interpretation
Steigung (m = 0.6): y steigt um 0.6 für jede Einheit Zunahme von x.
y-Achsenabschnitt (b = 2.2): y = 2.2 wenn x = 0.
R²: misst die Anpassungsgüte (0 bis 1).
Anwendungen
- Vorhersage von Verkäufen anhand Werbeausgaben
- Schätzung von Immobilienpreisen
- Analyse von Lernergebnissen
- Bevölkerungsprognosen