zum Directory-modus

Allgemeine Multivariate Datenanalyse

Regressionskoeffizient

Während bei der Korrelationsanalyse nicht von vorneherein angenommen wurde, dass ein funktionaler Zusammenhang zwischen den Variablen bestand, versucht die Regressionsanalyse zu klären, welchen Einfluss im Mittel die Einflussgröße x auf die Zielgröße y hat. Ein Maß ist bei einem linearen Zusammenhang die Steigung b der Regressionsgeraden y = a + b x , die mit dem Korrelationskoeffizienten r ( x , y ) zusammenhängt.

b = s x y s x 2 = r ( x , y ) s y s x s x y = Kovarianz s x 2 = Varianz s x , s y = Standardabweichungen

Man unterscheidet in diesem Fall immer prinzipiell zwei unterschiedliche Situationen.

Funktionale Abhängigkeiten:
Einflussgröße und Zielgröße bilden eine scharf definierte funktionale Beziehung der klassischen Mathematik.
Stochastische Zusammenhänge:
Einflussgröße und Zielgröße bilden eine durch die Existenz zufälliger Variabler charakterisierte stochastische Beziehung mit einer bestimmten Streubreite (Schwankungen).

In folgender Abbildung sind für verschiedene Steigungen von Ausgleichsgeraden die Regressionskoeffizienten b für unterschiedliches Ausmaß an Streuung eingezeichnet.

Abb.1

Regressionskoeffizienten für verschiedene Zusammenhänge bei unterschiedlicher Streuung.

Je nachdem ob Zielgröße (abhängige Variable ) und Einflussgröße (unabhängige Variable) vertauscht werden, erhält man zwei Regressionslinien mit den entsprechenden Fehlerbalken:

d = y y ^ d ' = x x ^ d = Differenz (Fehler von Regressionslinie  y  auf  x ) d ' = Differenz (Fehler von Regressionslinie  x  auf  y ) x = unabhängige Variable (abhängige Variable) y = abhängige Variable (unabhängige Variable) y ^ , x ^ = Schätzwerte

Durch Minimalisierung der Differenzen (Methode der Fehlerquadrate nach Gauß) werden zwei Regressionsgeraden erhalten:

Abb.2

Regressionslinien bei Vertauschen von abhängiger und unabhängiger Variabler.

Werden beide Variablen als fehlerbehaftet angesehen, so muss ein unabhängiger (independenter) Ausgleich durchgeführt werden.

Mit zunehmender Abhängigkeit bzw. Korrelation wird der Winkel zwischen den beiden Geraden kleiner, die beiden Ausgleichsgeraden fallen schließlich zusammen und der Betrag des Korrelationskoeffizienten wird | r | = | r ( x , y ) | = 1 und die Korrelation wird als extrem stark bezeichnet. Es läßt sich zeigen, dass der Korrelationskoeffizient das geometrische Mittel der beiden Steigungen darstellt:

r = b b ' = s x y s x s y = b s x s y

Abb.3

Zusammenhang Korrelation und Regression.

Abb.4

Wenn der Korrelationskoeffizient gleich null ist, verlaufen die beiden Regressionslinien parallel zu den Koordinatenachsen ( α = 90 ) und zwischen den beiden Variablen besteht kein Zusammenhang (keine Korrelation).

Seite 5 von 15