zum Directory-modus

Allgemeine Multivariate Datenanalyse

Korrelationskoeffizient

Bei der Korrelationsanalyse wird die Abhängigkeit zweier zufälliger Variabler untersucht. Dies spielt z.B. bei der Umweltanalytik eine Rolle. Werden zwei Komponenten in einer Anzahl von Proben gemessen, so ist es wünschenswert, eine Korrelation zwischen den Konzentrationen der beiden Komponenten zu erhalten. Man sucht die lineare Korrelation zwischen (in diesem Falle) zwei Merkmalen X und Y, die durch die Kovarianz

cov ( x , y ) = ( x i x ¯ ) ( y i y ¯ ) n 1 x i , x i = Messwerte x ¯ , y ¯ = Mittelwerte

beschrieben wird. Die Kovarianz kann theoretisch Werte von + bis - annehmen. Deswegen wird sie skaliert und man erhält den von der gewählten Skala unabhängigen Korrelationskoeffizienten

r ( x , y ) = ( x i x ¯ ) ( y i y ¯ ) ( x i x ¯ ) 2 ( y i y ¯ ) 2

mit Werten zwischen -1 und +1. Verschiedene Korrelationen zeigt folgende Abbildung.

Abb.1

Korrelation in Abhängigkeit vom Datenmaterial bei einem linearen Zusammenhang (Modell)

Je nach Tauschen des Zusammenhanges y = f ( x ) bzw. x = g ( y ) wechselt das Vorzeichen des Korrelationskoeffizienten.

Seite 4 von 15