zum Directory-modus

Allgemeine Multivariate Datenanalyse

Varianz/Kovarianzmatrix

Korrelation ist nicht nur zwischen zwei Variablen, sondern auch zwischen mehr Variablen möglich. z.B. werden die Konzentrationen von m Komponenten in n Proben vermessen. Die Konzentrationen der Komponenten in den Proben sollen in einem bestimmten Verhältnis, d.h. korreliert sein.

Der Mittelwert x ¯ j der Konzentrationen von Komponente j in den n Proben wird mit

x ¯ j = 1 n i = 1 n x i j x i j = Messwerte

berechnet. Die Varianz var ( j ) für eine Komponente in den Proben ist

var ( j ) = var ( x j ) = s x j 2 = 1 n 1 i = 1 n ( x i j x ¯ j ) 2

und die Kovarianz cov ( k , l ) für zwei Komponenten k , l ist

cov ( k , l ) = cov ( x k , x l ) = s k , l = 1 n 1 i = 1 n ( x ik x ¯ k ) ( x il x ¯ l )

Aus allen möglichen Kombinationen der Komponenten wird eine Kovarianzmatrix (Varianz-Kovarianzmatrix) erhalten:

C = ( cov ( 1,1 ) cov ( 2,1 ) cov ( 1, m ) cov ( 2,1 ) cov ( 2,2 ) cov ( 2, m ) cov ( m ,1 ) cov ( m ,2 ) cov ( m , m ) ) = ( var ( 1 ) cov ( 2,1 ) cov ( 1, m ) cov ( 2,1 ) var ( 2 ) cov ( 2, m ) cov ( m ,1 ) cov ( m ,2 ) var ( m ) )

Die Kovarianzmatrix ist quadratisch und symmetrisch ( c k l = c l k für alle k und l ).

Die n × m Messwerte werden in die Messwertmatrix X eingetragen:

x = ( x 11 x 12 x 1 m x 21 x 22 x 2 m x n 1 x n 2 x n m )

Werden die Spaltenmittelwerte x ¯ 1 , x ¯ 2 , x ¯ m von jedem Element der entsprechenden Spalte in der Messwertmatrix abgezogen, erhält man eine U-Matrix, bei der die Spalten den Mittelwert Null aufweisen:

( x 11 x ¯ 1 x 12 x ¯ 2 x 1 m x ¯ m x 21 x ¯ 1 x 22 x ¯ 2 x 2 m x ¯ m x n 1 x ¯ 1 x n 2 x ¯ 2 x n m x ¯ m ) = ( u 11 u 12 u 1 m u 21 u 22 u 2 m u n 1 u n 2 u n m ) = U

Die Kovarianzmatrix kann mit dieser U-Matrix als

C = U T U

dargestellt werden.

Seite 6 von 15