zum Directory-modus

Allgemeine Multivariate Datenanalyse

Hauptkomponentenanalyse

Durch die Mustererkennung wird versucht, ein p-dimensionales Problem in einen Raum niederer Dimension zu transformieren (möglichst Fläche). Man betrachtet bei der Hauptkomponentenanalyse (principal component analysis, PCA) die p Merkmale als Achsen eines p-dimensionalen Raumes. Jedes Objekt (Vektor: jeweils ein Messpunkt für jedes Merkmal: z.B. Extinktionswerte eines Spektrums) ist dann ein Punkt in diesem Merkmalsraum, dessen Lage durch die p "Merkmalswerte" (Extinktionen bei den verschiedenen Wellenlängen) eindeutig bestimmt ist. Die Projektion dieser Objektpunkte auf eine neue Ebene, die von jeweils neuen zwei orthogonalen Achsen aufgespannt wird (Hauptkomponenten, latente Variable statt der ursprünglichen Variablen genannt) liefert eine Darstellung, bei der die multivariaten Beziehungen der Merkmale untereinander verlorengehen. D.h. im Prinzip beschreibt diese Darstellung keine physikalische Realität mehr und ist daher umgekehrt auch nicht physikalisch interpretierbar. Allerdings bleiben Distanzmasse bzw. Nachbarschaftsverhältnisse erhalten.

Die verschiedenen Verfahren der Hauptkomponentenanalyse versuchen, den Kalibrierspektren relevante Information in einer Weise zu entziehen, die es dem Analytiker erlaubt, systematische Abweichung und Varianz vorteilhaft gegeneinander abzuwägen. Es bleibt also bei dem alten Problem, Aussagen über die Relevanz eines Datensatzes zu finden, die entscheidenden Kriterien zu extrahieren und deren Anzahl zu bestimmen.

Seite 14 von 15