zum Directory-modus

Tutorial MenueMultivariate DatenanalyseLerneinheit 4 von 6

Multivariate Datenanalyse - Hauptkomponentenanalyse

Beispiel für PCA

In diesem Kapitel wird die Hauptkomponentenanalyse (Principal Component Analysis, PCA) vorgestellt. Die PCA ist eine rein qualitative Projektionsmethode, welche einen hochdimensionalen Datensatz in einen niederdimensionalen Raum projiziert. Dabei versucht die PCA, die Varianzen der Objekte im ursprünglichen Raum möglichst gut mit dem neuen niederdimensionalen Raum abzudecken. Durch die Projektion der Sensorantworten (=hochdimensionaler Raum) in den niederdimensionalen Raum (sogenannte Hauptkomponenten) können die Zusammenhänge der Proben oft leicht graphisch sichtbar gemacht werden. Die PCA beruht auf der Annahme, dass nicht die gesamte gemessene Varianz für eine sinnvolle Interpretation wichtig ist, sondern nur der Teil, welcher sich auf die wichtigsten orthogonalen Hauptkomponenten projizieren lässt. Die Restvarianz enthält in vielen Fällen nur noch Geräterauschen.

In dem vorliegenden Beispiel wird die Funktionsweise der PCA ohne zu große mathematische Ausführungen graphisch dargestellt. Die einzelnen Schritte des Beispiels laufen folgendermaßen ab:

  • Mit zwei Sensoren werden verschiedene Obstsorten untersucht.
  • Die Proben werden im Sensorraum aufgetragen.
  • PCA wird rein graphisch dargestellt.
  • Die Proben werden im Raum der Hauptkomponenten aufgetragen.
  • Die Ergebnisse der Auftragung werden interpretiert.

Apfel

Die Messung der Apfelprobe mit dem 2-Sensor System liefert für den ersten Sensor ein hohes Signal und für den zweiten Sensor ein niedrigeres Signal.

Abb.1
Vermessung einer Apfelprobe

Trägt man die Sensorwerte für diese Probe im Sensorraum auf, so erhält man für den ersten Sensor mit dem hohen Signal sehr hohe Koordinatenwerte, während für den zweiten Sensor mit dem niedrigeren Signal sehr kleine Koordinatenwerte erhalten werden. Für dieses Beispiel ist der Sensorraum nur zweidimensional, da wir nur zwei Sensoren in unserem Mess-System haben.

Abb.2
Apfelprobe im Sensorraum

Banane

Die Messung der Bananenprobe mit dem 2-Sensor System liefert für beide Sensoren ein hohes Signal.

Abb.3
Vermessung einer Bananenprobe

Trägt man die Sensorwerte für diese Probe im Sensorraum auf, so erhält man für beide Sensoren hohe Koordinatenwerte.

Abb.4
Bananenprobe im Sensorraum

Traube

Die Messung der Traube ergibt für den ersten Sensor ein sehr niedriges Signal und für den zweiten Sensor ein hohes Signal.

Abb.5
Vermessung einer Traubenprobe

Die Abbildung (Abb. 6) zeigt nun die Auftragung der drei vermessenen Proben im Sensorraum.

Abb.6
Traubenprobe im Sensorraum

Himbeere

Die Messung der Himbeere ergibt für den ersten Sensor ein sehr niedriges Signal und für den zweiten Sensor ein mittel-hohes Signal.

Abb.7
Vermessung einer Himbeerenprobe

Die Abbildung (Abb. 7) zeigt nun die Auftragung aller vier vermessenen Proben im Sensorraum. Da in diesem 2-Sensor-System der original Sensorraum sehr niedrig-dimensional ist, kann man schon an diesem Bild sehen, dass sich die vier Proben im Sensorraum deutlich unterscheiden. In der Praxis werden jedoch sehr viel mehr Sensoren eingesetzt. Entsprechend höher-dimensional und komplizierter ist deshalb der Sensorraum, was dann den Einsatz der PCA nötig macht.

Abb.8
Himbeerenprobe im Sensorraum
Seite 2 von 10