zum Directory-modus

Einführung in die multivariate Datenanalyse am Beispiel von Sensoren

True-Predicted Plots

Das Kalibrierungsmodell sollte unter allen Umständen mit Hilfe von unabhängigen Test- bzw. Validierdaten untersucht werden. Dabei werden die Testdaten in das Kalibrierungsmodell gegeben, welches aus den Sensorantworten die Konzentrationen der Analyten in den jeweiligen Proben berechnet (vorhersagt). Diese vorhergesagten Konzentrationen können dann mit den wahren, bekannten Konzentrationen verglichen werden. Dabei ist ein häufig angewandtes Verfahren der so genannte True-Predicted Plot. Bei diesem Plot werden die vorhergesagten Konzentrationen gegen die bekannten Konzentrationen aufgetragen.

Der erste Plot (Abb. 1) zeigt, wie ein gutes Kalibrierungsmodell in Verbindung mit guten Messungen aussehen sollte. Alle Vorhersagen sind sehr genau und liegen somit in der Nähe der Diagonalen:

Abb.1
Guter True-Predicted Plot

Der zweite Plot (Abb. 2) zeigt, dass die Vorhersagen nicht sehr präzise sind. Da für alle Konzentrationen die einzelnen Proben um die Diagonale herum streuen, sind keine systematischen Abweichungen erkennbar. Anhand der Plots lässt sich jedoch nicht klären, ob die Streuungen in den Vorhersagen auf die Messungen oder auf das Kalibrierungsmodell zurückzuführen sind:

Abb.2
Unpräziser True-Predicted Plot

Der dritte Plot (Abb. 3) demonstriert ein Modell mit systematischen Abweichungen. Die kleinsten Konzentrationen werden systematisch zu klein vorhergesagt, die mittleren Konzentrationen zu hoch und die höchsten Konzentrationen wieder systematisch zu niedrig. Dies ist ein typisches Beispiel dafür, dass der Zusammenhang zwischen den Konzentrationen der Analyte und den Sensorsignalen nichtlinear ist. In dem gezeigten Beispiel kann die Multiple Linear Regression (MLR) diesen nichtlinearen Zusammenhang nicht richtig erfassen:

Abb.3
Unpräziser True-Predicted Plot
Seite 33 von 36