Allgemeine Multivariate Datenanalyse
Lack of Fit
Wie folgende Abbildung zeigt, setzt sich die Residuenquadratsumme aus zwei Anteilen zusammen:
- einer Abweichung, die nicht durch Zufall erklärbar ist und mit Lack of Fit (LOF) bezeichnet wird, und
- einer zufälligen Streuung der Messwerte, für die in der Literatur der Begriff pure experimental (PE) geführt wird.
In der nachfolgenden Abbildung beziehen sich die verschiedenen Größen auf das Zahlenbeispiel der Seite Varianzananalyse.
- Abb.1
Messdaten mit einer Geradengleichung modelliert und ANOVA für lineare Regression mit Darstellung von lack of fit und weiterer Größen
Definiert man noch den Vektor für die um die Replikationen korrigierten Daten
, so erhält man die Quadratsummen
Für den Lack of Fit ergibt sich ein Prüfwert von
und ein Tabellenwert der Fisher-Verteilung von
mit
Da der Prüfwert kleiner als die kritische Größe (Tabellenwert) ist, ist die systematische Abweichung signifikant kleiner als die Streuung (Nullhypothese erfüllt).
Sowohl beim Lack of Fit (LOF) als auch beim Goodness of Fit (GOF) werden anders als beim normalen Fisher-Test ( ) immer die Definitionsgleichungen für den Prüfwert eingehalten. Beim normalen F-Test ist die größere Varianz der Zähler und die kleinere der Nenner. Falls der Prüfwert kleiner ist als der tabellierte Wert, macht der Test keine Aussage.
Für diesen Test sind Wiederholungsmessungen (Replikationen) Voraussetzung. J-Werte sind Mittelwerte von Replikationen.
Für den 3. und 4. Messwert des Zahlenbeispiels gilt:
In dem dargestellten Fall gilt eine Besonderheit. Da
erhält man für den 4. Messwert
und den 3. Messwert
Aus diesem Grunde sind in folgender Abbildung andere Wiederholungsmessungen gewählt worden, für die die Messwerte nicht mehr so nahe am Datenschwerpunkt liegen, so dass nicht mehr gleich wird.