zum Directory-modus

Statistische Prüfverfahren

Einfache ANOVA

Im folgenden wird ein allgemeines Verfahren beschrieben:

Für eine sichere Erfassung mehrerer wesentlicher Einflussgrößen ist es notwendig, dass die Beobachtungswerte systematischer untersucht werden. Eine Verallgemeinerung dieser Probleme auf inhomogenes Zahlenmaterial, bei dem mehr als eine Fehlerursache wirksam sein kann (z.B. Probennahme und Analysenfehler), bzw. auf den Vergleich von mehr als zwei Mittelwerten, erlaubt die einfache Varianzanalyse. Ihre Anwendung ist an die Bedingung eines normal verteilten Zahlenmateriales geknüpft, dessen einzelne Messwerte unabhängig voneinander entstanden sind.

Typisch für eine Varianzanalyse ist, dass eine beobachtete Gesamtvarianz in Anteile zerlegt wird, denen Ursachenkomplexe zugeordnet werden. Bei der einfachen Varianzanalyse sind dies zwei Anteile:

  • einer entspricht dem Einfluß des Zufalls,
  • der andere dem Einfluß, den man untersuchen will.

Man vergleicht also nicht nur ein Paar von Varianzen oder ein Paar von Mittelwerten jeweils einzeln, sondern berücksichtigt, dass es sich nicht um unabhängige, isolierte Ereignisse handelt. Es müssen also die Gesamtwahrscheinlichkeiten herangezogen werden.

Die Varianzanalyse erlaubt uns zu erkennen, welchen Einfluss Einzelstreuungen für jede Messgröße bzw. Methode oder Messserie auf die Gesamtvarianz haben. Aus diesem Grund können wir dadurch besser bestimmen, welche experimentellen Bedingungen zu optimaleren Ergebnissen führen.

Erstens wird statt vieler t-Tests, um die Mittelwerte mehrerer Versuchsreihen, Methoden (M) oder Stichproben zu vergleichen, nur ein einziger F-Test zwischen zwei Varianzen benötigt. Bei diesen Varianzen handelt es sich:

  1. um die Summation der Differenzen zwischen den Gruppen- und dem Gesamtmittel (SSF)
  2. um die Summenquadrate der Abweichungen der Einzelwerte vom Gruppenmittel (SSres).

Dies bedeutet also die Summenquadrate der Abweichung des Spaltenmittels vom Großmittel dividiert durch die Summe über alle Abweichungen von Spaltenmitteln. Dieser Quotient sollte dann ungefähr gleich groß sein, wenn alle Gruppen derselben Grundgesamtheit entstammen. Sind sie es nicht, d.h. ist der Quotient größer als die durch a und die Freiheitsgrade festgelegten kritischen Werte der F-Verteilung, so befinden sich unter den M Gruppen solche mit unterschiedlichen Mittelwerten. Die Nullhypothese wird somit anhand dieser Prüfgröße abgelehnt, wenn

F ˆ > F ( M 1 ; n M ; α ) (inhomogen) n = j = 1 M n j = j = 1 M R j = R M

Letzteres gilt dann, wenn die Stichprobenumfänge für alle Methoden (Spalten) gleich sind. Sonst muss in den folgenden Formeln zwischen R und Rj unterschieden werden. Dabei bedeutet n die Gesamtanzahl aller Werte in den insgesamt M Spalten, die jeweils ni Zeilen haben. Diese Vorgehensweise erklärt sich dadurch, dass für die einfache Varianzanalyse sich die Summe der Abweichungsquadrate der Stichprobenwerte um das Gesamtmittel in zwei Anteile zerlegen läßt, nämlich

  1. in die Standardabweichung der Einzelwerte um die Gruppenmittelwerte und
  2. in die Standardabweichung der Gruppenmittelwerte um das Gesamtmittel.

Die mittleren Quadrate über alle Gruppen hinweg bezeichnet man auch als Stichprobenfehler und die mittleren Quadrate innerhalb einer Gruppe als Versuchsfehler.

Wichtig sind die Formeln:

F ˆ = S S F f F S S res f res
S S F = j M R j E ˆ j ( χ ) 2 E ˆ j ( χ ) 2 j M R j = M R E ˆ ( χ ) 2 f F = M 1 S S res = S S T j R j E ˆ j ( χ ) 2 F res = R M M = j R j M

Dieser F-Wert kann auch nach folgenden beiden Formeln berechnet werden:

F ˆ = 1 M 1 j R j ( E ˆ j ( χ ) E ˆ ( χ ) ) 2 1 M R M i , j ( χ i j E ˆ ( χ ) ) 2

bzw.

F ˆ = 1 M 1 j R j ( 1 M R i , j χ i j E ˆ ( χ ) ) 2 1 M R i , j var j ( R j 1 )

Die verschiedenen Bezeichnungen sind im folgenden nochmals aufgeführt zusammen mit den Freiheitsgraden F.

Abb.1
Schema einer ANOVA mit R (Replika = Zeilen), M (Anzahl der Methoden = Spalten)

Das Schema der Durchführung einer ANOVA ist in obiger Abbildung wiedergegeben.

Seite 34 von 37