zum Directory-modus

Statistische Prüfverfahren

Teststärke (Macht)

  • Die Alternativen beim Hypothesentest sind nochmals in der folgenden Abbildung zusammengefaßt:
Abb.1
Messwertverteilungen

Test bei Alternativen: Schematische Darstellung von Verwerfungs- und Annahmebereich. Die Nullhypothese ist als freie Kurve gezeichnet, die Alternativhypothese grün unterlegt.

  • α und β   müssen dabei keineswegs gleich sein. Dies hängt nur davon ab, wo man den kritischen Wert der Teststatistik ansetzt. In der Abbildung beschreibt die linke Glockenkurve die Nullhypothese, die rechte eine spezifizierte einseitige Alternativhypothese (2. Hypothese).
  • Der Fehler 2. Art (gegeben durch die Wahrscheinlichkeit, eine falsche Nullhypothese beizubehalten) hängt ab:
    1. Vom Umfang der Stichprobe n : Je größer n ist, desto eher wird bei gegebenem Signifikanzniveau α ein Unterschied zwischen zwei Grundgesamtheiten entdeckt.
    2. Von der Eigenart des Testes, die man als Teststärke oder als Testschärfe (Güte, Macht, power) bezeichnet. Die Testschärfe ist umso größer
      • je höher der vom Test verwendete Informationsgehalt der Ausgangsdaten ist,
      • je mehr Voraussetzungen über die Verteilungen der Werte gemacht werden (ein Test, der Normalverteilung und Varianzhomogenität voraussetzt, ist normalerweise stärker als einer ohne Voraussetzungen).
  • Unter der Stärke eines Tests versteht man die Fähigkeit, Unterschiede zwischen zwei oder mehreren Stichproben aufzudecken. Wenn n , α   und der Stichprobenunterschied konstant gehalten werden, ist die Teststärke gegeben durch die Differenz 1 β .
  • Die Stärke eines Tests ist numerisch gleich der um eins verminderten Wahrscheinlichkeit, einen Fehler 2. Art zu machen. Geht man von einer einseitigen auf eine zweiseitige Fragestellung über, so vermindert sich die Teststärke.
  • Für den allgemeinen Gebrauch erhält man drei Regeln, wobei bei Statistikern allerdings Übereinkunft herrscht, dass man das Signifikanzniveau vor der Datengewinnung festlegt.
    1. Die geprüfte Nullhypothese wird abgelehnt, wenn Fehler 1. Art in weniger als 100 ( α = 1   % ) aller Fälle auftreten können. Der betrachtete Unterschied gilt dann als signifikant; α 0,01 (Risiko I sehr klein, berechneter Wert von Nullwert sehr weit entfernt; 1 β sehr groß).
    2. Die geprüfte Nullhypothese wird angenommen, wenn Fehler 1. Art in mehr als 5   %   aller Fälle möglich sind. Der betrachtete Unterschied wird dann als nicht beweiskräftig angesehen, da α bezogen auf den kritischen Wert sehr groß ist und 1 β klein ist.
    3. Die Ablehnung einer Nullhypothese ist in Erwägung zu ziehen, wenn der Zahlenwert für den möglichen Fehler erster Art zwischen 5   % und 1   %   liegt. Man sieht den betrachteten Unterschied als fraglich an. Eine Klärung ist meist durch Hinzunahme weiterer Messungen möglich.
Seite 9 von 37