Medianstatistik
Box-Whisker-Plot
Ein Box-Whisker-Plot (auch Boxplot genannt) ist eine graphische Darstellung (robuster) Verteilungsstatistiken, um zentrale Tendenz, Streuung, Schiefe und Spannweite einer Verteilung inkl. möglicher Ausreißer in einem Bild zusammenzufassen (Abb. 1) . Die Box umfasst die mittleren der Verteilung und reicht daher vom unteren bis zum oberen Quartil. Der Median wird durch einen senkrechten Strich an der entsprechenden Stelle in der Box deutlich gemacht. Der Box-Whisker-Plot nutzt also die Quartilen und den Median, um in einer Graphik alles darzustellen.
Die zwei Linien, die das Rechteck nach rechts und links (vgl. (Abb. 1) ) verlängern, werden als Antennen, Fühler oder Whisker bezeichnet. Durch sie werden die Werte dargestellt, die außerhalb der Box liegen. Dabei ist zu beachten, dass es verschiedene Möglichkeiten gibt, die Antennen einzuzeichnen. Manchmal reichen sie bis zum kleinsten bzw. größten Wert der Daten. In anderen Fällen beschränken sich Box-Whisker-Plot-Ersteller darauf, die Länge der Whisker maximal auf das 1,5-Fache des Quartilsabstands zu beschränken. Dabei enden sie aber nicht genau nach dieser Länge, sondern bei dem kleinsten bzw. größten Wert, der noch innerhalb dieser Grenze liegt. Werte außerhalb der Grenze werden häufig als "Ausreißer" eingetragen. In einer dritten Variante berechnet sich die Länge des unteren Whisker aus dem %-Quantil, die des oberen aus dem %-Quantil, sodass aller Werte innerhalb der Whiskergrenzen liegen.
In (Abb. 1) zeigt der Box-Whisker-Plot eine große Spannweite der Daten und unsymmetrische Verteilung, daher ist es in diesem Fall sinnvoll, die robuste Medianstatistik einer Mittelwertstatistik vorzuziehen.