Open Source im professionellen Einsatz
Linux-Magazin 07/2015
© Sergey Hmelevskih, 123RF.com

© Sergey Hmelevskih, 123RF.com

Bei statistischen Überlegungen führt die Intuition zuweilen in die Irre

Falsch getippt

Selbst gestandenen Wissenschaftlern unterlaufen zuweilen Fehler beim Interpretieren von Statistiken. Mathematische Experimente können helfen, sich dagegen zu wappnen, und kleine Simulationen in Perl unterstützen den Lernprozess anschaulich

700

Drückt man einem Mensch-ärgere-dich-nicht-Spieler einen neuen Würfel in die Hand, mit dem er bei den ersten drei Würfen jeweils eine Eins erzielt, wird er vielleicht stutzig und die Seitenflächen kontrollieren (Abbildung 2). Dabei verlässt er sich auf sein Gefühl – doch wann könnte man wissenschaftlich nachweisen, dass mit einem Würfel etwas nicht stimmt? Nach fünf Würfen, die alle Einsen zeigen? Nach zehn?

Abbildung 2: Diese in Las Vegas erworbenen Würfel liefern nur gewinnträchtige Zahlenkombinationen.

Jedes Würfelexperiment ist ein Spiel mit Wahrscheinlichkeiten. Was dabei genau herauskommt, ist ein Produkt des Zufalls. Relevant ist dabei nicht der genaue Ausgang eines bestimmten Wurfs, sondern die Tendenz. Ein unglücklicher Brettspieler könnte auch mit einem regulären Würfel durchaus dreimal hintereinander eine Eins werfen. Solche Zufälle kommen zwar selten vor, aber es gibt sie, und deswegen wäre anzuraten, nicht schon aus derart wenigen Durchläufen Folgerungen über den Würfel abzuleiten.

Ein Wert namens "p"

Der Wissenschaftler definiert für das Experiment eine so genannte Nullhypothese (zum Beispiel: "Der Würfel ist fair" oder "Das Medikament zeigt keine Wirkung"), die aufgrund des Testergebnisses später entweder bestätigt oder verworfen wird. Den Irrtum, eine richtige Nullhypothese zu verwerfen, nennt der Statistiker einen "Fehler erster Art". Experimente legen vorab fest, mit welcher maximalen Wahrscheinlichkeit sie das Auftreten dieses Fehlers gerade noch akzeptieren, dieser Wert nennt sich Signifikanzniveau des Experiments.

Der so genannte p-Wert (Abbildung 1, [2]) ist ein Wahrscheinlichkeitswert zwischen 0 und 1, der sich während des Experiments berechnen lässt und der angibt, wie wahrscheinlich es ist, das gefundene oder ein noch extremeres Ergebnis zu erhalten. Je kleiner der p-Wert, desto signifikanter war der Test, und die Nullhypothese ist mit hoher Wahrscheinlichkeit falsch.

Abbildung 1: Der p-Wert gibt die Wahrscheinlichkeit an, mit der das Experiment noch "extremere" Werte als die gefundenen zeigt.

Zeigt eine 20-mal geworfene Münze zum Beispiel 14-mal Kopf (10-mal wäre zu erwarten), liegt der p-Wert mit 0,115 laut [2] noch gut über dem in wissenschaftlichen Kreisen üblichen Schwellenwert von 5 Prozent (0,05). Das Experiment kann die Nullhypothese ("Der Würfel ist fair") also guten Gewissens akzeptieren und hat mit maximal 5 Prozent Irrtumswahrscheinlichkeit belegt, dass die Münze erwartungsgemäß fällt. Wäre bei 20 Würfen nicht nur 14-, sondern gleich 15-mal Kopf vorgekommen, wäre der p-Wert mit 0,041 unter die 5-Prozent-Marke abgesackt und die Nullhypothese sowie die Qualität der Münze wären damit auf einmal fragwürdig erschienen.

Irren ist menschlich

Das Perl-Skript in Listing 1 wirft eine faire Münze mit den Seiten H (für Heads, Kopf) und T (für Tails, die Zahl-Seite) insgesamt 1000-mal und addiert dann, wie oft der Kopf oben lag. Daraus erechnet die Funktion »p_value()« ab Zeile 23 dann den p-Wert. Die Ausgabe des Skripts hilft bei der Entscheidung, ob die Münze regulär fiel oder eine Anomalie vorliegt:

Listing 1

coin-toss

01 #!/usr/local/bin/perl -w
02 use strict;
03 use Math::BigFloat;
04
05 my @sides  = qw( H T );
06 my $rounds = 1000;
07 my $tails  = 0;
08
09 for ( 1 .. $rounds ) {
10   my $side = $sides[ rand scalar @sides ];
11
12   if( $side eq "T" ) {
13     $tails++;
14   }
15 }
16
17 printf "Rounds:  $rounds\n";
18 printf "Tails:   $tails\n";
19 printf "p-value: Prozentf\n",
20   p_value( $tails, $rounds/2, $rounds );
21
22 ###########################################
23 sub p_value {
24 ###########################################
25   my( $tails, $expect, $rounds ) = @_;
26
27   my @vals = ( $tails < $expect ?
28                ( 1 .. $tails ) :
29                ( $tails .. $rounds ) );
30
31   my $sum = Math::BigFloat->new( 0 );
32
33   for my $val ( @vals ) {
34     my $nok =
35       Math::BigFloat->new( $rounds );
36     $nok->bnok( $val );
37     $sum->badd( $nok );
38   }
39
40   my $total = Math::BigFloat->new( 2 );
41   $total->bpow( $rounds );
42
43   return 2 *
44     $sum->bdiv( $total )->numify();
45 }
$ ./coin-toss
Rounds:  1000
Tails:   507
p-value: 0.182979

Bei 1000 Würfen kam also 507-mal Kopf, der p-Wert beträgt 0,18 und liegt solide über dem Schwellenwert von 5 Prozent. Damit lässt sich die Nullhypothese guten Gewissens akzeptieren.

Das Skript wählt aus dem Array »@sides« in jeder der 1000 Runden zufällig eines der beiden Symbole »H« oder »T« aus und legt damit fest, ob die Münze Kopf oder Zahl zeigt. Im letzteren Fall erhöht sie den Zähler »$tails« in Zeile 13 um 1 für die spätere Auswertung.

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 4 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

Linux-Magazin kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Marktanteil erstmals über 2 Prozent

    Laut dem Unternehmen Net Applications lag der Marktanteil von Linux auf Desktop-Systemen im Juni erstmals über 2 Prozent. W3Counter sieht sogar einen Anteil von fast 2,5 Prozent. Beide Zahlen sind jedoch mit Vorsicht zu genießen.

  • Jugend der Schwellenländer aufgeschlossen für IT

    Das Beratungsunternehmen Infosys untersuchte in einer Studie, wie aufgeschlossen die junge Generation in  Australien, Brasilien, China, Deutschland, Frankreich, Indien, Südafrika, den USA und Großbritannien gegenüber neuen Technologien ist. Dabei zeigte sich vor allem Jugendliche und junge Erwachsene in Schwellenländern technologiebewusst.

  • IT-Mittelstand ist optimistisch

    Der BITKOM-Mittelstandsindex klettert auf dem Spitzenwert von 75 Punkten. Vor allem Softwareanbieter und IT-Dienstleister sind optimistisch.

  • Hightech-Exporte legen 2014 um rund 7 Prozent zu

    Vor allem deutsche Hardware wird im Ausland stark nachgefragt.

  • Zuverlässigkeit geht vor

    In einer internationalen Studie hat der Storage-Hersteller Western Digital CIOs und Entscheidungsträger in wichtigen industrieländern nach ihren Plänen befragt.

comments powered by Disqus

Ausgabe 09/2016

Digitale Ausgabe: Preis € 6,40
(inkl. 19% MwSt.)

Artikelserien und interessante Workshops aus dem Magazin können Sie hier als Bundle erwerben.