1.3.10 Auf das Ziel kommt es an: Einseitige und zweiseitige Signifikanztests.

Video: © Prof. Dr. Kristina Reiss, München

Meine Notizen zu dieser Seite:

Auf das Ziel kommt es an: Einseitige und zweiseitige Signifikanztests.

Anmelden, um den Bearbeitungsstand zu speichern.

30 Auf das Ziel kommt es an: Einseitige und zweiseitige Signifikanztests.

Folie 0

Herzlich willkommen zu dieser letzten Folge über Statistik und Wahrscheinlichkeit. Es geht heute um die Signifikanz, also um die Bedeutsamkeit eines statistisch gewonnenen Ergebnisses.

Folie 1

Insbesondere betrachten wir noch einmal den Hypothesentest.

Wir beschäftigen uns mit einer begründeten und statistisch abgesicherten Aussage darüber, ob eine Hypothese in Bezug auf die Grundgesamtheit abgelehnt wird oder nicht.

Wir haben es ja schon in der letzten Folge gesehen: Beim Ablehnen oder Nicht-Ablehnen einer Hypothese kann es Fehler geben. Wir möchten deshalb auch etwas mehr über einen möglichen Fehler wissen. Das Instrument dazu sind einseitige und zweiseitige Signifikanztests.

Wir schauen uns das gleich etwas genauer an.

Folie 2

Wie fast immer sollte der systematische Zugang hilfreich sein.

Entscheidet man sich für die Ablehnung bzw. das Beibehalten einer Ausgangshypothese H₀, dann kommen offensichtlich diese vier Möglichkeiten in Frage.

Wenn die Hypothese tatsächlich korrekt ist und man behält sie nach Prüfung bei, dann ist alles gut gelaufen. Gleiches gilt, wenn die Hypothese nicht korrekt ist und man sie nach Prüfung ablehnt. In den beiden anderen Fällen macht man aber ganz offensichtlich einen Fehler.

Folie 3

Nehmen wir als Beispiel die Hypothese: Eine hellgrüne Gesichtsmaske schützt zuverlässig vor einer Grippe. Wenn das nun tatsächlich der Fall ist und man lehnt die Hypothese fälschlicherweise ab, dann wird man sich hoffentlich mit anderen Mitteln vor Grippe schützen. Wenn eine hellgrüne Gesichtsmaske allerdings in Wirklichkeit kein Schutz vor Grippe ist und man dennoch von der Wirkung ausgeht, dann ist der Fehler durchaus ernsthafter. Man wird sich dann mit einer solchen Maske fälschlicherweise auf der sicheren Seite sehen.

Auf jeden Fall können wir festhalten, dass es sich in der Regel um sehr unterschiedliche Fehler handelt. Man benennt sie daher auch unterschiedlich und spricht vom Fehler 1. Art, wenn man eine wahre Hypothese fälschlicherweise ablehnt und vom Fehler 2. Art, wenn man eine nicht wahre Hypothese fälschlicherweise annimmt.

Folie 4

Lassen Sie uns zu den Signifikanztests kommen, hier spielt der Fehler 1. Art die tragende Rolle.

Bei einem Signifikanztest geht es darum, ob eine Nullhypothese fälschlicherweise abgelehnt wird, also ein Fehler 1. Art gemacht wird. Vorgegeben ist dabei ein Signifikanzniveau α.

Man unterscheidet zwei Möglichkeiten, die wir uns zunächst ganz formal anschauen. Es sind dies der linksseitige Signifikanztest und der rechtsseitige Signifikanztest. Aber keine Angst, wenn es etwas abstrakt aussieht, konkrete und anschauliche Beispiele folgen umgehend:

Bei einem linksseitigen Signifikanztest geht es darum, sich in Richtung kleinerer Werte abzusichern. Es gibt hier eine Nullhypothese der Form H₀: p = p₀ (oder auch H₀: p ≥ p₀), die gegen eine Gegenhypothese der Form H₁: p < p₀steht.

Bei einem rechtsseitigen Signifikanztest geht es darum, sich in Richtung größerer Werte abzusichern. Es gibt hier eine Nullhypothese der Form H₀: p = p₀ (oder auch H₀: p ≤ p₀), die gegen eine Gegenhypothese der Form H₁: p > p₀steht.

Folie 5

Grundlage für den einseitigen Signifikanztest ist der FEHLER der 1. ART.

Wir legen ein Signifikanzniveau α fest.

Wir prüfen mit der Nullhypothese H₀, ob die reale Wahrscheinlichkeit p für ein Ereignis höchstens so groß ist wie ein festgelegtes p₀.

Die Wahrscheinlichkeit, dass die Nullhypothese fälschlicherweise abgelehnt wird, soll dabei nicht größer als das Signifikanzniveau α sein.

Klingt das wieder einmal viel zu abstrakt? Kein Problem, wir schauen uns Beispiele an.

Folie 6

Das erste Beispiel betrifft den linksseitigen Signifikanztest.

Eine Prüfung in Mathematik wird in der Regel von 20% der Studentinnen und Studenten nicht bestanden. In diesem Jahr ist nun der Studienplan umgestellt worden. Es soll überprüft werden, ob jetzt ein kleinerer Prozentsatz der Studierenden die Prüfung nicht bestanden hat (und nur diese Änderung nach unten interessiert dabei).

Folie 7

Und nun noch ein Beispiel, bei dem ein rechtsseitiger Signifikanztest sinnvoll wäre.

Ein Obsthändler kauft auf dem Großmarkt Aprikosen ein. Er stellt fest, dass 5% der Aprikosen faule Stellen aufweisen und vermutet, dass dieser Anteil größer als bei der letzten Lieferung ist (und nur diese Änderung nach oben interessiert ihn).

Folie 8

Und natürlich ist alles eine Frage der konkreten Beschreibung des Problems. Links und rechts darf man nämlich gerne ändern.

Man kann ja genauso davon ausgehen, dass 80% der Studentinnen und Studenten die Prüfung bestanden haben. Die Frage ist, ob es nach der Änderung ein paar mehr sind. Genauso kann man festlegen, dass 95% der Aprikosen in Ordnung waren und fragen, ob es nun weniger sind.

Wichtig ist nur, diese Festlegung klar und eindeutig und natürlich vor der Durchführung des Signifikanztests zu machen.

Folie 9

Probieren wir es einmal mit konkreten Zahlen. Hier ist die Aufgabe:

In der Klasse 8a der Marie-Curie-Schule haben 6 von 32 Schülerinnen und Schülern einen Mathematiktest nicht bestanden. „Liebe Güte, mindestens ein Viertel hat von Mathematik keine Ahnung,“ stöhnt der Klassenlehrer.

Stimmt das so? Es sind doch eigentlich nur etwas mehr als 18%, die ohne Erfolg den Test absolviert haben. Kann die Aussage auf einem Signifikanzniveau von 5% bestätigt werden?

Versuchen Sie zunächst einmal selbst eine Lösung und denken Sie an das, was wir in Folge 29 erarbeitet haben.

Folie 10

Das ist die Ausgangshypothese: Mindestens ein Viertel bedeutet p₀ ≥ 0,25. Wir wählen α = 0,05.

Und mit diesen Werten kann man rechnen. Tatsächlich ist und schon .

Die reichlich emotionale Hypothese sollte also nicht abgelehnt werden. Es dürfte höchstens drei Schülerinnen und Schüler mit nicht bestandenem Test geben, um die Hypothese mit angemessener Wahrscheinlichkeit abzulehnen. Aber vielleicht wird es im nächsten Test in dieser Klasse schon besser.

Folie 11

Bleiben wir beim Thema, betrachten wir noch einen Mathematiktest. Einerseits versteht man Probleme dieser Art sofort und andererseits lässt sich damit einfach gut rechnen.

In der Jahrgangsstufe 8 der Marie-Curie-Schule haben 18 von 100 Schülerinnen und Schülern einen Mathematiktest nicht bestanden. „Liebe Güte, mindestens ein Viertel hat von Mathematik keine Ahnung,“ stöhnt die Direktorin.

Stimmt das so? Es sind ja genau 18%, also deutlich weniger als 25%. Klappt es dieses Mal auch mit einem Signifikanzniveau von 5%?

Versuchen Sie auch hier zunächst eine Lösung der Aufgabe.

Folie 12

Es ist auch dieses Mal die Hypothese, dass p₀ ≥ 0,25 ist. Genauso wählen wir wieder α = 0,05.

Tatsächlich ist in diesem Fall

Die reichlich emotionale Hypothese sollte also auch dieses Mal nicht abgelehnt werden. Es sieht allerdings knapp aus, oder?

Und darum schauen wir uns noch einen dritten Mathematiktest an. Keine Angst, es ist der letzte für heute.

Folie 13

In verschiedenen 8. Klassen haben 180 von 1000 Schülerinnen und Schülern einen Mathematiktest nicht bestanden. „Liebe Güte, mindestens ein Viertel hat von Mathematik keine Ahnung,“ stöhnt die Bildungsministerin.

Stimmt das so? Klappt es wieder mit einem Signifikanzniveau von 5%?

Folie 14

Noch einmal ist p₀ ≥ 0,25 die Hypothese. Wir wählen ebenso wieder ein Signifikanzniveau von α = 0,05.

Dann ist .

Die Hypothese sollte in diesem Fall also abgelehnt werden.

Dabei ist ein Fehler 1. Art möglich, aber eher unwahrscheinlich, denn

und erst ganz weit hinter dem Komma findet man bei dieser Zahl ein paar Dezimalstellen, die von Null verschieden sind.

Es war jedes Mal dieselbe Hypothese, jedes Mal lag der reale Wert um die 18%. Interessant, nicht wahr? Und ganz klar. Hier spielt die Größenordnung der Stichprobe die tragende Rolle.

Folie 15

Betrachten wir noch den zweiseitigen Signifikanztest.

Geht es bei einem Hypothesentest darum, ob sich die Wahrscheinlichkeit eines Ereignisses gegenüber dem angenommenen Wert verändert und es egal ist, in welche Richtung das geht, so handelt es sich um einen zweiseitigen Signifikanztest.

Konkret: Bei einem zweiseitigen Signifikanztest gibt es eine Nullhypothese H₀: p = p₀, die gegen eine Gegenhypothese H₁: p ≠ p₀steht.

Folie 16

Hier ist ein Beispiel. Wir wählen einmal wieder den Münzwurf und prüfen, ob eine Münze fair, also eine Laplace-Münze ist.

Es wird 100-mal geworfen, wir erwarten p = 0,5.

Wenn allerdings weniger als 45-mal oder mehr als 55-mal „Kopf“ fällt, dann – so denken wir – kann die Münze eigentlich nicht fair sein, also wäre dann p ≠ 0,5 und das offensichtlich nicht in Ordnung.

Wir gehen allerdings zunächst davon aus, dass die Münze fair ist. Das ist die Ausgangshypothese H₀. Wir berechnen die Wahrscheinlichkeit, mit der das oben genannte Ereignis dann auftreten würde.

Die Zufallsgröße X = „Anzahl Kopf“ ist entsprechend binomialverteilt mit den Parametern 100 und 0,5.

Folie 17

Lassen Sie uns rechnen.

≈ 0,1356 + 0,1356 ≈ 0,2712

Offensichtlich kann die Hypothese, dass wir es mit einer fairen Münze zu tun haben, nicht abgelehnt werden. Mit einer Wahrscheinlichkeit von etwas über 27% würde man sich irren. Das ist viel zu hoch, um die Nullhypothese zu verwerfen.

Folie 18

Der Münzwurf müsste wohl deutlich abweichendere Ergebnisse haben, wenn die Hypothese der Fairness verworfen werden soll.

Nehmen wir neue Werte, weniger als 40-Mal oder mehr als 60-Mal soll „Kopf“ erscheinen. Das sieht so aus:

P(X < 40 oder X > 60 | p = 0,5)

≈ 0,0176 + 0,0176 ≈ 0,0352

Das Ergebnis fällt nun deutlich klarer aus. Die Wahrscheinlichkeit, dass die Hypothese zu Unrecht abgelehnt wird, beträgt nur noch etwa 3,5%.

In diesem Fall ist – mit anderen Worten gesprochen – das Risiko gering, die Münze als „nicht fair“ zu beurteilen obwohl sie es eigentlich ist.

Folie 19

Und auch hier hängt viel davon ab, wie groß die Stichprobe ist.

Wir betrachten noch einmal ein Ergebnis, bei dem in weniger als 45% oder mehr als 55% der Fälle „Kopf“ geworfen wird. Lassen Sie uns dazu nun 1000-Mal die Münze werfen.

P(X < 450 oder X > 550 | p = 0,5)

≈ 0,0007 + 0,0007 ≈ 0,0014

Offensichtlich sollte die Hypothese jetzt abgelehnt werden, die Irrtumswahrscheinlichkeit dabei ist gering.

Sie erinnern sich an das Gesetz der großen Zahlen? Hier zeigt es sich in den praktischen Berechnungen.

Folie 20

Offensichtlich könnte man auch in umgekehrter Richtung vorgehen und einen Wert für die maximal erlaubte Irrtumswahrscheinlichkeit – und das ist das Signifikanzniveau – vorgeben.

Wählen wir also α = 0,01 und n = 100, also eine maximale Irrtumswahrscheinlichkeit von 1%.

Dann ist und

, also

Für den Bereich [37,63] wäre dieses α übertroffen, wir würden also die Hypothese einer fairen Münze nicht ablehnen.

Folie 21

Schauen wir uns noch einmal die möglichen Fehler an. Sie ergeben sich – wie wir es schon gesehen haben – leicht aus der Systematik. Man redet übrigens auch vom α-Fehler, wenn man den der 1. Art meint, und vom β-Fehler, wenn es um die 2. Art geht.

Sie sehen hier noch einmal die entsprechende Tabelle.

Folie 22

Wenden wir die Systematik noch einmal auf das Beispiel mit der fairen Münze an.

Die Ausgangshypothese ist: Die Münze ist fair und insbesondere echt. Beim α-Fehler wird diese Hypothese fälschlicherweise abgelehnt. Dann werfen wir gutes Geld in den Mülleimer. Beim β-Fehler wird sie fälschlicherweise nicht abgelehnt. Dann bringen wir Falschgeld in den Umlauf. Urteilen Sie selbst, was verzeihlicher ist.

Folie 23

Üblicherweise wird eine Hypothese (die das Gegenteil von dem enthält, was man beweisen will) erst dann verworfen, wenn die Irrtumswahrscheinlichkeit kleiner oder gleich 5% („signifikant“) bzw. oft auch kleiner oder gleich 1% („hochsignifikant“) ist.

Aber ganz klar: Das sind Verabredungen, die man auch in anderer Art und Weise treffen könnte.

Man spricht allgemein vom Signifikanzniveau.

Folie 24

Sie wissen, das ist heute die letzte Folge, in der wir über Mathematik reden. Da dürfen die Gummibärchen keinesfalls fehlen.

Sie sehen auf der linken Seite mein Guthaben an Gummibärchen gestern um diese Zeit. Da war statistisch gesehen alles in Ordnung, die einzelnen Farben wichen nicht signifikant von dem Sechstel ab, das man erwarten würde.

Dann kam Besuch, der am liebsten grüne und dunkelrote Gummibärchen mag. Den Stand danach sehen Sie auf der rechten Seite. Hat der Besuch für eine statistisch signifikante Abweichung gesorgt?

Folie 25

Rechnen Sie nach. Insgesamt sind 70 Gummibärchen übrig.

Wir nehmen eine Wahrscheinlichkeit von p = 1/6 für jede der sechs Farben an.

Auf einem Signifikanzniveau von α = 0.05 = 5% ist dann tatsächlich nur die Anzahl der weißen Gummibärchen signifikant zu hoch. Und auf einem Niveau von 1% ist sogar keine der Farben mehr zu häufig oder zu wenig vertreten.

So ist es eben: Wenn die Stichprobe klein ist, dann braucht es kräftige Abweichungen, damit sie sich als statistisch signifikant erweisen.

Folie 26

Das war es nicht nur für heute, das war die Fortbildung zur Statistik und Wahrscheinlichkeit. Es hat mir viel Spaß gemacht mit Ihnen zu arbeiten. Ich hoffe sehr, dass Sie viele Anregungen für Ihren Unterricht mitnehmen konnten und umsetzen werden. Auf Wiedersehen, machen Sie es gut und vergessen Sie nicht: Fast alles im Leben ist unsicher, man sollte einfach versuchen, diese Unsicherheiten besser zu verstehen. Wie gut, dass die Mathematik hier eine zuverlässige Hilfe ist.

Auf das Ziel kommt es an: Einseitige und zweiseitige Signifikanztests.

Tipp: Anmelden und Bearbeitungsstand speichern