Folie 0
Einen wunderbaren guten Tag und herzlich willkommen. Wir reden heute über Statistik und das richtige Einordnen von Ergebnissen. Das ist eine ernsthafte Sache, ganz klar. Wir beginnen trotzdem mit einem nicht ganz ernsthaften Beispiel.
Folie 1
Lassen Sie sich also auf eine Geschichte ein, die genauso erfunden wie unseriös ist.
Es geht wieder einmal ums Prinzip und das kann man auch mit nicht ganz so ernsten Geschichten verstehen. Aber keine Angst, zum Schluss der Folge kommt dann doch noch ein (halbwegs) ordentliches Beispiel. Dabei spielen Seepferdchen eine tragende Rolle. Ein meines Erachtens besonders hübsches Exemplar sehen Sie hier auf dem Foto.
Folie 2
Von einem neuen Fleischskandal berichtete die Süddeutsche Zeitung vor einiger Zeit in einem Streiflicht, einer Rubrik, die nicht immer nur ernst gemeinte Geschichten erzählt. Die Frage war, ob in den von vielen Kindern heißgeliebten Fischstäbchen tatsächlich auch das Fleisch von Seepferdchen enthalten ist. Auch Seepferdchen werden heiß geliebt, allerdings eher in schwimmender Form.
Wir haben darüber mit Expertinnen und Experten – Sie sehen sie hier abgebildet – Interviews geführt. Und tatsächlich gehen diese davon aus, dass etwa 1% der Fischstäbchen kontaminiert ist, also eines von hundert Fischstäbchen das Fleisch von Seepferdchen enthält.
Folie 3
Die gute Nachricht: Es gibt einen haushaltstauglichen Test, der erkennt, ob Seepferdchenfleisch in die Fischstäbchen gemischt wurde. Er löst ggf. einen Seepferdchenalarm aus.
Nun erkennt der Test das hereingepanschte Seepferdchenfleisch zwar meistens, aber nicht immer. Er liefert aber immerhin in 90% der Fälle das richtige Ergebnis. Reicht das aus, um auf der sicheren Seite zu sein?
Folie 4
Angenommen, wir führen den Test mit einem Fischstäbchen durch und bekommen ein positives Testergebnis, also den gefürchteten Seepferdchen-Alarm. Offensichtlich kann dieses Testergebnis auch fehlerhaft, also falsch positiv sein.
Wie groß ist also die Wahrscheinlichkeit, dass bei einem positiven Testergebnis auch tatsächlich Seepferdchenfleisch in einem Fischstäbchen enthalten ist?
Folie 5
Geben Sie einen Tipp und schreiben Sie das Ergebnis auf.
Angenommen, wir führen den Test durch und bekommen ein positives Testergebnis. Ist das Fischstäbchen dann auf jeden Fall kontaminiert? Gilt das In etwa 90% der Fälle? Oder nur in etwa 50% der Fälle. Oder sind es gar weniger als 10% der Fälle, in denen ein positives Testergebnis auch wirklich stimmt und auf enthaltenes Seepferdchenfleisch korrekt hinweist.
Folie 6
Gehen wir – wie so oft bisher – systematisch an die Sache heran. Wenn 1% der Fischstäbchen kontaminiert sind, dann ist das eines von 100 oder 10 von 1000. Wir rechnen hier exemplarisch für 1000 Fischstäbchen. Dann findet man in 10 Fischstäbchen auch Seepferdchenfleisch und in 990 Fischstäbchen ist es nicht enthalten.
Folie 7
Nun erkennt der Test das richtige Ergebnis in 90% der Fälle, das sind 90 von 100 oder 900 von 1000 oder 9 von 10. Von den zehn Fischstäbchen, die Seepferdchenfleisch enthalten, werden also 9 korrekt erkannt. Aber eines rutscht durch. Es wird fälschlicherweise negativ getestet.
Wie sieht es bei den 990 übrigen Fischstäbchen aus? Ähnlich, klar. Es werden 90% negativ getestet und das sind 891 Stück, 10% - und das sind 99 – werden fälschlicherweise positiv getestet.
Addiert man 99 und 9, dann sind es 108 Fischstäbchen, die positiv getestet werden – darunter sind korrekt positive und falsch positive.
Folie 8
Korrekt positiv sind allerdings nur wenige, gerade einmal 9 Fischstäbchen. Also dividieren wir 9 durch 108 und sehen, dass ihr Anteil gerade einmal 8% beträgt. Erstaunlich, oder?
Folie 9
Wie sah Ihr Tipp aus? Wenn Sie das Problem nicht bereits kannten, dann lagen Sie vermutlich deutlich höher. Wie so oft bei Fragen der Statistik spielt uns die Wahrnehmung einen Streich und man unterschätzt intuitiv die recht hohe Zahl falsch positiver Ergebnisse.
Folie 10
Wo ist das Problem? Spezialisten gehen doch sicherlich richtig mit der Statistik um?
Nein, das scheint gar nicht so einfach zu sein. Und dann wir die Beurteilung durchaus zu einer ernsten Sache. In einer Studie beantworteten beispielsweise 60 Prozent befragter Ärztinnen und Ärzte eine ähnliche Frage zur Diagnose von Krankheiten falsch.
Wir schauen uns das gleich noch einmal an einem sehr ernsten Beispiel im Detail an.
Folie 11
Nichts Neues: Mit Daten umgehen bedeutet leider nicht, mit ihnen sinnvoll und angemessen umzugehen. Die Bedeutung eines korrekten Umgangs für den Alltag dürfte allerdings unbestritten sein.
Folie 12
Immer wieder COVID-19. Auch wenn es vielleicht nervt, für den Unterricht gerade in Statistik gibt das Thema einiges her.
So wurde viel diskutiert um die Zuverlässigkeit von Schnelltests. Um die Konsequenzen zu beurteilen, kann wiederum der gezielte Umgang mit statistischen Methoden nicht schaden.
Auch hier gibt es falsch-positive Testergebnisse. Das bedeutet, dass ein Mensch zwar ein positives Testergebnis bekommt, aber eigentlich nicht mit SARS-CoV-2 infiziert ist, dem Virus, das COVID-19 auslöst.
Bei der Zuverlässigkeit spielen viele Faktoren eine Rolle, einer davon ist die Virenlast bei den betroffenen Personen. So konkret können wir hier natürlich nicht arbeiten. Aber lassen Sie uns die Situation ganz einfach einmal durchspielen. Natürlich unter sehr, sehr vereinfachten Annahmen.
Folie 13
Die Frage ist, mit welcher Wahrscheinlichkeit eine positiv auf COVID-19 getestete Person auch tatsächlich mit dem Erreger der Krankheit infiziert? Um das zu beurteilen, machen wir ein paar grundlegende Annahmen.
Wir gehen von einer Inzidenz von 1.200 aus und schauen, was passiert, wenn ein Test mit einer Wahrscheinlichkeit von 75% oder 99% oder gar von 99,9% das korrekte Ergebnis zeigt. Gute Tests kommen übrigens unter guten Bedingungen tatsächlich auf sehr hohe Trefferquoten.
Folie 14
Wir gehen systematisch an die Sache heran. Nehmen wir an, wir sind in A-Stadt, einer Stadt mit 100.000 Einwohnerinnen und Einwohner.
Dort gibt es derzeit eine Sieben-Tage-Inzidenz von 1200, d. h. von 100.000 Menschen haben sich in den letzten sieben Tagen genau 1200 mit dem Virus infiziert. Wir nehmen außerdem und natürlich nicht sehr realistisch an, dass sich tatsächlich alle 100.000 Menschen in A-Stadt testen lassen.
Ach ja, und geben Sie doch wieder einen Tipp ab. Vielleicht klappt es dieses Mal besser.
Folie 15
Eine Sieben-Tage-Inzidenz von 1200 bedeutet, dass sich 1200 von 100.000 oder 1,2 von 100, also 1,2% der Bevölkerung infiziert haben. Angenommen, der Test erkennt das richtige Ergebnis in 75% der Fälle. Dann bestimmen wir die relevanten Zahlen genauso wie bei den Fischstäbchen.
Von 100.000 Personen sind 1200 infiziert, 98.800 nicht. Egal, ob mit oder ohne Infektion: Das korrekte Ergebnis liefert der Test in 75% der Fälle, das sind drei Viertel. Von den 1200 Infizierten werden folglich 900 korrekt identifiziert. Aber 300 werden fälschlicherweise negativ getestet. Von den 98.800 Nicht-Infizierten werden ebenfalls drei Viertel korrekt erkannt. Somit werden 74.100 dieser Personen korrekt negativ getestet. Allerdings bekommt ein Viertel – und das sind 24.700 Personen – das falsche, nämlich positive Ergebnis. Insgesamt liegt bei 24.700 + 900 = 25.600 Personen ein positives Testergebnis vor.
Folie 16
Bei einem solchen Test sind es also tatsächlich nur 3,5% bei denen ein positives Testergebnis und die Infektion mit dem Virus zusammenkommen.
Noch einmal: unser Gefühl für solche Situationen ist nicht wirklich gut entwickelt. Es ist sinnvoll, die Situation konkret zu skizzieren und entsprechend zu rechnen.
Folie 17
Nehmen wir an, der Test funktioniert zuverlässiger und zeigt in 99% der Fälle ein korrektes Ergebnis. Ich mag jetzt nicht alle Zahlen noch einmal wiederholen, rechnen Sie selbst nach. Ich bin hier jedenfalls auf insgesamt 2176 positiv getestete Personen gekommen, von den 1188 auch tatsächlich infiziert sind.
Folie 18
Und damit sind wir bei etwa 54,6% - ungefähr die Hälfte, ein immer noch hoher Wert.
Folie 19
Also machen wir einen weiteren Versuch in der fast perfekten Welt. Nehmen wir an, der Test funktioniert noch zuverlässiger und zeigt in 99,9% der Fälle ein korrektes Ergebnis.
Dann werden insgesamt 1298 Personen positiv getestet, von denen knapp 1200 auch tatsächlich das Virus in sich tragen.
Folie 20
Die Trefferquote steigt auf über 90%. Aber – und das ist wichtig – auch in der fast perfekten Welt können es nicht 100% sein, wenn die Testzuverlässigkeit darunter liegt.
Folie 21
Bitte vergessen Sie nicht, dass wir mit einem sehr einfachen Modell gearbeitet haben und die Realität bei weitem komplexer ist. Ganz offensichtlich ist die Rechnung von vielen Faktoren abhängig. So ist etwa wichtig, wie viele Menschen sich testen lassen und ob sich auch viele symptomfreie Menschen einem Test unterziehen.
Wir wollten nur das Prinzip klären und zeigen, dass mathematische Modelle garantiert kein Hexenwerk sind. Mathematik ist nicht mystisch, sondern sie folgt rationalen Überlegungen, die oft ganz einfach zu verstehen sind. Doch, glauben Sie mir, wenn man es Schritt für Schritt macht, dann ist man ganz oft erfolgreich.
Folie 22
Das war es dann auch für heute. Vielen Dank, dass Sie dabei waren. Ich freue mich auf das nächste Mal mit Ihnen, wenn wir wieder über Mathematik reden.
Wenn Sie sich anmelden, wird Ihr Bearbeitungsstand automatisch gespeichert und Sie können den Kurs später dort fortsetzen, wo Sie ihn unterbrochen haben. Nach Abschluss des Kurses erhalten Sie eine persönliche Teilnahmebescheinigung.