Meine Notizen zu dieser Seite:

Angewandte Statistik: Ziffern einer Pandemie.

Folie 0

Hallo zusammen und herzlich willkommen zu einer neuen Folge, in der wir über Mathematik reden. Dieses Mal handelt es sich um eine ganz spezielle Folge, denn wir werden uns ausschließlich mit Zahlen beschäftigen, die im Rahmen der Covid-19 Pandemie sehr wichtig geworden sind.

Folie 1

Wir beschäftigen uns noch einmal Exponentialfunktionen, die wir in der letzten Folge ja schon ausführlich angeschaut haben. Dieses Mal geht es dabei um den konkreten Zusammenhang mit der Pandemie. Von der Inzidenz und vom R-Wert haben Sie auch schon gehört. Auch hinter diese Begriffe schauen wir im Detail und anhand von Beispielen.

Folie 2

Lassen Sie uns überlegen, was die Exponentialfunktionen mit der Pandemie um Covid-19 zu tun hat.

Nehmen wir an, in einer Stadt gibt es zu Beginn einer Pandemie 10 Erkrankte. Nehmen wir nun an, ihre Zahl verdoppelt sich jede Woche. Sie sehen die Zahlen. Nach sieben Wochen wären es 1.280 Erkrankte und nach der doppelten Zeit, also nach vierzehn Wochen bereits 162.840 Erkrankte und das sind mehr als 100-Mal so viel.

Folie 3

Mehr als eine Million wären es bereits nach Woche 17. Aber nein, ganz so übel wie die mathematische Theorie ist die Realität im Allgemeinen nicht.

Aber es gibt wichtige Bezüge zwischen Theorie und Praxis. Wir wollen das an einem Beispiel betrachten.

Folie 4

Wie so oft muss man bei der Praxis ins Detail gehen. Wir haben weltweit über Wochen hinweg Anstiege der Zahlen von Neuinfizierten zur Kenntnis nehmen müssen. Doch die Realität funktioniert natürlich nicht ganz so glatt wie das Modell, das wir eben gesehen haben.

Gehen wir nach Spanien und in den Sommer 2021. Hier gab es in Bezug auf Corona (gerundet und ohne Gewähr für ganz korrekte Zahlen) am

23.06.2021    3.400 Neuinfektionen

30.06.2021    4.400 Neuinfektionen

06.07.2021    10.600 Neuinfektionen

13.07.2021    15.400 Neuinfektionen

20.07.2021    27.400 Neuinfektionen

Das sind erschreckende Zahlen, hinter denen sich auch viel persönliches Leid verbirgt.

Betrachten wir nun die Mathematik, die hinter den Zahlen steckt. Es handelt sich hier tatsächlich nicht um ein lineares Wachstum, bei dem täglich eine mehr oder minder feste Zahl als Summand hinzukommen würde. Konkret sind es 1000 Infektionen mehr von Woche 1 zu Woche 2, etwa 6000 mehr von Woche 2 zu Woche 3, etwa 5000 von Woche 3 zu Woche 4 und 12.000 von Woche 4 zu Woche 5.

Sie sehen auf der rechten Seite, dass diese Zahlen einem variierenden Muster folgen, denn nicht immer zeigt sich derselbe Faktor, man multipliziert also nicht immer mit derselben Zahl. So steigen die Neuinfektionen von der ersten zur zweiten Woche hier angegebenen Woche um den Faktor 1,3, von der zweiten zur dritten Woche um den Faktor 2,4, von der dritten zur vierten Woche um den Faktor 1,5 und von der vierten zur fünften Woche um den Faktor 1,8.

Folie 5

Ein kleiner Trost für Spanien: Anschließend sanken die Zahlen wieder und noch einmal habe ich die entsprechenden Faktoren berechnet. Sie liegen alle unter 1 – ganz klar, mit einem größeren Faktor als 1 ist kein Rückgang möglich.

Man redet hier von einer exponentiellen Abnahme – und der geschah zu Beginn sogar recht bilderbuchmäßig mit dem stetigen Faktor 0,9.

Folie 6

Die absoluten Zahlen sind manchmal schwer zu interpretieren, denn sie hängen ja in diesem Fall davon ab, wie viele Einwohnerinnen und Einwohner ein Land hat. Deswegen greift man oft zu relativen Zahlen. Und bekommt dabei die Inzidenz.

Wir hatten das schon einmal in einer früheren Folge gesehen. Man dividiert die Anzahl der Neuinfektionen der letzten sieben Tage durch die Anzahl der Einwohnerinnen und Einwohner eines Landes und multipliziert diese Zahl mit 100.000. Da ist nichts anderes als das Komma um fünf Stellen nach rechts zu schieben – eine Stelle für jede Null der Zahl 100.000.

Deutschland hat etwa 83 Millionen Einwohnerinnen und Einwohner. Dividiert man die Zahl 92.877 der Neuinfektionen durch die 83 Millionen, dann bekommt 0,00112 und entsprechend eine Inzidenz von 0,00112 • 100.000 = 112 für diese hier gezeigte Woche im März.

Noch einmal, die hier gezeigten Zahlen sind schon etwas älter. Da der Stand der Dinge sich aber ohnehin ständig ändert, kann man das Prinzip der Berechnung auch mit diesen Zahlen gut sehen.

Folie 7

Die Inzidenz zeigt also an, wie viele Menschen pro 100.000 Einwohnerinnen und Einwohner im Verlauf von 7 Tagen positiv auf das Virus getestet wurden.

Warum nimmt man den Wert über sieben Tage? Ganz einfach. Weil es beim Zählen immer wieder Schwankungen gibt zum Beispiel wegen des Wochenendes oder eines Feiertags. Damit ist dieser Wert, der eine ganze Woche berücksichtigt, zuverlässiger.

Noch eines zur Inzidenz: Mit den gleichen Rechenschritten (und natürlich anderen Zahlen) könnte man auch bestimmen, wie viele Menschen sich relativ zur Bevölkerung mit einer Infektion im Krankenhaus befinden. Auch da sind ja zum einen die relativen Zahlen interessant, die die Bevölkerungszahl berücksichtigen. Und zum anderen gilt es, Schwankungen an bestimmten Tagen auszugleichen, also das Geschehen über einen gewissen Zeitraum hinweg zu betrachten.

Folie 8

Betrachten wir schließlich noch den R-Wert, auch so eine Zahl rund um Corona.

Es ist die so genannte Reproduktionszahl. Sie gibt an, wie viele andere Menschen durch eine infizierte Person angesteckt werden. So heißt R = 1,25, dass 100 erkrankte Personen weitere 125 Personen neu anstecken. Der Wert R = 0,75 bedeutet, dass 100 erkrankte Personen weitere 75 Personen neu anstecken.

Aber Achtung: Die Reproduktionszahl ist ein Schätzwert. Sie kann nicht genau erfasst werden. Entsprechend wird in den Beispielen, die wir gerade betrachtet haben, die genannte Zahl nur ungefähr mit der Realität übereinstimmen, also ungefähr 75, ungefähr 125 sein. Und vor allem müssen die geschätzten R-Werte etwa von 1,05 und von 0,95 in der Realität nicht unbedingt verschieden sein.

Man bestimmt den Wert bis auf einen ebenfalls abschätzbaren Fehler, das sogenannte Konfidenzintervall. Darüber reden wir in einer späteren Folge im Detail, aber lassen Sie uns hier eine Annäherung versuchen.

Folie 9

Was ist ein Konfidenzintervall?

Zunächst einmal handelt es sich um einen zentralen, aber nicht ganz einfachen Begriff der Statistik.

In ihm spiegelt sich der Fakt wider, dass es in diesem mathematischen Gebiet in der Regel kein schlichtes richtig oder falsch gibt, sondern man sich den Fakten zumeist nur nähern kann.

Stellen Sie sich vor, Sie befragen zufällig ausgewählte 1000 Vorschulkinder nach ihrer Lieblingsfarbe von Gummibärchen. Bei dieser Befragung entscheiden sich 450, also 45% für die orangen Gummibärchen. Dann ist doch plausibel, dass eine andere repräsentative Stichprobe einen ähnlichen Wert ergeben würde – vielleicht 43%, vielleicht 44%, vielleicht auch 48% oder 49%.

Mit anderen Worten: Es spricht vieles dafür, dass auch ein zweiter gemessener Wert in einem eher kleinen Intervall um die 45% liegt. Aber sicher ist das natürlich nicht, es ist eben wieder nur wahrscheinlich.

In der Praxis gibt man meistens ein Intervall so an, dass der richtige Wert mit einer Wahrscheinlichkeit von 95% darin liegt. Das heißt aber auch, dass er mit einer Wahrscheinlichkeit von 5% außerhalb liegt. Noch einmal: an dieser Stelle müssen wir die Unsicherheit einfach akzeptieren.

Leider kann man das Konfidenzintervall nicht ganz einfach berechnen. Es ist insbesondere abhängig von der Größe der Stichprobe. In Bezug auf Corona braucht man also Informationen darüber, wie viele Personen eine infizierte Person neu angesteckt hat. Ganz offensichtlich haben wir es hier mit Zahlen zu tun, die nur schwierig zu erheben sind.

Folie 10

Man kann es ungefähr so ausdrücken: Das Konfidenzintervall ist ein Bereich rund um einen gemessenen Wert, in dem der wahre Wert mit großer Wahrscheinlichkeit liegt.

Folie 11

Lassen Sie uns ganz kurz zurückblicken. Wir haben uns mit drei Begriffen beschäftigt.

Nummer 1: Exponentielles Wachstum. In Bezug auf die Zahlen von Infizierten offensichtlich äußerst gefährlich. Gut, wenn man es erkennt.

Nummer 2: Inzidenz. Ein wichtiges Indiz für den Verlauf der Pandemie. Doch Vorsicht, ganz genau kann man solche Zahlen eigentlich nie erfassen. Es gibt Fehler beim Testen in beide Richtungen (falsch positiv und falsch negativ). Und es gibt Infizierte, die nie getestet wurden.

Nummer 3: Reproduktionszahl. Sie ist ein ungefährer Wert, der nach unten genauso wie nach oben abweichen könnte. Bei der Interpretation muss man diese Unsicherheit mit bedenken.

Ja, wie bereits kurz erwähnt gibt es andere Indikatoren für den Verlauf einer Pandemie wie etwa die Anzahl der Erkrankten in Intensivstationen oder der Personen, die von Folgeproblemen betroffen sind. Aber auch sie haben eines gemeinsam: Die notwendigen Daten sind nicht leicht zu erheben und mit einer gewissen Unsicherheit behaftet. Ohne Statistik kommt hier keine solide Bewertung aus.

Folie 12

Das war es für heute. Schön, dass Sie dabei waren. Haben Sie vielen Dank für Ihr Interesse.

Tipp: Anmelden und Bearbeitungsstand speichern

Wenn Sie sich anmelden, wird Ihr Bearbeitungsstand automatisch gespeichert und Sie können den Kurs später dort fortsetzen, wo Sie ihn unterbrochen haben. Nach Abschluss des Kurses erhalten Sie eine persönliche Teilnahmebescheinigung.

Mehr zu den Vorteilen