Meine Notizen zu dieser Seite:

Relative und absolute Häufigkeit: Noch einmal wunderbare Würfel.

9 Relative und absolute Häufigkeit: Noch einmal wunderbare Würfel.

Folie 0

Einen wunderschönen Tag für Sie. Wir sprechen heute über zwei wichtige Begriffe der Statistik, nämlich über die absolute Häufigkeit und die relative Häufigkeit. Und so ganz nebenbei kommt noch ein dritter zentraler Begriff hinzu und wir betrachten unterschiedliche Darstellungen von Daten.

Wir schauen uns übrigens einige Experimente noch einmal an, mit denen wir in vorigen Folgen bereits gearbeitet hatten. Das kann man in der Schule natürlich ganz genau so machen: Nutzen Sie gute Ideen mehr als einmal.

Folie 1

Lassen Sie uns würfeln. Wir nehmen einen Würfel und werfen damit 10-mal, 100-mal, 1000-mal.

Was Sie hier in der Tabelle sehen, sind die Ergebnisse. Und diese Ergebnisse sind Zahlen, die absolute Anzahl, wie oft eine bestimmte Zahl zwischen 1 und 6 gewürfelt wurde. Statt „Anzahl“ sagen wir „Häufigkeit“ und sprechen von der absoluten Häufigkeit für die Ergebnisse 1, 2, 3, 4, 5 oder 6.

Folie 2

Wenn man nun die Anteile der einzelnen Ergebnisse bestimmen möchte, dann ist es offensichtlich sinnvoll, die absoluten Häufigkeiten durch die Anzahl der Würfe zu teilen. Was man so bekommt, das ist die relative Häufigkeit.

Bei 10 Würfen sieht das noch ziemlich bunt aus, aber bei 1000 Würfen liegen diese Werte mit 0,16, 0,17 und 0,18 recht dicht beieinander, wobei hier auf zwei Stellen nach dem Komma gerundet wurde. Rechnen Sie nach: 1/6 = 0,166666 und das liegt tatsächlich zwischen 0,16 und 0,17.

Folie 3

Vielleicht erinnern Sie sich an diese Umfrage, wie Schülerinnen und Schüler in die Schule kommen. In der Tabelle stehen die absoluten Zahlen oder – ander ausgedrückt – die absoluten Häufigkeiten.

Folie 4

Addiert man die Zahlen, dann sieht man, dass 1073 Schülerinnen und Schüler an der Umfrage teilgenommen haben. Dividiert man die absoluten Häufigkeiten durch diese Zahl, dann bekommt man die relativen Häufigkeiten. Ich habe sie hier als Prozentzahlen geschrieben und auf eine Stelle nach dem Komma gerundet. Diese Darstellung ist vertraut, sie erlaubt auf einen Blick die Beurteilung, ob viele oder wenige Kinder mit einem bestimmten Verkehrsmittel in die Schule kommen.

Folie 5

Man kann die Zahlen selbstverständlich auch in einem Säulendiagramm darstellen. Es ist sicherlich nicht verwunderlich, dass die Höhe der Säule die Anzahl der beobachteten Ergebnisse zeigt. Man sieht auch in dieser Darstellung sehr schnell, welche Verkehrsmittel häufiger oder weniger häufig benutzt werden. Nun ja, und das nennt man eine Häufigkeitsverteilung. Merken Sie sich diesen Begriff, er wird auch in weniger einfachen Kontexten auftreten.

Folie 6

Lassen Sie uns ein weiteres Beispiel besprechen. Wieder geht es dabei um eine Grundlage der Statistik, das geeignete Erheben von Daten. Die Zahlen sind dieses Mal etwas größer, aber die prinzipiellen Betrachtungen bleiben dieselben. 

Wir schauen uns an, wie viele Neuinfektionen mit Covid-19 es in der Woche um den 23.03.2021 in einigen ausgewählten Staaten, nämlich in Chile, Deutschland, Kolumbien, Mexiko, Peru und Spanien gegeben hat. Dazu ist die eigene Erhebung weniger geeignet, vielmehr verlassen wir uns auf die Daten der Johns Hopkins Universität.

Folie 7

Nun sind auch hier nicht nur die absoluten Zahlen interessant, sondern vor allem der relative Anteil infizierter Personen. Und wieder einmal teilen wir, dieses Mal die Anzahl der Neuinfizierten in dieser Woche durch die Anzahl der Einwohnerinnen und Einwohner in einem Staat. Das Ergebnis sehen sie in der mittleren Spalte der Tabelle. Chile kommt auf beispielsweise auf 0,00224 frisch Infizierte und Mexiko auf 0,00023, was bedeutet, dass 0,00224 bzw. 0,00023 neue Infektionen auf einen Einwohner kommen oder 0,224% bzw. 0,023% der Bevölkerung sich in der betreffenden Woche infiziert haben.

Auch wenn diese Zahlen schon gerundet sind, macht man sich damit außerhalb der Mathematik nur selten Freunde – vielleicht noch nicht einmal innerhalb der Mathematik. Deshalb gibt man sie auch nicht in dieser Form an, sondern rechnet sie auf 100.000 Einwohner um. Kurz und gut: Man multipliziert mit 100.000. Sie erinnern sich, das heißt, das Komma um fünf Stellen nach rechts zu verschieben. So wird aus 0,00224 die Zahl 224 und aus 0,00023 die Zahl 23 und das sind die uns allen inzwischen wohlbekannten Inzidenzen.

Folie 8

Schauen wir uns noch einmal diese sechs Staaten an. Dieses Mal interessieren wir uns für Geburten. Auch hier ist die eigene Erhebung nicht das Mittel der Wahl, diese Zahlen sind so im Internet zu finden. Manche stammen übrigens aus dem Jahr 2018 andere aus dem Jahr 2019. Es ist fast immer schwierig, Daten zu bekommen die auf einem gleichen Stichtag beruhen. Diese Unsicherheit sollte man dann bei der Bewertung der Ergebnisse mitbedenken.

Im Prinzip gehen wir genauso vor wie im vorigen Beispiel. Wie müssen wissen, wie viele Einwohnerinnen und Einwohner ein Staat in einem bestimmten Jahr hat und wie viele Geburten es in diesem Jahr gegeben hat. Dann können wir aus der absoluten Häufigkeit durch Division die relative Häufigkeit berechnen. Und weil dies relativen Zahlen – also etwa 0,0094 für Deutschland oder 0,0179 für Peru – nicht jedermanns Sache sind, rechnen wir wieder hoch, dieses Mal auf 1000 Einwohner.  

Es ist 0,0094 • 1000 = 9,4 und 0,0179 • 1000 = 17,9. In Deutschland kamen im Jahr 2019 auf 1000 Einwohner 9,4 Geburten, in Peru waren es 17,9 und damit deutlich mehr. Die Zahlen sind hier übrigens für das Jahr 2018. 

Folie 9

Für die Schule gibt viele Beispiele, die geeignet und interessant sind. Auch hier kann man eigene Erhebungen planen zum Lieblingsfach, zur Anzahl der Geschwister oder zu Freizeitaktivitäten. Und auch hier kann man dann mit professionell erhobenen Daten weitermachen, wie sie beispielsweise in Statistischen Jahrbüchern zu finden sind. Nur einigermaßen interessant für die spezielle Klasse sollten sie sein.

Folie 10

Lassen Sie uns zusammenfassen.

Wir führen ein Zufallsexperiment n-mal durch und stellen fest, dass ein bestimmtes Ereignis k-mal auftritt. Dann ist k die absolute Häufigkeit dieses Ereignisses.

Nehmen wir an, ein Ereignis tritt k-mal auf, wenn das Zufallsexperiment n-mal durchgeführt wird. Dann ist 𝑘/𝑛 die relative Häufigkeit dieses Ereignisses.

Ordnet man jedem Ereignis eines Zufallsexperiments seine absolute Häufigkeit zu, dann nennt man das eine Häufigkeitsverteilung.

Folie 11

Sie erinnern sich an das Werfen mit zwei Würfeln? Wir hatten die Augensumme gebildet und uns überlegt, welche prinzipiellen Möglichkeiten es gibt. Daraus entstand die Tabelle, die Sie rechts sehen.

Für die Summen 2 und 12 gibt es genau eine Kombination, denn dann zeigen beide Würfel die 1 bzw. die 6. Für die Summe 7 gibt es die meisten Kombination von 1 und 6 über 2 und 5 zu 3 und 4. Sie sehen die theoretischen relativen Häufigkeiten als Prozentzahlen ganz rechts in der Graphik.

Folie 12

Wir schauen uns das noch einmal an und dazu habe ich nicht nur 1000-mal geworfen, sondern auch nach jeweils 100 Würfen die Zwischenergebnisse notiert.

Folie 13

Was Sie hier sehen, das sind die Häufigkeitsverteilungen für N = 100, N = 400, N = 600 und N = 1000. Man sieht sehr schön, wie sich diese absoluten Zahlen Schritt für Schritt an unser theoretisches Ideal annähern. Für N = 100 sieht es noch etwas holprig aus, etwa bei den Summen 5, 6 und 10. Bei N = 400 rutscht die 7 noch aus dem Raster, aber dann macht alles einen guten Eindruck.

Folie 14

Und dieser gute Eindruck bestätigt sich, wenn man die relativen Häufigkeiten bestimmt. Ich habe sie hier in Form von Prozentzahlen angegeben, dann kann man leicht mit den theoretischen Häufigkeiten vergleichen, die Sie in der untersten Zeile sehen. Zum Lesen muss man sich etwas Zeit nehmen und sicher auch das Bild anhalten.

Lassen Sie mich zwei Ergebnisse herausgreifen. Sie Summen 2 und 12 sollten theoretisch in 2,8% der Fälle eintreten, hier sind 3,5% bzw. 3,0%, also recht dicht dran. Und die Summe 7 erfüllt alle Erwartungen: 16,7% ist sowohl der empirisch gewonnene als auch der theoretische Anteil dieser Augensumme.

Folie 15

Wenn man die Ergebnisse in ein Liniendiagramm überträgt, dann sieht es so aus. Die Kurve für N = 100 zeigt die Tendenz, ist aber noch etwas wackelig, die Kurve für N = 1000 bestätigt auch optisch die große Annäherung an die theoretischen Werte.

 

 

Folie 16

Schauen wir zurück.

Wir haben in dieser Folge die Begriffe absolute Häufigkeit und relative Häufigkeit eines Ereignisses betrachtet. Wir haben dafür unterschiedliche Darstellungen gewählt, nämlich ein Tortendiagramm, ein Säulendiagramm, eine Tabelle ein Liniendiagramm.

Wir haben außerdem – an einem ganz einsichtigen Beispiel – den Begriff der Häufigkeitsverteilung eingeführt, der in der Stochastik eine wichtige Rolle spielt.

Schließlich haben wir einmal mehr gesehen, dass einfach nichts über das eigene Experiment geht. Und das gilt ganz besonders für die Stochastik im Unterricht. Experimentieren Sie und lassen Sie Ihre Schülerinnen und Schüler experimentieren. Sie dürften so leichter Spaß an diesem Gebiet der Mathematik gewinnen.

Folie 17

Das war es für heute. Danke, dass Sie dabei waren und hoffentlich bis zu nächsten Mal.

 

Tipp: Anmelden und Bearbeitungsstand speichern

Wenn Sie sich anmelden, wird Ihr Bearbeitungsstand automatisch gespeichert und Sie können den Kurs später dort fortsetzen, wo Sie ihn unterbrochen haben. Nach Abschluss des Kurses erhalten Sie eine persönliche Teilnahmebescheinigung.

Mehr zu den Vorteilen