Folie 0
Einen wunderschönen guten Tag und herzlich willkommen. Wir reden auch heute wieder über Mathematik und ganz konkret darüber, wie man Daten so darstellen kann, dass sie eine möglichst große Aussagekraft für Leserinnen und Leser haben. Und wir reden auch darüber, wie man es nicht machen sollten, denn Darstellungen können nicht nur ungünstig sein, sondern ganz gezielt manipulieren.
Folie 1
Das steht im Zentrum: Wir möchten Ergebnisse statistischer Beobachtungen so zeigen, dass der Kern, der durch die Daten gemachten Aussage getroffen wird. Natürlich wollen wir das möglichst gut machen und insbesondere das Risiko von Fehlinterpretationen klein halten. Darüber hinaus sollten die Daten adressatengerecht aufbereitet sein und möglichst gut verstanden werden.
Folie 2
Ganz klar, zunächst braucht man Daten. Wenn Sie einfach nur in einer Tabelle oder etwas Ähnlichem vorliegen, dann nennt man das eine Urliste. Sie sehen hier zwei Beispiele. Da ist die Wahl einer Klassensprecherin oder eines Klassensprechers, mit der wir uns in einer früheren Folge beschäftigt haben. Die Strichliste mit den Ergebnissen ist hier die Urliste. Außerdem sehen Sie hier – ebenfalls bekannt – das Ergebnis von 100 Würfen mit einem ganz normalen Würfel. Diese Tabelle mit den unaufbereiteten Ergebnissen ist die Urliste.
Folie 3
Lassen Sie uns ein weiteres Beispiel betrachten, nämlich die weltweit am meisten gesprochenen Sprachen. Sie sehen in dieser Tabelle zu sechs Sprachen die geschätzte Zahl von Muttersprachlern und Zweitsprachlern in Millionen. OK, nur die ersten fünf sind tatsächlich die weltweit am meisten gesprochenen Sprachen. Ich dachte allerdings, die Zahlen für die deutsche Sprache könnten interessant sein, auch wenn sie in dieser Aufstellung mit 132 Millionen Sprecherinnen und Sprechern nur den zwölften Platz einnimmt.
Auf den ersten beiden Plätzen findet man Englisch und Mandarin mit jeweils mehr als einer Milliarde Sprecherinnen und Sprechern. Platz drei nimmt Hindi mit 637 Millionen und Platz vier Spanisch mit 538 Millionen Sprecherinnen und Sprechern ein. An fünfter Stelle folgt Französisch mit 280 Millionen aktiven Sprecherinnen und Sprechern.
Eine Zweitsprache ist übrigens etwas anderes als eine Fremdsprache. Von Zweitsprachlern wird hier geredet, wenn eine Sprache lebensnotwendig im täglichen Gebrauch ist, also etwa offizielle Amtssprache in einem Land wie es Englisch in Indien ist. Sortiert man nur nach Muttersprachlern, dann nimmt Mandarin den ersten Platz, Spanisch den zweiten Platz und Englisch erst den dritten Platz ein.
Folie 4
Das Säulendiagramm ist oft die einfachste Art der Darstellung. Wir tragen in diesem Beispiel auf der x-Achse die einzelnen Sprachen ab und wählen auf der y-Achse eine Beschriftung mit Zahlen. Hier geht sie von 0 bis 1,4 Milliarden, denn wir müssen ja genügend Platz nach oben haben.
Jede Säule erlaubt umgehend, die Zahlen der Sprecherinnen und Sprecher grob abzulesen und vor allem auch die verhältnismäßige Einordnung der Ergebnisse.
Folie 5
Übrigens gilt es immer zu überlegen, welche Darstellung wirklich geeignet ist. Ein Kreisdiagramm ist hier beispielsweise weniger angesagt.
Es zeigt zwar recht gut die Proportionen zwischen den Sprachen. Aber es suggeriert zum einen, dass alles erfasst ist. Das stimmt hier nicht, denn es gibt viel mehr Sprachen auf der Welt und viel mehr Menschen, die genau diese Sprache nicht sprechen. Hinzu kommt der Eindruck, dass jede Person hier genau einmal berücksichtigt ist. Auch das ist bestimmt nicht der Fall, da zum Beispiel viele Menschen in Indien sich in Hindi und Englisch gleichermaßen verständigen können.
Folie 6
Aber auch beim schlichten Säulendiagramm ist Vorsicht geboten. Fällt Ihnen etwas auf? Irgendwie scheinen die Proportionen verrutscht zu sein. Sehen Sie, warum das so ist?
Folie 7
Ganz einfach, die y-Achse startet auf der linken Seite nicht bei 0 – wie es auf dem Diagramm auf der rechten Seite ist, das sie von Seite 4 bereits kennen. Dadurch erscheinen die Anteile insbesondere von Deutsch, aber auch von Französisch deutlich kleiner. Achten Sie einmal darauf, diese Darstellung findet sich in Publikationen nicht selten und sie kann durchaus bei der Interpretation von Daten in die Irre führen.
Folie 8
Noch ein Säulendiagramm – nur haben die Sprachen mit der geringeren Anzahl von Sprecherinnen und Sprechern deutlich aufgeholt. Zu verdanken haben sie es der logarithmischen Skalierung der y-Achse.
Der Abstand zwischen 1 und 1000 ist hier dreimal so groß wie der Abstand zwischen 0 und 10 und der Abstand zwischen 1 und 100 doppelt so groß wie der zwischen 1 und 10.
Man versteht das Prinzip leichter, wenn man es mit Hilfe von Potenzen ausdrückt: Der Abstand zwischen 1 = 100 und 1000 = 103 ist hier dreimal so groß wie der Abstand zwischen 1 = 100 und 10 = 101 und der Abstand zwischen 1 = 100 und 100 = 102 zweimal so groß wie der zwischen 1 und 10 = 101.
In der linearen Darstellung, die wir alle aus den frühen Schultagen und auch von Folie 4 kennen, ist der Abstand zwischen 0 und 100 einfach 10-mal größer als der Abstand zwischen 0 und 10. Und an diese Sichtweise sind wir sehr gewöhnt.
Wir erkennen daher logarithmische Darstellungen nicht immer auf den ersten Blick. Es gilt also aufzupassen, dass Daten korrekt interpretiert werden, die logarithmisch skaliert wurden.
Folie 9
Es wird gewürfelt. Das Diagramm zeigt die Entwicklung der relativen Häufigkeit des Werfens einer 6 im Verlauf von 1250 Versuchen. Sie erinnern sich? Wir hatten hier den Zufallsgenerator eines Computers verwendet. Dort ist dann auch die Urliste, die sich mit einer Folge von 1250 Zahlen zwischen 1 und 6 nur mäßig für eine schriftliche Darstellung anbietet. Es fängt mit 6, 4, 5 ,4 ,2 1, 4 an und hört mit 2, 4, 1, 3, 2 4, 4 auf. Und den Rest ersparen wir uns. Wichtig: Natürlich muss es auch in diesem Fall konkrete Daten geben.
Folie 10
Das letzte Beispiel für heute handelt vom Reiskonsum in ausgewählten Regionen, nämlich in Europa, Nordamerika, Afrika, Lateinamerika und Asien mit der Pazifikregion. Der Pro-Kopf-Verbrauch pro Jahr unterscheidet sich in den verschiedenen Regionen erheblich. Während in Europa und Nordamerika mit 4,6 kg bzw. 12,5 kg der Verbrauch eher gering ist, liegt er in Afrika mit 25,1 kg und Lateinamerika mit 29,3 kg deutlich höher. Spitzenreiter ist Asien / Pazifik mit einem Verbrauch von fast 85 kg pro Kopf.
Lassen Sie uns diese Daten in einem Diagramm aufbereiten.
Folie 11
Ganz klar, auch hier bietet sich das Säulendiagramm an. Es gibt einen guten Überblick über den Stand der Dinge.
Nun sieht man in der Presse manchmal hübsche Bilder, die mit Hilfe geeigneter Proportionen die Daten und ihre Zusammenhänge veranschaulichen sollen. Auf der nächsten Seite sehen wir ein Beispiel.
Folie 12
Wie gefällt Ihnen die Darstellung? Was suggeriert sie?
Nun, was hier gemacht wurde, das passiert gar nicht so selten. Vergleichen wir etwa Europa und Nordamerika, dann unterscheiden sich diese Regionen ungefähr um einen Faktor 3, d. h. in Nordamerika wird etwa die dreifache Menge an Reis konsumiert. Dieses Dreifache sehen Sie hier sowohl auf der x-Achse als auch auf der y-Achse und damit unterscheiden sich die Bilder um den Faktor 3 • 3 = 9, suggerieren also deutlich größere Unterschiede. Der Faktor 2 zwischen Nordamerika und Afrika wird zu einem gefühlten Faktor 2 • 2 = 4. Selbst der nicht ganz so große Unterschied zwischen dem Konsum in Afrika und Lateinamerika wird deutlich sichtbar.
Und Asien? Passt eigentlich schon gar nicht mehr auf die Seite.
Folie 13
Im Vergleich zwischen Lateinamerika und Asien wird aus dem 3-fachen das 3 • 3 = 9-fache.
Passen Sie also gut auf, wenn Ihnen Darstellungen von Daten angeboten werden. Und fragen Sie im Zweifel nach der Urliste.
Folie 14
Das war es für heute. Danke, dass Sie dabei waren und ich freue mich auf Sie in der nächsten Folge.
Wenn Sie sich anmelden, wird Ihr Bearbeitungsstand automatisch gespeichert und Sie können den Kurs später dort fortsetzen, wo Sie ihn unterbrochen haben. Nach Abschluss des Kurses erhalten Sie eine persönliche Teilnahmebescheinigung.