Meine Notizen zu dieser Seite:

Lügen mit Statistik: Geht das eigentlich? Und wenn ja, wie?

Folie 0

Hallo und herzlich willkommen Ihnen allen. Wir werden uns heute damit beschäftigen, ob und wie man mit Statistik lügen kann. Vielleicht ist das Wort „lügen“ ein wenig zu hart. Fakt ist aber, dass man nicht selten auf Darstellungen oder auch Interpretationen empirischer Daten trifft, die uns in eine bestimmte Sichtweise locken. Aber lassen Sie uns das Problem – wie immer – Schritt für Schritt angehen.

Folie 1

Und ja, Statistik … das ist auch immer der richtige Umgang mit Statistik. Nicht ganz einfach, denn man kann die Dinge auf vielerlei Art beschreiben, betonen, darstellen oder interpretieren. Das ist manchmal vielleicht eigenwillig, trifft manchmal den Kern der Aussage nicht und kann manchmal gar als Lüge angesehen werden.

Auf geht’s. Schauen wir uns Beispiele an. Wir betrachten drei Bereiche, die exemplarisch für das Thema sind.

Folie 2

Beginnen wir mit absoluten und relativen Zahlen. Hier geht es darum, nicht nur relative Werte, sondern auch die absoluten Zahlen in die sinnvolle Bewertung einer Situation einfließen zu lassen.

Folie 3

Das folgende Beispiel stammt aus einem Aufsatz von Gerd Gigerenzer und Kollegen und es geht auf eine wahre Begebenheit zurück. Im Jahr 1995 gab eine britische Behörde die Warnung heraus, dass ein bestimmtes Medikament die Wahrscheinlichkeit für Blutgerinnsel in Lunge oder Beinen verdoppeln würde.

Das klingt erschreckend, keine Frage.

Folie 4

Was meinen Sie? Muss man ein solches Medikament nicht sofort aus dem Handel nehmen?

Folie 5

Sehen wir uns dazu die Zahlen ganz genau an.

Von je 7000 Personen entwickelte eine Person, die das Medikament nicht eingenommen hatte            , ein Blutgerinnsel. Von je 7000 Personen, die das Medikament genommen hatten, waren es zwei.

Folie 6

Fraglos ist das eine Steigerung, aber die relativen Zahlen sehen viel erschreckender aus als die absoluten Zahlen. Der relative Unterschied beträgt 100%, der absolute eben eine Person, natürlich bezogen auf je 7000 Personen.

Folie 7

Absolute und relative Zahlen können unterschiedliche Botschaften senden und das schauen wir uns an.

Spielen wir also mit den Zahlen. Gehen wir – um es uns leicht zu machen – von 1000 Personen und einem Anstieg um 100% aus.

Dann werden aus

            1 Person        2 Personen

            10 Person     20 Personen

            100 Person   200 Personen

Sind sie absoluten Zahlen klein, dann ist eine Verdopplung offensichtlich nicht erschreckend. Sind sie groß, dann ergibt sich ein ganz anderer Eindruck.

Folie 8

Spielen wir noch einmal mit den Zahlen. Wir gehen wieder von 1000 Personen und betrachten dieses Mal einem Anstieg um 1 Person.

Dann werden aus

            1 Person        2 Personen     und das sind 100%

            10 Person     11 Personen   und das sind 10%

            100 Person   101 Personen und das ist gerade einmal 1%

Sind sie absoluten Zahlen klein, dann wirkt dieser Anstieg sehr groß und im Grunde dann unverhältnismäßig groß.

Folie 9

Auch mit Mittelwerten kann man auf verschiedene Art und Weise umgehen. Insbesondere können unterschiedliche Mittelwerte wie etwa Median und arithmetisches Mittel zu sehr unterschiedlichen Angaben führen.

Auch das wollen wir uns mit einem Beispiel veranschaulichen.

Folie 10

Laut einem Bericht auf der Internetseite der Zeitschrift „Capital“ verdienten im Jahr 2020 Arbeitnehmerinnen und Arbeitnehmer in Deutschland 43.200 Euro im Median.

Auf der Internetseite findet man, dass – ebenfalls im Jahr 2020 –Arbeitnehmerinnen und Arbeitnehmer in Deutschland pro Monat durchschnittlich 3.975 Euro verdienten. Dabei wurde eine Vollzeitbeschäftigung vorausgesetzt.

Rechnet man mit 12,5 Jahresgehälter, dann bedeutet das ein Jahreseinkommen von 12,5 • 3.975 Euro ≈ 49.700 Euro.

Offensichtlich sind die beiden Angaben nicht identisch, sondern unterscheiden sich um immerhin etwa 6500 Euro.

Folie 11

Woher kommt die Diskrepanz? Das ist ganz schwer zu beurteilen. Es könnte zum Beispiel daran liegen, das nicht in beiden Fällen nur Vollzeitbeschäftigte berücksichtigt werden.

Plausibel ist allerdings, dass der angegebene Wert von 49.700 € das arithmetische Mittel der Gehälter – und nicht wie bei den 43.200 € – ihr Median ist.

Warum?

Nun ja, Beschäftigte, die sehr viel verdienen, bringen das arithmetische Mittel nach oben, nicht aber den Median. Und auch hier hilft ein Beispiel, diesen Fakt zu verstehen.

Folie 12

Wir schauen uns in Rappelvollstadt um, einem Städtchen mit genau 1.000 berufstätigen Einwohnerinnen und Einwohnern. Es gibt eine Besonderheit: Die Einwohnerinnen und Einwohner verdienen alle gleich viel. Ganz genau sind es 1.000 € im Jahr. Das ist nicht üppig, erleichtert aber das Rechnen ungemein.

Nun hat sich Frau Sehrreich zum Umzug nach Rappelvollstadt entschlossen. Sie hat ein Jahresgehalt von 1.000.000 €. Und sie bringt Bewegung in das arithmetische Mittel, also in den so bestimmten Durchschnittsverdienst.

Da alle gleich viel verdienten, lag das Arithmetische Mittel vorher bei 1.000 €.

Das Arithmetische Mittel nachher berechnet sich aus 1.000 •1.000, also dem Verdienst der 1000 bisherigen Einwohnerinnen und Einwohnern, und das ist 1 Million. Dazu addiert wird die eine Million, die Frau Sehrreich verdient. Eine 1.000.000 + 1.000.000 = 2.000.000 : 1001 sind ungefähr 1.998 €.

Der Median ist hingegen unbeeindruckt, er ist vorher und nachher: 1.000 €.

Folie 13

Die Internetseite gehalt.de berücksichtigt für das Jahr 2020 beide Werte, also arithmetisches Mittel und Median. Darüber hinaus werden hier noch zwei Werte genannt, die als Q1 und Q3 bezeichnet werden und Quartile heißen.

Folie 14

Ganz klar, mit Mittelwert ist hier das arithmetische Mittel gemeint.

Der Median ist der Wert, der die 50%-Marke setzt. Je 50% der Gehälter liegen unterhalb und oberhalb dieses Wertes.

Q1 bezeichnet das erste Quartil, sozusagen das untere Viertel: 25% der Gehälter liegen unterhalb dieses Wertes.

Q3 bezeichnet das dritte Quartil und damit das obere Viertel: 75% der Gehälter liegen unterhalb dieses Wertes, also 25% darauf oder darüber.

Nur der Vollständigkeit halber: Die Statistik teilt die Daten in drei Quartile ein. Das hier fehlende heißt Q2 bzw. zweites Quartil. Es umfasst – nicht weiter erstaunlich – die mittleren 50%.

Folie 15

Zum Abschluss wollen wir und noch einmal mit Darstellungen beschäftigen.

Wir haben schon einmal darüber gesprochen: Man kann Darstellungen so wählen, dass man die Aussage von Daten (zumindest für nicht sehr aufmerksame Beobachterinnen und Beobachter) in eine gewünschte Richtung bringt.

Sie erinnern sich an den Reiskonsum in unterschiedlichen Regionen der Welt? Wir wollen dieses Beispiel noch einmal anschauen.

Folie 16

Das ist ein Säulendiagramm für den Reiskonsum pro Kopf und pro Jahr in kg. In Afrika werden gut 25 kg verzehrt, in Lateinamerika gut 29 kg und in Asien und dem Pazifischen Raum sind es knapp 85 kg pro Kopf und Jahr. Man kann die Zahlen hier sehr gut ablesen und auch auf einen Blick die Proportionen erkennen. Lateinamerika liegt ganz leicht vor Afrika, Asien und der Pazifische Raum sind davon ungefähr um den Faktor 3 entfernt.

Folie 17

Und auch diese Folie kennen Sie mehr oder minder bereits. Wenn man sowohl auf der x-Achse als auch auf der y-Achse den Verbrauchswert abträgt, dann entsteht ein Quadrat. Aus dem linearen Unterschied wird – zumindest gefühlt – ein quadratischer Unterschied, aus dem Faktor 3 also der gefühlte Faktor 9.

Wie gesagt, das hatten wir schon, das Säulendiagramm auch. Lassen Sie uns daraus neue Darstellungen ableiten.

Folie 18

Das ist ein noch einmal Säulendiagramm. Die Zahlen haben sich nicht geändert, das kann man auf der y-Achse ablesen. Der Eindruck schon. Es sieht aus, als würde in Asien und dem Pazifischen Raum noch deutlich mehr verzehrt als in Afrika oder Lateinamerika. Die Ursache ist einfach: Die Beschriftung auf der y-Achse beginnt bei 20 und nicht bei 0. Die Säulen drücken die Proportionen also nicht mehr korrekt aus.

Europa mit einem Reisverbrauch von 4,6 kg pro Kopf und Jahr und Nordamerika mit 12,5 kg wären hier gleich ganz verschwunden und deswegen habe ich sie schon in das erste Diagramm nicht mehr aufgenommen.

Folie 19

Ganz gruselig wird es, wenn man die beiden Darstellungen mischt. Und Sie sehen, es entsteht ein Eindruck, der mit den Tatsachen wenig zu tun hat. Dennoch könnten Sie auf der y-Achse immer noch die korrekten Zahlen ablesen. So ist es nicht gelogen, aber ganz schön manipuliert. Und glauben Sie mir, Darstellungen wie diese finden Sie in den Medien.

Folie 20

Ein kurzes Fazit: Statistik ist in der heutigen Welt zur Grundlage zahlreicher Entscheidungen geworden.

Statistiken werden aber auch oft falsch verstanden oder sogar bewusst irreführend dargestellt. Einzige Möglichkeit: Man muss Daten, ihre Aussagekraft und Einschränkungen genauso wie ihre Darstellung kritisch (und nein, nicht generell misstrauisch) hinterfragen.

Folie 21

Herzlichen Dank für Ihre Aufmerksamkeit. Das war die 20. Folge unserer Gespräche über die Mathematik und gleichzeitig die letzte Folge auf dem Niveau der Fortgeschrittenen. Ich hoffe wir sehen uns in der nächsten Folge wieder. Da geht es dann schon um Statistikwissen für Profis.

Tipp: Anmelden und Bearbeitungsstand speichern

Wenn Sie sich anmelden, wird Ihr Bearbeitungsstand automatisch gespeichert und Sie können den Kurs später dort fortsetzen, wo Sie ihn unterbrochen haben. Nach Abschluss des Kurses erhalten Sie eine persönliche Teilnahmebescheinigung.

Mehr zu den Vorteilen