Zum Inhalt springen

Statistik kritisch hinterfragen

Weiterführend:

Lehrplan 21Zyklus 3 (7.–9. Klasse) · 6Kompetenzen
  • MA.3.B.1.iGrundanspruchErgebnisse zu funktionalen Zusammenhängen überprüfen, insbesondere durch Interpretation von Tabellen, Graphen und Diagrammen
  • MA.3.B.2.eGrundanspruchHäufigkeiten experimentell bestimmen und Vermutungen zu Wahrscheinlichkeiten formulieren; unbekannte Fragestellungen zu Kombinatorik/Wahrscheinlichkeit bearbeiten
  • MA.3.C.2.gGrundanspruchAbhängigkeit zweier Grössen mit Funktionsgraph darstellen; Graphenverläufe interpretieren (Erw: geeignete Skalierung wählen; lineare funktionale Zusammenhänge mit Term beschreiben)
  • MA.3.B.1.jFunktionale und statistische Zusammenhänge erforschen; statistische Rohdaten zu sozialen/wirtschaftlichen/ökologischen Fragestellungen erforschen
  • MA.3.B.2.fWahrscheinlichkeiten und statistische Angaben überprüfen und begründen
  • MA.3.C.2.hWertetabellen, Diagramme, Sachtexte, Terme und Graphen einander zuordnen und interpretieren; Sachsituationen nach funktionalen, statistischen und probabilistischen Gesichtspunkten bearbeiten

Quelle: Aargauer Lehrplan Volksschule, Fachbereich Mathematik (August 2022)

Die kritische Betrachtung von Statistiken ist keine neue Idee. Bereits im 19. Jahrhundert prägte der britische Premierminister Benjamin Disraeli einen berühmten Satz. Er sagte: “Es gibt drei Arten von Lügen: Lügen, verdammte Lügen und Statistiken.” Mark Twain machte diesen Ausspruch später weltberühmt. Damit rückte das Misstrauen gegenüber Zahlen in den Fokus.

Florence Nightingale lebte von 18201820 bis 19101910. Sie war Pionierin der Krankenpflege. Gleichzeitig war sie eine brillante Statistikerin. Im Krimkrieg sammelte sie Daten über Todesursachen britischer Soldaten. Sie zeigte, dass mehr Männer an Infektionen starben als an Verwundungen. Mit ihren “Polardiagrammen” überzeugte sie die Regierung. Hygieneverbesserungen wurden eingeführt. Ihre Arbeit zeigte: Ehrliche Statistik kann Leben retten.

Im 20. Jahrhundert folgte ein Schlüsselwerk. Der Journalist Darrell Huff veröffentlichte 19541954 sein Buch “How to Lie with Statistics”. Es wurde millionenfach verkauft. Huff enthüllte systematisch die Tricks von Werbung und Politik. Abgeschnittene Achsen, irreführende Stichproben, falsche Korrelationen. Sein Buch ist bis heute aktuell und Pflichtlektüre in vielen Statistikkursen.

Propaganda im Ersten und Zweiten Weltkrieg nutzte Statistiken gezielt. Zahlen sollten Zustimmung für politische Entscheidungen erzeugen. Diese Erfahrung prägte das Misstrauen der Nachkriegsgesellschaft. Die Sozialwissenschaften entwickelten in den 1960er-Jahren strenge Methodenstandards.

Mit dem Aufstieg des Internets erreichte die Problematik eine neue Dimension. Soziale Medien verbreiten irreführende Grafiken in Sekundenschnelle. Studien des MIT belegen, dass falsche Nachrichten sich sechsmal schneller verbreiten als wahre. Darum hat die OECD 20182018 Data Literacy zu einer Kernkompetenz erklärt.

Heute bildet die kritische Statistikkompetenz eine Säule der Bildung. Universitäten, Schulen und Medien arbeiten daran. Du lernst nicht mehr nur, Diagramme zu zeichnen. Du lernst auch, sie zu hinterfragen. Diese Fähigkeit ist in der digitalen Welt unverzichtbar.

Statistik kritisch zu hinterfragen bedeutet, Zahlen nicht blind zu glauben. Du prüfst sie systematisch. Du schaust hinter die Kulissen der Darstellung. Dies heisst nicht, alle Statistiken abzulehnen. Es bedeutet, ihre Qualität zu beurteilen.

Drei zentrale Bereiche helfen dir beim kritischen Lesen. Erstens die Datenerhebung. Wer hat die Daten gesammelt? Wie gross war die Stichprobe? War sie repräsentativ? Zweitens die Darstellung. Ist die Grafik fair skaliert? Verzerren Farben oder 3D-Effekte? Drittens die Interpretation. Stimmt die angegebene Schlussfolgerung überhaupt? Wird Korrelation mit Kausalität verwechselt?

Ein einfaches Beispiel verdeutlicht den Unterschied. Stell dir ein Säulendiagramm vor. Es zeigt zwei Werte: 10,010{,}0 und 10,510{,}5. Startet die y-Achse bei 00, siehst du einen kleinen Unterschied. Startet sie bei 9,89{,}8, erscheint der zweite Wert deutlich höher. Die Zahlen sind identisch. Die Wirkung ist völlig verschieden.

Das Ziel dieser Lektion ist klar. Du sollst nicht paranoid werden. Du sollst ein geübtes Auge entwickeln. Jede Statistik verdient eine kurze Prüfung. Stimmt die Quelle? Passt die Darstellung zum Inhalt? Ist die Schlussfolgerung logisch? Mit wenigen Sekunden Aufmerksamkeit filterst du die meisten Fehlinformationen heraus. Diese Kompetenz macht dich zu einer aufgeklärten Konsumentin von Information.

Für das systematische Hinterfragen von Statistiken gibt es eine bewährte Methode. Sie basiert auf fünf W-Fragen. Diese Fragen kannst du bei jeder Grafik oder jeder Zahl stellen.

Jede Frage hat ihren Zweck. Die Wer-Frage entlarvt versteckte Interessen. Eine Tabakindustrie-Studie zu Rauchen ist mit Vorsicht zu geniessen. Die Was-Frage klärt Definitionen. “Arbeitslosigkeit” wird in der Schweiz anders berechnet als in Deutschland.

Die Wann-Frage enthüllt Cherry-Picking. Wer nur den besten oder schlechtesten Zeitraum zeigt, verzerrt das Bild. Die Wie-Frage untersucht die technische Qualität. Achsenskalierung, Stichprobengrösse und Erhebungsmethode gehören hierher.

Die Warum-Frage schliesslich beleuchtet die Absicht. Marketing, Politik oder Wissenschaft haben unterschiedliche Motive. Eine Gewinnanzeige eines Unternehmens ist anders zu lesen als eine Studie eines unabhängigen Instituts.

Für die mathematische Analyse sind zwei Konzepte zentral. Die relative Abweichung berechnest du mit:

relative Abweichung=abb100%\begin{align*} \text{relative Abweichung} = \dfrac{|a - b|}{b} \cdot 100\,\% \end{align*}

So erkennst du, ob ein Unterschied wirklich bedeutend ist. Der zweite Begriff ist die Stichprobengrösse nn. Eine Umfrage mit n=30n = 30 ist wenig aussagekräftig. Gute Umfragen arbeiten mit n1000n \geq 1000. Die Fehlermarge sinkt mit wachsender Stichprobe näherungsweise nach 1n\dfrac{1}{\sqrt{n}}.

Beispiel:

Ein Unternehmen präsentiert seinen Umsatz über drei Jahre:

JahrUmsatz (Mio. CHF)
202410,010{,}0
202510,310{,}3
202610,610{,}6

Aufgabe: Ein Säulendiagramm startet bei 9,89{,}8 Mio. CHF. Wie wirkt die zweite Säule im Vergleich zur ersten? Und wie wirkt sie, wenn die Achse bei 00 beginnt?

Lösung:

Bei einer Achse ab 9,89{,}8 Mio. ist der sichtbare Säulenabschnitt der ersten Säule 10,09,8=0,210{,}0 - 9{,}8 = 0{,}2 Einheiten. Die zweite Säule zeigt 10,39,8=0,510{,}3 - 9{,}8 = 0{,}5 Einheiten. Der optische Unterschied:

0,50,2=2,5\dfrac{0{,}5}{0{,}2} = 2{,}5

Die zweite Säule wirkt also 2,52{,}5-mal so gross. Bei einer Achse ab 00 ist das Verhältnis 10,310,0=1,03\dfrac{10{,}3}{10{,}0} = 1{,}03. Der tatsächliche Zuwachs beträgt nur 3%3\,\%. Die abgeschnittene Achse täuscht einen massiven Anstieg vor.

Beispiel:

Ein 3D-Kreisdiagramm zeigt die Marktanteile dreier Firmen. Firma A hat 35%35\,\%, Firma B 35%35\,\% und Firma C 30%30\,\%. Die Firma A erscheint im Vordergrund und wirkt deutlich grösser als Firma B.

Aufgabe: Erkläre den Trick. Wie kannst du den tatsächlichen Anteil prüfen?

Lösung:

3D-Effekte verzerren Flächen perspektivisch. Der vordere Sektor erscheint grösser, obwohl er denselben Winkel hat. Der Winkel entspricht dem Prozentsatz:

α=35%360°=126°\alpha = 35\,\% \cdot 360° = 126°

Firma A und Firma B haben identische Winkel von 126°126°. Nur die Perspektive täuscht. Du prüfst die Aufteilung, indem du die angegebenen Prozentwerte nachrechnest: 35+35+30=10035 + 35 + 30 = 100. Die Summe stimmt, doch das Bild lügt. Fordere eine flache, faire Darstellung. Ein einfaches Balkendiagramm wäre objektiver. Merke dir als Regel: Kreisdiagramme immer in 2D darstellen und Sektoren nicht herausziehen.

Beim Analysieren von Statistiken lauern viele Fallen. Die folgenden Warnungen helfen dir, die häufigsten Fehler zu vermeiden.

Beispiel:

Eine Zeitung titelt: “Temperatur weltweit stagniert seit 1998!” Sie zeigt einen Graphen der Jahresdurchschnittstemperaturen von 19981998 bis 20082008. Die Kurve ist nahezu flach.

Aufgabe: Analysiere den Trick. Warum ist diese Darstellung irreführend?

Lösung:

Das Jahr 19981998 war ein extremes El-Niño-Jahr mit ungewöhnlich hohen Temperaturen. Durch die Wahl dieses Startpunkts wirkt jedes Folgejahr kühler. Der wahre langfristige Trend wird verdeckt.

Nimmst du stattdessen den Zeitraum von 19801980 bis 20202020, zeigt sich ein klarer Anstieg von etwa:

ΔT=0,8°C\Delta T = 0{,}8\,°\mathrm{C}

Dies entspricht einer durchschnittlichen Erwärmung von 0,02°C0{,}02\,°\mathrm{C} pro Jahr. Die kurze, ausgewählte Zeitspanne verbirgt den langfristigen Trend. Dieses Vorgehen heisst Cherry-Picking. Die Kirsche wird aus dem Kuchen gepickt, der Rest ignoriert.

Achte bei Trendaussagen immer auf die Zeitspanne. Kurze Ausschnitte sind fast immer verdächtig. Je länger der Zeitraum, desto zuverlässiger die Aussage. In der Klimaforschung gelten mindestens 3030 Jahre als aussagekräftige Basis.

Beispiel:

Eine Studie behauptet: “Menschen, die regelmässig Kaffee trinken, sind glücklicher.” Die Korrelation beträgt r=0,45r = 0{,}45.

Aufgabe: Was könnte diese Aussage wirklich bedeuten? Diskutiere alternative Erklärungen.

Lösung:

Die Korrelation von r=0,45r = 0{,}45 ist moderat positiv. Doch Korrelation beweist keine Kausalität. Mehrere Erklärungen sind möglich:

  1. Kaffee macht glücklich (Koffein als Stimmungsheber)
  2. Glückliche Menschen trinken mehr Kaffee (soziale Treffen im Café)
  3. Dritte Variable: Berufstätige trinken Kaffee und haben Einkommen

Die Korrelationsformel zeigt nur, dass beide Werte gemeinsam variieren:

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2r = \dfrac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}}

Für Kausalität brauchst du experimentelle Studien. Eine Gruppe trinkt Kaffee, eine Kontrollgruppe nicht, beide werden zufällig zugeteilt. Erst dann kannst du Ursachen identifizieren. Beobachtungsstudien zeigen Zusammenhänge, keine Ursachen. Merke dir: “correlation does not imply causation”.

Fortgeschrittene Themen der kritischen Statistik betreffen Paradoxien und Verzerrungen. Zwei besonders wichtige Konzepte sind das Simpson-Paradoxon und die Grundraten-Vernachlässigung. Beide tauchen in Medizin, Politik und Wirtschaft regelmässig auf.

Das berühmteste Beispiel stammt aus Berkeley von 19731973. Die Universität wurde wegen Frauenbenachteiligung bei Zulassungen verklagt. Gesamtdaten zeigten: 44%44\,\% der Männer und nur 35%35\,\% der Frauen wurden zugelassen. Bei Aufschlüsselung nach Fachrichtungen kehrte sich das Bild teilweise um. In einigen Fächern hatten Frauen sogar höhere Zulassungsquoten.

Die Erklärung: Frauen bewarben sich häufiger an sehr selektiven Fächern. Männer wählten öfter weniger selektive Bereiche. Die versteckte Variable war die Fachwahl, nicht das Geschlecht. Ohne diese Aufschlüsselung wäre der falsche Schluss gezogen worden.

Ein Beispiel: Ein Test auf eine seltene Krankheit hat 99%99\,\% Genauigkeit. Die Krankheit betrifft 11 von 1000010\,000 Menschen. Fällt dein Test positiv aus, beträgt die tatsächliche Wahrscheinlichkeit, krank zu sein, nur etwa 1%1\,\%. Die Berechnung nutzt den Satz von Bayes:

P(KT)=P(TK)P(K)P(T)P(K|T) = \dfrac{P(T|K) \cdot P(K)}{P(T)}

Diese Paradoxien zeigen, wie wichtig präzises Hinsehen ist. Durchschnittswerte und Gesamtstatistiken können trügen. Die Aufschlüsselung nach Untergruppen offenbart oft die Wahrheit.

Beispiel:

Zwei Therapien werden verglichen. Insgesamt hat Therapie A eine Erfolgsquote von 78%78\,\% und Therapie B von 83%83\,\%. Aufgeschlüsselt nach Schweregrad zeigt sich:

SchweregradTherapie ATherapie B
leicht93%93\,\% (87/9387/93)87%87\,\% (81/9381/93)
schwer73%73\,\% (70/9670/96)69%69\,\% (20/2920/29)

Aufgabe: Welche Therapie ist besser? Warum widerspricht die Gesamtstatistik den Einzeldaten?

Lösung:

Therapie A ist in jeder Untergruppe besser! Bei leichten Fällen: 93%93\,\% gegen 87%87\,\%. Bei schweren Fällen: 73%73\,\% gegen 69%69\,\%. Dennoch wirkt Therapie B insgesamt besser.

Die Erklärung liegt in der unterschiedlichen Verteilung. Therapie A wurde öfter bei schweren Fällen angewendet, wo die Quoten generell niedriger sind. Therapie B dagegen wurde hauptsächlich bei leichten Fällen eingesetzt. Die Gewichtung verzerrt den Gesamtwert.

Die Berechnung für Therapie A:

87+7093+96=15718983%\dfrac{87 + 70}{93 + 96} = \dfrac{157}{189} \approx 83\,\%

Die Lehre: Vertraue nie blind der Gesamtstatistik. Frage nach Untergruppenanalysen. Sie zeigen die wahre Struktur der Daten. In der Medizin ist diese Aufschlüsselung Standard bei klinischen Studien.

Bearbeite diese Aufgaben selbständig. Die Schwierigkeit steigt von 11 bis 1010.

Aufgabe 1: Ein Säulendiagramm zeigt Umsätze: 5050, 5252, 5454. Die y-Achse beginnt bei 4848. Berechne, wie viel grösser die dritte Säule optisch im Vergleich zur ersten wirkt.

Aufgabe 2: Eine Firma wirbt: “Unser Produkt reduziert das Risiko um 50%50\,\%!” Das Risiko sinkt von 0,0020{,}002 auf 0,0010{,}001. Beurteile die absolute und die relative Veränderung.

Aufgabe 3: Eine Umfrage mit n=20n = 20 ergibt: 70%70\,\% der Befragten bevorzugen Produkt X. Die Schlagzeile lautet: ”70%70\,\% aller Konsumenten lieben Produkt X.” Kritisiere die Aussage.

Aufgabe 4: Ein 3D-Kreisdiagramm mit Werten 40%40\,\%, 35%35\,\% und 25%25\,\%. Berechne die Winkel der drei Sektoren. Wie kannst du die Darstellung fair machen?

Aufgabe 5: Ein Graph zeigt den Aktienkurs von 20242024 bis 20252025 mit starkem Anstieg. Der 1010-Jahres-Graph zeigt dagegen einen klaren Abwärtstrend. Erkläre, welches Bild verlässlicher ist und warum.

Aufgabe 6: Die Korrelation zwischen Schokoladenkonsum und Nobelpreisen pro Land beträgt r=0,79r = 0{,}79. Nenne drei mögliche Erklärungen, die keinen direkten Kausalzusammenhang voraussetzen.

Aufgabe 7: Eine Zeitung schreibt: “Verkehrstote um 200%200\,\% gestiegen!” Absolute Zahlen: von 22 auf 66. Eine zweite Zeitung meldet: “Unfälle nur um 33 Fälle gestiegen.” Diskutiere beide Schlagzeilen.

Aufgabe 8: Ein Medikament heilt 99%99\,\% aller Testpatienten. Die Krankheit betrifft 11 von 100000100\,000 Menschen. Berechne, wie viele gesunde Menschen bei 11 Million Getesteten fälschlich als positiv getestet würden, wenn die Falsch-Positiv-Rate 2%2\,\% beträgt.

Aufgabe 9: Zwei Schulen haben je eine Fremdsprachen- und eine Naturwissenschaftsklasse. Schule A: Fremdsprache 90%90\,\% bestanden (4545 von 5050), Naturwissenschaft 50%50\,\% (5050 von 100100). Schule B: Fremdsprache 85%85\,\% (8585 von 100100), Naturwissenschaft 45%45\,\% (2727 von 6060). Berechne die Gesamtquoten und erkläre das Simpson-Paradoxon.

Aufgabe 10: Eine Studie behauptet: “Menschen, die Vitamin C einnehmen, werden seltener krank.” Die Studie wurde von einem Vitamin-Hersteller finanziert und umfasste n=45n = 45 Freiwillige. Wende die 5-W-Checkliste an und bewerte die Aussage.

Statistiken kritisch zu hinterfragen ist eine Kernkompetenz der digitalen Welt. Die wichtigsten Prinzipien sind: Prüfe die Achsenskalierung und fordere eine faire Nullbasis. Hinterfrage Stichprobengrösse und Auswahl der Befragten. Unterscheide absolute von relativen Zahlen. Verwechsle Korrelation nie mit Kausalität. Analysiere immer die Quelle und ihre Interessen. Wende die 5-W-Checkliste an: Wer, Was, Wann, Wie, Warum. Achte auf versteckte Variablen und mögliche Paradoxien. Ein guter Datenjournalist nennt Quelle, Stichprobe und Methode. Fehlen diese Angaben, sei skeptisch. Mit wenigen Sekunden Prüfung erkennst du die meisten Manipulationen. Diese Data-Literacy-Kompetenz schützt dich vor Fehlinformationen und stärkt dein kritisches Denken im Alltag.

❓ Frage:

Ein Säulendiagramm zeigt Werte von 9898 und 100100. Die y-Achse startet bei 9696. Wie gross erscheint der optische Unterschied? a) etwa gleich b) gleich hoch, da die Werte fast identisch sind c) die zweite Säule wirkt doppelt so hoch

Lösung anzeigen

c) Die erste Säule zeigt 9896=298 - 96 = 2 Einheiten, die zweite 10096=4100 - 96 = 4 Einheiten. Optisch wirkt sie doppelt so hoch, obwohl der echte Unterschied nur 10098982%\dfrac{100 - 98}{98} \approx 2\,\% beträgt.

❓ Frage:

Welches ist KEIN Warnzeichen für manipulierte Statistik? a) klare Angabe der Stichprobengrösse n=1500n = 1500 b) y-Achse beginnt bei 8585 statt 00 c) 3D-Effekt auf Kreisdiagramm

Lösung anzeigen

a) Eine klare Angabe der Stichprobengrösse ist ein Qualitätsmerkmal. Die Optionen b) und c) sind klassische Manipulationstricks.

❓ Frage:

Was bedeutet “Cherry-Picking” in der Statistik? a) Auswählen eines vorteilhaften Zeitraums oder Datenausschnitts b) das Sammeln von Daten mit einer Stichprobe c) die Berechnung des Durchschnitts

Lösung anzeigen

a) Cherry-Picking beschreibt die selektive Auswahl günstiger Daten, um eine gewünschte Aussage zu stützen. Der Rest wird ignoriert.

❓ Frage:

Eine Studie zeigt: r=0,9r = 0{,}9 zwischen Kaffee und Glück. Was folgt daraus zwingend? a) Kaffee macht glücklich b) Glück führt zu mehr Kaffeekonsum c) nichts zwingend, Korrelation zeigt keine Kausalität

Lösung anzeigen

c) Korrelation zeigt nur, dass zwei Grössen gemeinsam variieren. Sie belegt keine Ursache-Wirkung-Beziehung.

❓ Frage:

Welche der 5-W-Fragen zielt auf versteckte Interessen der Quelle? a) Wie b) Wer c) Wann

Lösung anzeigen

b) Die Wer-Frage untersucht, wer die Daten erhoben und veröffentlicht hat. Sie deckt auch Finanzierung und Interessenskonflikte auf.

Mit dem kritischen Hinterfragen von Statistiken beherrschst du eine zentrale Data-Literacy-Kompetenz. Als Nächstes kannst du tiefer in die inferenzielle Statistik eintauchen. Dort lernst du Hypothesentests, Konfidenzintervalle und p-Werte kennen. Diese Werkzeuge helfen dir, Studienergebnisse wissenschaftlich korrekt zu interpretieren. Auch die explorative Datenanalyse mit Boxplots und Streudiagrammen wird spannend. Du wirst künftig nicht nur Statistiken lesen, sondern eigene Daten kompetent analysieren. In Studium und Beruf ist diese Fähigkeit unverzichtbar geworden.

Lösung 1: Die sichtbaren Säulenabschnitte sind 5048=250 - 48 = 2, 5248=452 - 48 = 4 und 5448=654 - 48 = 6 Einheiten. Die dritte Säule wirkt optisch 62=3\dfrac{6}{2} = 3-mal so gross wie die erste. Der echte Unterschied beträgt nur 545050=8%\dfrac{54 - 50}{50} = 8\,\%. Die abgeschnittene Achse erzeugt einen viel zu dramatischen Eindruck.

Lösung 2: Relativ sinkt das Risiko um 0,0020,0010,002=50%\dfrac{0{,}002 - 0{,}001}{0{,}002} = 50\,\%. Absolut nur um 0,0010{,}001, also einen Promillepunkt. Das klingt beeindruckend, ist aber im Alltag kaum spürbar. Die Schlagzeile verschweigt die geringe absolute Veränderung. Beides anzugeben wäre fair.

Lösung 3: Mit n=20n = 20 ist die Aussage nicht repräsentativ. Die Fehlermarge beträgt grob ±22%\pm 22\,\% bei einem 95%95\,\%-Konfidenzniveau. Seriöse Umfragen brauchen n1000n \geq 1000. Zudem muss die Stichprobe zufällig und repräsentativ gezogen werden. Die Schlagzeile verallgemeinert unzulässig auf “alle Konsumenten”.

Lösung 4: Die Winkel sind 40%360°=144°40\,\% \cdot 360° = 144°, 35%360°=126°35\,\% \cdot 360° = 126° und 25%360°=90°25\,\% \cdot 360° = 90°. Die Summe ergibt korrekt 360°360°. Die faire Darstellung ist ein flaches 2D-Kreisdiagramm. Noch besser: ein Balkendiagramm mit identischer Balkenbreite. So lassen sich die Anteile direkt vergleichen.

Lösung 5: Der 1010-Jahres-Graph ist verlässlicher. Kurze Zeiträume zeigen Schwankungen (Rauschen). Langfristige Trends werden erst über längere Zeit sichtbar. Cherry-Picking kurzer Perioden verzerrt die Wahrheit. In der Finanzanalyse gelten mindestens 551010 Jahre als aussagekräftige Basis für Trendaussagen.

Lösung 6: Mögliche Erklärungen ohne direkte Kausalität: 1) Beide hängen vom Wohlstand ab — reichere Länder haben mehr Schokolade und mehr Nobelpreise. 2) Bessere Bildungssysteme korrelieren mit Kulturen, die auch Schokolade schätzen. 3) Klima und geografische Lage in europäischen Ländern fördern beides. Die wahrscheinlichste gemeinsame Ursache ist wirtschaftlicher Wohlstand.

Lösung 7: Zeitung 1 wählt die relative Darstellung: 622100%=200%\dfrac{6 - 2}{2} \cdot 100\,\% = 200\,\%. Zeitung 2 die absolute: +3+3 Fälle. Beide Zahlen sind rechnerisch korrekt, aber die Wirkung ist verschieden. Bei kleinen Grundzahlen sind relative Angaben irreführend. Eine faire Darstellung nennt beides: relative und absolute Veränderung.

Lösung 8: Bei 11 Mio. Getesteten sind etwa 1000000100000=10\dfrac{1\,000\,000}{100\,000} = 10 Personen tatsächlich krank. Davon werden 99%99\,\%, also ungefähr 1010, positiv getestet. Von den 999990999\,990 gesunden Personen werden 2%2\,\%, also 19999\approx 19\,999, fälschlich positiv getestet. Die Falsch-Positiv-Rate dominiert. Von allen positiv Getesteten ist nur etwa 10200090,05%\dfrac{10}{20\,009} \approx 0{,}05\,\% tatsächlich krank.

Lösung 9: Schule A gesamt: 45+5050+100=9515063,3%\dfrac{45 + 50}{50 + 100} = \dfrac{95}{150} \approx 63{,}3\,\%. Schule B gesamt: 85+27100+60=112160=70%\dfrac{85 + 27}{100 + 60} = \dfrac{112}{160} = 70\,\%. Schule B wirkt besser, obwohl Schule A in jeder Einzelklasse höhere Quoten hat (90>8590 > 85 und 50>4550 > 45). Dies ist Simpsons Paradoxon, verursacht durch unterschiedliche Klassengrössenverteilung. Schule A hat viele Schüler in der schwierigen Naturwissenschaftsklasse.

Lösung 10: Wer: Vitamin-Hersteller, klarer Interessenskonflikt. Was: “Seltener krank” ist vage — was genau wurde gemessen? Erkältungshäufigkeit, Krankheitstage, Schweregrad? Wann: Zeitraum der Studie unklar — über welche Jahreszeit? Wie: n=45n = 45 ist viel zu klein. Keine Kontrollgruppe erwähnt, kein Doppelblindverfahren. Warum: Marketing für Vitaminprodukte. Fazit: Die Studie ist wissenschaftlich nicht belastbar. Du solltest unabhängige Meta-Analysen oder Cochrane-Reviews konsultieren. Diese bewerten die Evidenzlage systematisch.

Quellen