Zum Inhalt springen

Komplexe Analysen & Zusammenhänge

Weiterführend:

Lehrplan 21Zyklus 3 (7.–9. Klasse) · 5Kompetenzen
  • MA.3.C.2.gGrundanspruchAbhängigkeit zweier Grössen mit Funktionsgraph darstellen; Graphenverläufe interpretieren (Erw: geeignete Skalierung wählen; lineare funktionale Zusammenhänge mit Term beschreiben)
  • MA.3.A.3.kZu linearen Funktionen den Funktionsgraphen zeichnen; Steigung, y-Achsenabschnitt und Nullstelle bestimmen
  • MA.3.B.1.jFunktionale und statistische Zusammenhänge erforschen; statistische Rohdaten zu sozialen/wirtschaftlichen/ökologischen Fragestellungen erforschen
  • MA.3.C.1.jBeziehungen zwischen Grössen datengestützt herstellen; soziale, wirtschaftliche und ökologische Fragestellungen bearbeiten
  • MA.3.C.2.hWertetabellen, Diagramme, Sachtexte, Terme und Graphen einander zuordnen und interpretieren; Sachsituationen nach funktionalen, statistischen und probabilistischen Gesichtspunkten bearbeiten

Quelle: Aargauer Lehrplan Volksschule, Fachbereich Mathematik (August 2022)

Die Idee, Daten nicht nur zu sammeln, sondern sichtbar zu machen, ist jünger als du denkst. Im 18. Jahrhundert veröffentlichte der Schotte William Playfair erste Balken- und Liniendiagramme. Er wollte Handelsströme zwischen England und anderen Ländern verständlich zeigen. Sein Werk “The Commercial and Political Atlas” von 1786 gilt als Geburtsstunde der modernen Datenvisualisierung.

Einen Sprung machte die Statistik, als Francis Galton um 1885 den Begriff der Regression prägte. Galton untersuchte die Grösse von Eltern und ihren Kindern. Er entdeckte: Kinder sehr grosser Eltern sind im Durchschnitt wieder etwas kleiner. Diese “Rückkehr zum Mittelwert” — auf Englisch “regression” — brachte ihn dazu, die erste Ausgleichsgerade durch eine Punktwolke zu legen. Sein Schüler Karl Pearson formalisierte die Methode und erfand den Korrelationskoeffizienten.

Den Boxplot verdanken wir einem Amerikaner. John Tukey entwarf ihn 1977 in seinem Buch “Exploratory Data Analysis”. Tukey war frustriert: Klassische Statistiker verloren sich in Formeln, bevor sie die Daten überhaupt angeschaut hatten. Er forderte ein schnelles, visuelles Werkzeug. Der Boxplot zeigt in einer einzigen Grafik fünf wichtige Kennwerte gleichzeitig.

Die Geschichte der Streudiagramme reicht noch weiter zurück. Schon der Astronom John Herschel nutzte 1833 Punktwolken, um den Umlauf eines Doppelsterns zu analysieren. Heute findest du Streudiagramme überall — in Klimastudien, Medizinforschung, Ökonomie und Machine Learning.

Warum lohnt sich dieser historische Blick? Weil du verstehst: Jedes Werkzeug wurde aus einem konkreten Problem geboren. Wenn du einen Boxplot zeichnest, denkst du wie Tukey. Wenn du eine Ausgleichsgerade legst, folgst du Galton. Du stehst auf den Schultern von Riesen.

Bevor du Boxplots und Streudiagramme erstellst, brauchst du zwei zentrale Begriffe: univariate und bivariate Daten.

Für den Boxplot nutzt du univariate Daten. Du fasst viele Einzelwerte zu einer Verteilung zusammen. Für das Streudiagramm brauchst du bivariate Daten, denn du willst herausfinden, wie zwei Grössen zusammenspielen.

Eine zweite Grundlage sind die Quartile. Du kennst sie schon aus dem Artikel zu den statistischen Kennwerten.

Diese fünf Zahlen heissen in der englischen Statistikliteratur Five-Number Summary. Tukey baute seinen Boxplot genau darum herum. Der Vorteil: Du brauchst keine komplizierte Formel. Du zählst ab, du zeichnest, du vergleichst.

Merke dir die Grundregel: Ein Boxplot zeigt, wie Daten verteilt sind. Ein Streudiagramm zeigt, wie zwei Grössen zusammenhängen. Beide Werkzeuge sind kein Selbstzweck. Sie helfen dir, Fragen zu beantworten, die eine reine Tabelle nicht verrät.

Die Kernidee aller drei Methoden heisst: Struktur sichtbar machen. Eine unsortierte Zahlenliste verrät dir nichts. Eine Grafik verrät dir in Sekunden die wichtigsten Eigenschaften.

Der Boxplot zeigt dir vier Dinge auf einen Blick: die Lage (Median), die Streuung der Mitte (Kastenbreite), die Spannweite (Antennen) und eventuelle Schiefe (Median nicht mittig im Kasten).

Die Ausgleichsgerade findest du in zwei Varianten. Im Schulalltag reicht oft das “Daumen-Verfahren”: Du legst ein Lineal so durch die Punktwolke, dass etwa gleich viele Punkte darüber wie darunter liegen. Genauer geht es mit der Methode der kleinsten Quadrate. Sie minimiert die Summe der quadrierten Abstände aller Punkte zur Geraden. Diese Methode nutzt jeder Taschenrechner und jede Tabellenkalkulation.

Der Zusammenhang zwischen zwei Grössen heisst Korrelation. Er kann positiv (beide steigen gemeinsam), negativ (eine steigt, die andere sinkt) oder gleich null (kein Zusammenhang) sein.

Beispiel:

In einer Klasse wurden folgende Mathe-Noten geschrieben:

3,544,54,55555,563{,}5 \quad 4 \quad 4{,}5 \quad 4{,}5 \quad 5 \quad 5 \quad 5 \quad 5{,}5 \quad 6

Lösung:

Es sind neun Werte. Ordnen muss ich nicht mehr — sie sind schon sortiert.

Minimum: xmin=3,5x_{\min} = 3{,}5

Maximum: xmax=6x_{\max} = 6

Median (5. Wert): Q2=5Q_2 = 5

Unteres Quartil (Median der unteren vier Werte 3,5; 4; 4,5; 4,53{,}5;\ 4;\ 4{,}5;\ 4{,}5):

Q1=4+4,52=4,25Q_1 = \frac{4 + 4{,}5}{2} = 4{,}25

Oberes Quartil (Median der oberen vier Werte 5; 5; 5,5; 65;\ 5;\ 5{,}5;\ 6):

Q3=5+5,52=5,25Q_3 = \frac{5 + 5{,}5}{2} = 5{,}25

Interquartilsabstand: IQR=5,254,25=1\text{IQR} = 5{,}25 - 4{,}25 = 1

Du zeichnest nun eine Zahlengerade von 33 bis 6,56{,}5. Der Kasten reicht von 4,254{,}25 bis 5,255{,}25, der Median-Strich sitzt bei 55. Die Antennen gehen bis 3,53{,}5 und 66. Der Median sitzt rechts im Kasten — die Verteilung ist leicht linksschief.

Beispiel:

Zwei Klassen schreiben denselben Mathe-Test. Die Lehrerin fasst so zusammen:

Klassexminx_{\min}Q1Q_1Q2Q_2Q3Q_3xmaxx_{\max}
9a2,52{,}54,04{,}04,54{,}55,55{,}56,06{,}0
9b3,53{,}54,54{,}55,05{,}05,05{,}06,06{,}0

Lösung:

Du zeichnest beide Boxplots auf derselben Achse von 22 bis 6,56{,}5.

Vergleich der Lage: Der Median der 9b (5,05{,}0) liegt höher als der der 9a (4,54{,}5). Die 9b schneidet im Mittel besser ab.

Vergleich der Streuung: Der IQR der 9a ist 5,54,0=1,55{,}5 - 4{,}0 = 1{,}5. Der IQR der 9b ist 5,04,5=0,55{,}0 - 4{,}5 = 0{,}5. Die 9b ist deutlich homogener.

Ausreisser: Die 9a hat mit 2,52{,}5 eine Schülerin oder einen Schüler mit einer sehr schwachen Note. Das zieht die linke Antenne nach unten.

Fazit: Die 9b ist besser und einheitlicher. In der 9a gibt es breite Leistungen und eine problematische Einzelnote. Für die Lehrerin heisst das: In der 9a braucht es Differenzierung, in der 9b kann sie mit dem gesamten Niveau weiterarbeiten.

Drei Fehler begegnen dir in dieser Einheit besonders oft. Wenn du sie kennst, sparst du dir viele Punktverluste.

Beispiel:

Eine Schülergruppe misst Lernzeit (in Stunden) und erreichte Punkte (von 40) in einem Test:

Lernzeit xx01234567
Punkte yy1218222528313538

Lösung:

Jede Zeile wird zu einem Punkt (xi,yi)(x_i, y_i). Die Punkte liegen fast perfekt auf einer Geraden — ein starker positiver Zusammenhang.

Du legst ein Lineal durch die Wolke. Schätzung: Bei x=0x = 0 erreicht die Gerade etwa y=13y = 13. Bei x=7x = 7 erreicht sie etwa y=38y = 38.

Steigung: m=381370=2573,57m = \frac{38 - 13}{7 - 0} = \frac{25}{7} \approx 3{,}57

y-Achsenabschnitt: q13q \approx 13

Die Ausgleichsgerade lautet also: y=3,57x+13y = 3{,}57 \cdot x + 13

Interpretation: Pro zusätzlicher Lernstunde steigen die Testpunkte im Mittel um 3,573{,}57. Ohne Lernen erreichst du etwa 1313 Punkte — das wäre Grundwissen aus dem Unterricht.

Warnung: Für x=20x = 20 ergäbe die Gerade y=84,4y = 84{,}4 Punkte. Da es nur 4040 Punkte gibt, ist die Extrapolation sinnlos.

Beispiel:

Ordne den folgenden Sachverhalten den richtigen Korrelationstyp zu: positiv, negativ oder keine.

a) Anzahl Regentage pro Monat und verkaufte Sonnenbrillen b) Alter eines Autos und sein Wiederverkaufspreis c) Schuhgrösse und Intelligenz d) Höhe eines Bergs und Lufttemperatur am Gipfel

Lösung:

a) Negativ. Mehr Regen heisst weniger Sonne, also weniger Sonnenbrillen-Nachfrage. Im Streudiagramm fällt die Punktwolke von links oben nach rechts unten ab.

b) Negativ. Je älter das Auto, desto niedriger der Preis (mit wenigen Ausnahmen bei Oldtimern). Die Gerade hat eine negative Steigung.

c) Keine. Schuhgrösse hängt nicht mit Intelligenz zusammen. Die Punktwolke ist eine zufällige Wolke ohne Richtung.

d) Negativ. Je höher der Berg, desto kälter am Gipfel. Etwa 0,65 °C0{,}65\ \text{°C} pro 100100 Höhenmeter.

Transfer: Wenn du einen neuen Datensatz bekommst, frage dich immer zuerst: Ergibt eine Korrelation physikalisch Sinn? Bei Schuhgrösse und Intelligenz zeigt schon der gesunde Menschenverstand, dass hier kein Zusammenhang zu erwarten ist. Findest du trotzdem einen, liegt meist eine Scheinkorrelation vor (zum Beispiel, weil Erwachsene sowohl grössere Schuhe als auch einen höheren Bildungsstand haben als Kinder).

Im Alltag reicht das Daumen-Verfahren oft aus. In Wissenschaft und Technik braucht es mehr Genauigkeit. Hier kommt der Korrelationskoeffizient ins Spiel.

Diese Formel sieht kompliziert aus. Die Idee dahinter ist einfach: Du schaust für jeden Punkt, wie weit er vom Mittelwert beider Grössen entfernt ist. Liegen Abweichungen immer im gleichen Vorzeichen, ist rr positiv. Wechseln sie, ist rr negativ.

Als Faustregel:

  • r<0,3|r| < 0{,}3: schwacher Zusammenhang
  • 0,3r<0,70{,}3 \le |r| < 0{,}7: mittlerer Zusammenhang
  • r0,7|r| \ge 0{,}7: starker Zusammenhang

Wichtig: rr misst nur lineare Zusammenhänge. Liegen die Punkte auf einer Parabel, kann rr trotzdem nahe null sein — obwohl ein perfekter Zusammenhang besteht. Ein Streudiagramm ist deshalb immer Pflicht, bevor du einen rr-Wert interpretierst.

Die Methode der kleinsten Quadrate liefert dir die beste Gerade analytisch. Für Daten (xi,yi)(x_i, y_i) mit i=1,,ni = 1, \ldots, n gelten:

m=(xixˉ)(yiyˉ)(xixˉ)2,q=yˉmxˉm = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}, \quad q = \bar{y} - m\bar{x}

Moderne Taschenrechner haben diese Formeln eingebaut. Du gibst die Wertepaare ein, drückst auf “LinReg” oder “a+bx”, und bekommst Steigung, Achsenabschnitt und Korrelationskoeffizienten geliefert.

Beispiel:

Beispiel 5: Korrelationskoeffizient interpretieren

Abschnitt betitelt „Beispiel 5: Korrelationskoeffizient interpretieren“

Ein Sportforscher untersucht den Zusammenhang zwischen wöchentlicher Trainingszeit (Stunden) und der Zeit auf 100 m100\ \text{m} (Sekunden) bei zehn Jugendlichen. Sein Taschenrechner liefert:

r=0,82,m=0,15,q=13,9r = -0{,}82, \quad m = -0{,}15, \quad q = 13{,}9

Lösung:

Interpretation von rr: Der Wert 0,82-0{,}82 ist betragsmässig gross (r0,7|r| \ge 0{,}7), also ein starker negativer Zusammenhang. Je mehr trainiert wird, desto schneller ist die 100100-Meter-Zeit.

Gleichung der Ausgleichsgeraden: y=0,15x+13,9y = -0{,}15x + 13{,}9

Was bedeutet m=0,15m = -0{,}15? Pro zusätzlicher Trainingsstunde pro Woche sinkt die 100100-Meter-Zeit im Mittel um 0,150{,}15 Sekunden.

Was bedeutet q=13,9q = 13{,}9? Ohne Training wäre die Zeit im Mittel 13,9 s13{,}9\ \text{s}.

Vorsicht Kausalität: Der starke rr-Wert zeigt einen Zusammenhang. Er beweist aber nicht, dass mehr Training allein die Zeit senkt. Vielleicht sind die Jugendlichen, die viel trainieren, auch generell talentierter oder ernähren sich besser. Für einen echten Kausalnachweis bräuchte es eine Vergleichsgruppe und eine kontrollierte Studie.

  1. Bestimme zu den Daten 5; 7; 8; 9; 10; 12; 13; 15; 185;\ 7;\ 8;\ 9;\ 10;\ 12;\ 13;\ 15;\ 18 die fünf Kennzahlen und zeichne den Boxplot.

  2. Eine Klasse misst Körpergrössen (in cm): 152; 158; 160; 162; 165; 167; 170; 172; 175; 180152;\ 158;\ 160;\ 162;\ 165;\ 167;\ 170;\ 172;\ 175;\ 180. Berechne Q1Q_1, Q2Q_2, Q3Q_3 und den IQR.

  3. Zwei Betriebe zahlen folgende Löhne (in Tausend CHF pro Jahr). Betrieb A: 55; 58; 60; 62; 65; 68; 72; 20055;\ 58;\ 60;\ 62;\ 65;\ 68;\ 72;\ 200. Betrieb B: 60; 62; 64; 65; 66; 68; 70; 7260;\ 62;\ 64;\ 65;\ 66;\ 68;\ 70;\ 72. Zeichne beide Boxplots und vergleiche.

  4. Trage die Wertepaare in ein Streudiagramm ein und beschreibe den Zusammenhang:

xx123456
yy2457910
  1. Eine Wetterstation hat für sieben Tage Mittagstemperatur (°C) und verkaufte Liter Eistee gemessen:
Temp.15182124273033
Eistee203548627892108

Zeichne das Streudiagramm und bestimme grafisch Steigung und Achsenabschnitt der Ausgleichsgeraden.

  1. Für die Daten aus Aufgabe 5: Wie viel Eistee würdest du bei 25 °C25\ \text{°C} schätzen? Darfst du die Gleichung auch bei 5 °C-5\ \text{°C} anwenden? Begründe.

  2. Ein Student hat für seine Statistikarbeit den Korrelationskoeffizienten r=0,15r = 0{,}15 berechnet. Wie stark ist der Zusammenhang?

  3. Erkläre den Unterschied zwischen Korrelation und Kausalität anhand eines eigenen Beispiels.

  4. Die Ausgleichsgerade für den Zusammenhang zwischen Wochenstunden Sport und Ruhepuls lautet y=0,8x+75y = -0{,}8x + 75. Interpretiere Steigung und y-Achsenabschnitt.

  5. Ein Datensatz zeigt die Anzahl Einwohner von Städten und die Zahl der Verbrechen. Der Korrelationskoeffizient beträgt r=+0,91r = +0{,}91. Bedeutet das, dass grosse Städte “gefährlicher” sind? Diskutiere.

Der Boxplot fasst eine Verteilung mit fünf Kennzahlen zusammen: Minimum, Q1Q_1, Median, Q3Q_3, Maximum. Der Kasten zeigt die mittleren 50%50\,\% der Daten. Je schmaler der Kasten, desto homogener die Gruppe. Schiefe erkennst du an der Lage des Medians im Kasten.

Das Streudiagramm zeigt bivariate Daten als Punktwolke. Steigt die Wolke von links unten nach rechts oben, ist die Korrelation positiv. Fällt sie ab, ist sie negativ. Ist die Wolke diffus, gibt es keinen (linearen) Zusammenhang.

Die Ausgleichsgerade y=mx+qy = mx + q folgt der Punktwolke am besten. Die Steigung mm sagt, wie stark yy pro Einheit von xx wächst. Der Korrelationskoeffizient rr misst die Stärke des linearen Zusammenhangs (Werte zwischen 1-1 und +1+1).

Merke: Korrelation ist nicht Kausalität. Und eine Gerade gilt nur im Messbereich.

❓ Frage:

Welche fünf Kennzahlen brauchst du für einen Boxplot? a) Mittelwert, Modus, Median, Minimum, Maximum b) Minimum, Q1Q_1, Median, Q3Q_3, Maximum c) Minimum, Mittelwert, Median, Modus, Maximum

Lösung anzeigen
b) Minimum, unteres Quartil Q1Q_1, Median Q2Q_2, oberes Quartil Q3Q_3, Maximum. Tukey nannte das die “Five-Number Summary”.
❓ Frage:

Was zeigt der Kasten im Boxplot an? a) Die Spannweite aller Daten b) Die mittleren 50%50\,\% der Daten (vom unteren bis zum oberen Quartil) c) Den Bereich um den Mittelwert

Lösung anzeigen
b) Der Kasten reicht von Q1Q_1 bis Q3Q_3 und enthält die mittleren 50%50\,\% der Daten. Seine Breite ist der Interquartilsabstand IQR.
❓ Frage:

Der Korrelationskoeffizient beträgt r=0,9r = -0{,}9. Was bedeutet das? a) Es gibt keinen Zusammenhang b) Starker positiver Zusammenhang c) Starker negativer Zusammenhang

Lösung anzeigen
c) Der Betrag r=0,9|r| = 0{,}9 ist gross (Faustregel 0,7\ge 0{,}7 = stark). Das Vorzeichen ist negativ — steigt xx, sinkt yy.
❓ Frage:

Eistee-Verkäufe und Sonnenbrände korrelieren stark positiv. Was folgt daraus? a) Eistee verursacht Sonnenbrände b) Beide Werte werden von einer dritten Grösse beeinflusst (Sonne/Wärme) c) Ein statistischer Fehler liegt vor

Lösung anzeigen
b) Klassische Scheinkorrelation. Sonniges Wetter erhöht sowohl den Eisteekonsum als auch die Sonnenbrände. Korrelation ist nicht Kausalität.
❓ Frage:

Die Ausgleichsgerade lautet y=2x+5y = 2x + 5. Wie ändert sich yy, wenn xx um 33 wächst? a) um 55 b) um 66 c) um 1111

Lösung anzeigen
b) Die Steigung m=2m = 2 heisst: pro Einheit xx steigt yy um 22. Bei 33 Einheiten also 32=63 \cdot 2 = 6.

In den nächsten Artikeln lernst du, wie du die Werkzeuge aus dieser Einheit kritisch einsetzt. Du siehst, wie Medien Grafiken manipulieren — durch abgeschnittene Achsen, ungeeignete Skalierungen oder bewusst gewählte Ausschnitte. Im Gymnasium begegnen dir Streudiagramme wieder bei der Regressionsanalyse. Dort wirst du Ausgleichskurven auch für nichtlineare Zusammenhänge berechnen. Später im Studium kommen multiple Regression und Kausalmodelle hinzu — die Kunst, echte von scheinbaren Zusammenhängen zu trennen.

Aufgabe 1: Neun Werte, geordnet. Median (5. Wert) =10= 10. Untere Hälfte: 5; 7; 8; 95;\ 7;\ 8;\ 9, Q1=(7+8)/2=7,5Q_1 = (7+8)/2 = 7{,}5. Obere Hälfte: 12; 13; 15; 1812;\ 13;\ 15;\ 18, Q3=(13+15)/2=14Q_3 = (13+15)/2 = 14. IQR =147,5=6,5= 14 - 7{,}5 = 6{,}5. Minimum =5= 5, Maximum =18= 18. Der Kasten reicht von 7,57{,}5 bis 1414, Median-Strich bei 1010.

Aufgabe 2: Zehn Werte. Median =(165+167)/2=166= (165+167)/2 = 166. Untere Hälfte (5 Werte): 152; 158; 160; 162; 165152;\ 158;\ 160;\ 162;\ 165, Q1=160Q_1 = 160. Obere Hälfte: 167; 170; 172; 175; 180167;\ 170;\ 172;\ 175;\ 180, Q3=172Q_3 = 172. IQR =12= 12.

Aufgabe 3: Betrieb A: Q1=59Q_1 = 59, Q2=63,5Q_2 = 63{,}5, Q3=70Q_3 = 70, IQR =11= 11. Der Wert 200200 ist ein klarer Ausreisser (Management-Gehalt). Betrieb B: Q1=63Q_1 = 63, Q2=65,5Q_2 = 65{,}5, Q3=69Q_3 = 69, IQR =6= 6. Fazit: Beide Betriebe zahlen ähnliche typische Löhne, aber A ist ungleicher und hat einen Spitzenverdiener.

Aufgabe 4: Die Punkte steigen fast linear. Ausgleichsgerade grafisch etwa y=1,6x+0,5y = 1{,}6x + 0{,}5. Starker positiver Zusammenhang, rr nahe +1+1.

Aufgabe 5: Punkte liegen nahezu perfekt auf einer Geraden. Zwischen x=15x = 15 (y20y \approx 20) und x=33x = 33 (y108y \approx 108) ergibt sich die Steigung: m=108203315=88184,9m = \frac{108 - 20}{33 - 15} = \frac{88}{18} \approx 4{,}9 Achsenabschnitt: aus y=mx+qy = mx + q folgt 20=4,915+q20 = 4{,}9 \cdot 15 + q, also q=2073,5=53,5q = 20 - 73{,}5 = -53{,}5. Die Ausgleichsgerade lautet y4,9x53,5y \approx 4{,}9x - 53{,}5.

Aufgabe 6: Bei x=25 °Cx = 25\ \text{°C} ergibt sich y=4,92553,5=69y = 4{,}9 \cdot 25 - 53{,}5 = 69 Liter. Bei x=5 °Cx = -5\ \text{°C} lieferte die Gleichung y=78y = -78 Liter — offensichtlich unsinnig, weil negative Verkaufsmengen nicht existieren. Ausserdem liegt 5-5 ausserhalb des Messbereichs (15x33)(15 \le x \le 33). Extrapolation nicht zulässig.

Aufgabe 7: r=0,15<0,3|r| = 0{,}15 < 0{,}3. Schwacher Zusammenhang. Der Student sollte keine starken Aussagen über den Zusammenhang machen.

Aufgabe 8: Eigenes Beispiel möglich. Klassiker: Gemeinden mit vielen Störchen haben auch viele Geburten. Korrelation ist stark positiv. Kausalität? Nein. Beide hängen davon ab, ob es sich um eine ländliche Gegend mit vielen Familien und alten Dächern handelt.

Aufgabe 9: Steigung m=0,8m = -0{,}8 bedeutet: pro zusätzlicher Sportstunde pro Woche sinkt der Ruhepuls im Mittel um 0,80{,}8 Schläge pro Minute. Der y-Achsenabschnitt q=75q = 75 ist der erwartete Ruhepuls ohne Sport. Beide Werte zusammen: Sport senkt den Ruhepuls — eine bekannte physiologische Wirkung.

Aufgabe 10: Der rr-Wert von +0,91+0{,}91 ist sehr hoch. Die Interpretation “grosse Städte sind gefährlicher” ist dennoch falsch. Grund: Mehr Einwohner bedeutet mehr Menschen, die Verbrechen begehen oder erleiden können — ein reiner Grössen-Effekt. Fairer wäre der Vergleich der Verbrechensrate pro 1000 Einwohner. Dann verschwindet der starke Zusammenhang oft oder kehrt sich sogar um. Das Beispiel zeigt: Absolute Zahlen können in die Irre führen. Relative Vergleiche sind in der Statistik oft aussagekräftiger.

Quellen