Statistische Kennwerte (Lage- und Streumasse)
Weiterführend:
- Vorwissen: Häufigkeiten & Tabellen
- Daten visualisieren (Diagramme)
- Als Nächstes: Komplexe Analysen & Zusammenhänge
- Statistik kritisch hinterfragen
Lehrplan 21
MA.3.A.1.kGrundanspruchBegriffe absolute und relative Häufigkeit, x-Koordinate, y-Koordinate, x-Achse, y-Achse, Einheitsstrecke, Wahrscheinlichkeit; Masseinheiten Geschwindigkeit (km/h, m/s, kB/s, dpi)MA.3.A.1.jBegriffe Koordinatensystem, Währung, arithmetisches Mittel (Erw: indirekte Proportionalität); Masseinheiten Flächenmasse (km², ha, a, m², dm², cm², mm²), Geld (CHF, €, $)MA.3.C.1.fDatensätze nach Kriterien auswerten; Mittelwert, Maximum und Minimum bestimmenMA.3.C.1.jBeziehungen zwischen Grössen datengestützt herstellen; soziale, wirtschaftliche und ökologische Fragestellungen bearbeitenMA.3.C.2.hWertetabellen, Diagramme, Sachtexte, Terme und Graphen einander zuordnen und interpretieren; Sachsituationen nach funktionalen, statistischen und probabilistischen Gesichtspunkten bearbeiten
Quelle: Aargauer Lehrplan Volksschule, Fachbereich Mathematik (August 2022)
Eine kleine Zeitreise
Abschnitt betitelt „Eine kleine Zeitreise“Die Idee, viele Zahlen zu einem einzigen Wert zusammenzufassen, ist alt. Schon im 4. Jahrhundert vor Christus berichtete der griechische Historiker Thukydides vom Mittelwert. Er schrieb, dass Soldaten die Höhe einer Mauer schätzten. Der häufigste Wert wurde als Grundlage für den Mauerbau genutzt. Das war der Modus in der Praxis.
Einen gewaltigen Sprung machte die Statistik im 17. Jahrhundert. John Graunt analysierte 1662 in London die Sterblichkeitsraten. Er legte damit den Grundstein für die moderne Demografie. Wenig später erfand Blaise Pascal zusammen mit Pierre de Fermat die Wahrscheinlichkeitsrechnung. Beide Bereiche gehören heute untrennbar zusammen.
Der wahre Durchbruch kam mit Carl Friedrich Gauss (1777-1855). Gauss untersuchte Messfehler in der Astronomie. Er entwickelte die Methode der kleinsten Quadrate. Aus dieser entstand später die Formel für die Standardabweichung. Sein Name ist bis heute mit der berühmten Glockenkurve verbunden. Sie steht sogar auf dem alten deutschen 10-DM-Schein.
Adolphe Quetelet (1796-1874) prägte den Begriff des «durchschnittlichen Menschen». Er wandte statistische Methoden auf Körpergrössen, Gewichte und Kriminalitätsraten an. Damit wurde die Statistik zu einer Gesellschaftswissenschaft. Kritiker warfen ihm vor, einzelne Menschen zu Zahlen zu machen.
Im 20. Jahrhundert revolutionierte Ronald Fisher die Statistik weiter. Er entwickelte die Varianzanalyse. John Tukey erfand 1977 den Boxplot. Diese Grafik zeigt Quartile und Ausreisser auf einen Blick. Bis heute ist sie das Standardwerkzeug in der explorativen Datenanalyse.
Heute nutzen wir Kennwerte überall. Streamingdienste werten Nutzerdaten aus. Klimaforscher analysieren Temperaturreihen. Ärzte vergleichen Therapien. Ohne Lage- und Streumasse gäbe es keine moderne Wissenschaft. Auch dein Notendurchschnitt ist direktes Erbe dieser jahrhundertelangen Entwicklung.
Die Grundlagen
Abschnitt betitelt „Die Grundlagen“Um Daten sinnvoll zusammenzufassen, brauchst du zwei Arten von Kennwerten. Lagemasse beantworten die Frage nach dem Zentrum. Wo liegt die «Mitte» der Daten? Streumasse beantworten die Frage nach der Verteilung. Wie stark weichen die Werte voneinander ab?
Ein einzelnes Lagemass reicht oft nicht aus. Zwei Datenreihen können denselben Mittelwert haben, aber völlig unterschiedliche Streuungen. Klasse A schreibt die Noten . Klasse B schreibt . Beide Klassen haben den Mittelwert . Die erste Klasse ist homogen. Die zweite Klasse ist extrem heterogen. Deshalb gibst du bei einer seriösen Analyse immer beides an: ein Lage- und ein Streumass.
Die Kernmethode
Abschnitt betitelt „Die Kernmethode“Die Berechnung der Kennwerte folgt klaren Formeln. Du lernst sie hier Schritt für Schritt.
Der Modus ist der einfachste Kennwert. Du suchst einfach den Wert, der am häufigsten vorkommt. Eine Datenreihe kann auch mehrere Modi haben. Dann nennt man sie bimodal oder multimodal.
Für die Spannweite brauchst du nur Maximum und Minimum: . Die Standardabweichung ist anspruchsvoller. Du lernst sie in der Vertiefung.
Beispiel 1: Einstieg mit Klassenarbeit
Abschnitt betitelt „Beispiel 1: Einstieg mit Klassenarbeit“In einer Mathearbeit wurden folgende Noten geschrieben:
Bestimme Mittelwert, Median und Modus.
Lösung:
Die Anzahl ist .
Für den Mittelwert addierst du zuerst alle Werte:
Dann teilst du durch :
Für den Median sortierst du die Werte:
Bei geradem bildest du das Mittel aus dem 5. und 6. Wert. Beide sind . Also ist .
Für den Modus zählst du die Häufigkeiten. Die Note erscheint viermal. Alle anderen weniger. Daher ist .
In diesem Fall stimmen alle drei Lagemasse überein. Das ist ein Zeichen für eine sehr symmetrische Verteilung.
Beispiel 2: Wenn Lagemasse auseinandergehen
Abschnitt betitelt „Beispiel 2: Wenn Lagemasse auseinandergehen“Eine kleine Firma hat sechs Mitarbeiter mit folgenden Monatslöhnen in Franken:
Berechne Mittelwert und Median. Vergleiche die Aussagekraft.
Lösung:
Für den Mittelwert summierst du alle Löhne:
Der Mittelwert ist:
Die Löhne sind bereits sortiert. Bei brauchst du den 3. und 4. Wert:
Der Mittelwert von CHF ist deutlich höher als der Median von CHF. Nur eine Person verdient mehr als CHF. Der hohe Chefgehalt von zieht den Mittelwert stark nach oben. Der Median bleibt davon unbeeinflusst. Er ist robust gegenüber Ausreissern. Bei Einkommensdaten gibt man deshalb fast immer den Median an.
Die häufigsten Stolpersteine
Abschnitt betitelt „Die häufigsten Stolpersteine“Bei Kennwerten passieren regelmässig dieselben Fehler. Hier sind die wichtigsten Fallen.
Beispiel 3: Median bei ungerader Anzahl
Abschnitt betitelt „Beispiel 3: Median bei ungerader Anzahl“Sieben Velofahrer haben folgende Zeiten (in Sekunden) für eine 200-Meter-Strecke:
Bestimme Median, Spannweite und arithmetisches Mittel.
Lösung:
Zuerst sortierst du aufsteigend:
Die Anzahl ist , also ungerade. Der Median ist der . Wert:
Die Spannweite ergibt sich aus Maximum minus Minimum:
Für den Mittelwert summierst du alle Werte:
Damit gilt:
Der Mittelwert liegt über dem Median. Das liegt am Ausreisser von 40 Sekunden. Dieser langsame Fahrer zieht den Durchschnitt nach oben.
Beispiel 4: Quartile bestimmen
Abschnitt betitelt „Beispiel 4: Quartile bestimmen“In einem Fitnesstest haben 12 Jugendliche folgende Anzahl Liegestütze geschafft:
Bestimme die drei Quartile und den Quartilsabstand.
Lösung:
Die Daten sind bereits sortiert. Die Anzahl ist .
Der Median (= ) liegt zwischen dem 6. und 7. Wert:
Für betrachtest du die untere Hälfte: . Der Median dieser sechs Werte liegt zwischen dem 3. und 4. Wert:
Für betrachtest du die obere Hälfte: . Der Median dieser sechs Werte:
Der Quartilsabstand ist:
Die mittleren 50 Prozent der Jugendlichen schaffen zwischen 19 und 31 Liegestütze.
Vertiefung
Abschnitt betitelt „Vertiefung“Die Standardabweichung ist das wichtigste Streumass. Sie misst die durchschnittliche Abweichung der Daten vom Mittelwert. Ihre Berechnung ist etwas aufwendiger, aber sehr lohnend. In fast jeder Statistik-Auswertung taucht sie auf.
Die Berechnung erfolgt in klaren Schritten. Zuerst berechnest du den Mittelwert . Dann bildest du für jeden Wert die Abweichung . Diese Abweichungen quadrierst du. Quadrieren ist wichtig, weil sich positive und negative Abweichungen sonst aufheben würden. Schliesslich bildest du den Durchschnitt der quadrierten Abweichungen und ziehst die Wurzel.
Der Boxplot visualisiert viele dieser Kennwerte auf einen Blick. Er zeigt Minimum, , Median, und Maximum. Die «Box» reicht von bis und enthält die mittleren 50 Prozent der Daten. Die «Whisker» (Antennen) reichen bis zu den Extremwerten oder bis zu jenseits der Box. Punkte ausserhalb gelten als Ausreisser.
Die Standardabweichung hat dieselbe Einheit wie die Daten. Das macht sie gut interpretierbar. Wenn Körpergrössen in cm angegeben sind, ist auch in cm. Bei normalverteilten Daten liegen etwa 68 Prozent aller Werte innerhalb von . Diese Regel ist für viele Anwendungen in der Qualitätskontrolle wichtig.
Beispiel 5: Standardabweichung berechnen
Abschnitt betitelt „Beispiel 5: Standardabweichung berechnen“Fünf Messungen einer Länge ergaben: . Berechne die Standardabweichung.
Lösung:
Schritt 1: Mittelwert berechnen.
Schritt 2: Abweichungen und Quadrate.
| 10,2 | 0,2 | 0,04 |
| 9,8 | -0,2 | 0,04 |
| 10,0 | 0,0 | 0,00 |
| 10,4 | 0,4 | 0,16 |
| 9,6 | -0,4 | 0,16 |
Schritt 3: Summe der Quadrate.
Schritt 4: Varianz und Standardabweichung.
Die Messungen streuen durchschnittlich um etwa cm vom Mittelwert.
Übungen
Abschnitt betitelt „Übungen“Bearbeite die folgenden zehn Aufgaben. Die Lösungen findest du weiter unten.
Aufgabe 1: Berechne den Mittelwert der Zahlen .
Aufgabe 2: Bestimme den Median der Datenreihe .
Aufgabe 3: Welche Zahl ist der Modus von ?
Aufgabe 4: Bestimme die Spannweite von .
Aufgabe 5: Eine Klasse hat die Noten . Berechne Mittelwert und Median. Welches Mass beschreibt die Klasse besser?
Aufgabe 6: Berechne die Quartile und sowie den Quartilsabstand von .
Aufgabe 7: Eine Wetterstation hat folgende Höchsttemperaturen (in °C) in einer Woche gemessen: . Berechne Mittelwert, Median und Spannweite.
Aufgabe 8: Berechne die Standardabweichung der Werte .
Aufgabe 9: In einem Betrieb arbeiten zehn Personen. Neun verdienen CHF, eine verdient CHF. Berechne Mittelwert und Median. Welches Mass ist hier irreführend?
Aufgabe 10: Gegeben sind zwei Datensätze: und . Beide haben denselben Mittelwert . Berechne die Standardabweichung beider Reihen. Welche streut stärker?
Das Wichtigste in Kürze
Abschnitt betitelt „Das Wichtigste in Kürze“Statistische Kennwerte verdichten grosse Datenmengen zu wenigen aussagekräftigen Zahlen. Lagemasse beschreiben das Zentrum. Der Mittelwert ist der bekannteste Lagewert, aber anfällig für Ausreisser. Der Median ist robust und eignet sich besser bei schiefen Verteilungen. Der Modus ist der häufigste Wert. Streumasse zeigen die Verteilung. Die Spannweite misst den Gesamtbereich. Der Quartilsabstand umfasst die mittleren 50 Prozent. Die Standardabweichung gibt die durchschnittliche Abweichung vom Mittelwert an. Jede seriöse statistische Auswertung kombiniert ein Lage- und ein Streumass. Denke immer daran: Dieselben Mittelwerte können völlig verschiedene Verteilungen beschreiben.
Lösung anzeigen
Lösung anzeigen
Lösung anzeigen
Lösung anzeigen
Lösung anzeigen
Ausblick
Abschnitt betitelt „Ausblick“Jetzt kennst du die wichtigsten Lage- und Streumasse. Im nächsten Schritt lernst du, wie du diese Kennwerte grafisch darstellst. Ein Boxplot visualisiert Quartile und Ausreisser auf einen Blick. Ein Histogramm zeigt die gesamte Verteilungsform. In fortgeschrittenen Themen untersuchst du Zusammenhänge zwischen zwei Variablen. Dort triffst du auf Korrelation und Regression. Auch die beurteilende Statistik baut auf Kennwerten auf. Mittelwert und Standardabweichung sind die Grundlage für Konfidenzintervalle und Hypothesentests. Damit wirst du in der Lage sein, wissenschaftliche Studien kritisch zu bewerten.
Lösungen
Abschnitt betitelt „Lösungen“Lösung 1:
Lösung 2: Sortiert: . Bei ist der 4. Wert der Median. Also .
Lösung 3: Die Zahl kommt viermal vor. Alle anderen Zahlen kommen seltener vor. Also ist .
Lösung 4: Maximum: . Minimum: . Spannweite: .
Lösung 5: Summe: . Also . Sortiert sind die Noten bereits. Bei ist der 5. Wert der Median: . In diesem Fall sind Mittelwert und Median identisch. Die Verteilung ist symmetrisch. Beide Masse beschreiben die Klasse gleich gut.
Lösung 6: Die Daten sind sortiert. Bei ist der Median das Mittel aus dem 5. und 6. Wert: . Untere Hälfte: . Median davon: . Obere Hälfte: . Median davon: . Quartilsabstand: .
Lösung 7: Summe: . Mittelwert: °C. Sortiert: . Median: °C. Spannweite: °C.
Lösung 8: Mittelwert: . Abweichungen: . Quadrate: . Summe: . Varianz: . Standardabweichung: .
Lösung 9: Summe: . Mittelwert: CHF. Sortiert sind die Löhne: . Median (5. und 6. Wert): CHF. Der Mittelwert von CHF ist hier irreführend. Niemand verdient tatsächlich diesen Betrag. Der Median von CHF beschreibt die typische Person viel besser. Dieses Beispiel zeigt, warum bei Einkommensdaten meist der Median angegeben wird.
Lösung 10: Beide Reihen haben Mittelwert .
Datensatz A: Abweichungen . Quadrate: . Summe: . Varianz: . Standardabweichung: .
Datensatz B: Abweichungen . Quadrate: . Summe: . Varianz: . Standardabweichung: .
Datensatz B streut deutlich stärker. Dies zeigt, dass der Mittelwert allein keine vollständige Information über die Daten gibt. Erst die Standardabweichung ergänzt das Bild.
Quellen
- Lehrplan 21 — Mathematik — Deutschschweizer Erziehungsdirektoren-Konferenz (D-EDK)
- Lehrplan Volksschule Aargau — Mathematik — Kanton Aargau, Departement Bildung, Kultur und Sport