Statistische Erhebungen einfach erklärt: So sammelst und analysierst du Daten wie ein Profi
Stell dir vor, du möchtest herausfinden, welches Handy bei Jugendlichen in der Schweiz am beliebtesten ist. Du könntest natürlich alle 800’000 Jugendlichen einzeln fragen. Das würde Jahre dauern und ein Vermögen kosten. Oder du fragst 500 zufällig ausgewählte Jugendliche und ziehst daraus Rückschlüsse auf alle.
Genau so arbeiten Meinungsforschungsinstitute, Unternehmen und Wissenschaftler täglich. Sie erheben Daten von einer kleinen Gruppe, um Aussagen über eine grosse Gruppe zu treffen. Dieses Vorgehen nennt man eine statistische Erhebung. Wir zeigen dir jetzt, wie du selbst Daten professionell erheben, strukturieren und auswerten kannst.
Was ist eine statistische Erhebung?
Abschnitt betitelt „Was ist eine statistische Erhebung?“Eine statistische Erhebung ist ein systematisches Verfahren zur Gewinnung von Daten. Du sammelst gezielt Informationen über bestimmte Eigenschaften von Personen, Objekten oder Ereignissen.
Der Begriff “Erhebung” stammt aus dem Lateinischen und bedeutet so viel wie “hervorholen” oder “sammeln”. In der Statistik hebst du also Informationen aus der Realität hervor und machst sie messbar.
Jede statistische Erhebung folgt einem klaren Ablauf. Zuerst definierst du dein Untersuchungsziel. Dann legst du fest, wen oder was du untersuchen willst. Anschliessend wählst du eine geeignete Erhebungsmethode. Zum Schluss sammelst und dokumentierst du die Daten.
Die Grundgesamtheit: Wer soll untersucht werden?
Abschnitt betitelt „Die Grundgesamtheit: Wer soll untersucht werden?“Die Grundgesamtheit umfasst alle Elemente, über die du eine Aussage treffen möchtest. In unserem Handy-Beispiel wären das alle Jugendlichen in der Schweiz.
Die Grundgesamtheit muss immer klar definiert sein. Du musst genau festlegen, wer oder was dazugehört. Dabei spielen räumliche, zeitliche und sachliche Abgrenzungen eine Rolle.
Räumliche Abgrenzung legt das geografische Gebiet fest. Du könntest eingrenzen: “Alle Jugendlichen in der Stadt Zürich” oder “Alle Jugendlichen im Kanton Bern”. Bei internationalen Studien wäre es “Alle Jugendlichen in der DACH-Region”. Die räumliche Eingrenzung bestimmt, für welches Gebiet deine Ergebnisse gelten.
Zeitliche Abgrenzung fixiert den Bezugszeitpunkt oder -zeitraum. Du könntest festlegen: “Stand 1. Januar 2024” oder “Im Schuljahr 2023/24”. Bei schnell verändernden Grössen ist dies besonders wichtig. Die Einwohnerzahl einer Stadt heute unterscheidet sich von der vor zehn Jahren.
Sachliche Abgrenzung definiert die inhaltlichen Kriterien. Du könntest präzisieren: “Jugendliche im Alter von 14 bis 18 Jahren” oder “Schülerinnen und Schüler an Gymnasien”. Hier legst du fest, welche Eigenschaften ein Element haben muss, um zur Grundgesamtheit zu gehören.
Eine unvollständige Definition führt zu Problemen. Wenn du “Schüler in der Schweiz” untersuchst, gehören dann auch Berufsschüler dazu? Privatschüler? Austauschschüler? Je präziser deine Definition, desto klarer sind deine Ergebnisse.
Die Grundgesamtheit (auch Population genannt) ist die Menge aller statistischen Einheiten, über die Aussagen getroffen werden sollen. Sie muss räumlich, zeitlich und sachlich eindeutig abgegrenzt sein. Die Anzahl der Elemente in der Grundgesamtheit bezeichnen wir mit .
Die Stichprobe: Der praktische Kompromiss
Abschnitt betitelt „Die Stichprobe: Der praktische Kompromiss“In den meisten Fällen ist es unmöglich oder zu aufwendig, die gesamte Grundgesamtheit zu untersuchen. Deshalb arbeiten wir mit einer Stichprobe.
Eine Stichprobe ist eine Teilmenge der Grundgesamtheit. Sie enthält Elemente, wobei gilt. Aus den Ergebnissen der Stichprobe schliessen wir auf die gesamte Grundgesamtheit.
Die Qualität einer statistischen Erhebung hängt entscheidend von der Stichprobe ab. Sie muss repräsentativ sein. Das bedeutet: Die Stichprobe soll ein verkleinertes Abbild der Grundgesamtheit darstellen. Wenn in der Grundgesamtheit 52% Frauen und 48% Männer sind, sollte die Stichprobe ähnliche Anteile aufweisen.
Wie gross muss eine Stichprobe sein?
Abschnitt betitelt „Wie gross muss eine Stichprobe sein?“Die benötigte Stichprobengrösse hängt von mehreren Faktoren ab. Je grösser die Grundgesamtheit, desto grösser sollte tendenziell auch die Stichprobe sein. Allerdings wächst der Bedarf nicht proportional. Für eine Grundgesamtheit von 10’000 Personen reichen oft schon 400 Befragte für aussagekräftige Ergebnisse.
Die gewünschte Genauigkeit spielt ebenfalls eine Rolle. Möchtest du das Ergebnis auf 1% genau wissen, brauchst du mehr Befragte als bei einer Genauigkeit von 5%. Politische Umfragen arbeiten typischerweise mit Stichproben von 1’000 bis 2’000 Personen.
Wie ziehst du eine repräsentative Stichprobe?
Abschnitt betitelt „Wie ziehst du eine repräsentative Stichprobe?“Die einfachste Methode ist die Zufallsstichprobe. Dabei hat jedes Element der Grundgesamtheit die gleiche Chance, ausgewählt zu werden. Das entspricht dem Ziehen aus einer Lostrommel. Mathematisch formuliert: Die Auswahlwahrscheinlichkeit beträgt für jedes Element .
Bei der geschichteten Stichprobe teilst du die Grundgesamtheit zuerst in Gruppen (Schichten) auf. Dann ziehst du aus jeder Schicht proportional zur Grösse dieser Schicht. Diese Methode eignet sich, wenn die Grundgesamtheit heterogen ist. Ein Beispiel: Du untersuchst Schweizer Unternehmen. Da es viel mehr kleine als grosse Unternehmen gibt, schichtest du nach Unternehmensgrösse.
Die Klumpenstichprobe wählt zunächst zufällig ganze Gruppen aus. Dann untersuchst du alle Elemente dieser Gruppen. Ein Beispiel: Du wählst zufällig 20 Schulklassen aus und befragst alle Schüler dieser Klassen. Diese Methode ist praktisch, wenn vollständige Listen der Grundgesamtheit fehlen, aber Gruppenzugehörigkeiten bekannt sind.
Merkmale: Was wird untersucht?
Abschnitt betitelt „Merkmale: Was wird untersucht?“Ein Merkmal ist eine Eigenschaft, die du an den statistischen Einheiten beobachtest oder misst. Bei einer Befragung von Schülern könnten Merkmale sein: Alter, Geschlecht, Lieblingsfach oder Lernzeit pro Tag.
Merkmale lassen sich nach verschiedenen Kriterien unterscheiden. Diese Unterscheidung ist wichtig, weil sie bestimmt, welche statistischen Methoden du später anwenden kannst.
Qualitative vs. quantitative Merkmale
Abschnitt betitelt „Qualitative vs. quantitative Merkmale“Qualitative Merkmale beschreiben Eigenschaften in Kategorien. Sie drücken eine Qualität aus, keine Menge. Beispiele sind: Geschlecht (männlich/weiblich/divers), Haarfarbe (blond/braun/schwarz/rot) oder Schultyp (Gymnasium/Realschule/Sekundarschule).
Quantitative Merkmale lassen sich durch Zahlen ausdrücken. Du kannst sie messen oder zählen. Beispiele sind: Körpergrösse in cm, Anzahl Geschwister oder monatliches Taschengeld in CHF.
Qualitative Merkmale (auch kategoriale Merkmale) beschreiben nicht-numerische Eigenschaften. Die Ausprägungen sind Kategorien wie “ja/nein” oder “rot/blau/grün”.
Quantitative Merkmale drücken messbare Grössen aus. Man unterscheidet:
- Diskret: Nur bestimmte Zahlenwerte sind möglich (z.B. Anzahl Kinder: )
- Stetig: Alle Werte in einem Intervall sind möglich (z.B. Körpergrösse: )
Die Skalenniveaus: Wie genau kannst du messen?
Abschnitt betitelt „Die Skalenniveaus: Wie genau kannst du messen?“Das Skalenniveau bestimmt, welche mathematischen Operationen mit deinen Daten sinnvoll sind. Es gibt vier Skalenniveaus, die aufeinander aufbauen.
Die Nominalskala ist die einfachste Stufe. Du kannst nur feststellen, ob zwei Werte gleich oder verschieden sind. Beispiel: Augenfarbe. “Blau” ist nicht grösser oder kleiner als “Braun”.
Die Ordinalskala erlaubt zusätzlich eine Rangfolge. Du kannst sagen, dass ein Wert grösser oder kleiner ist als ein anderer. Beispiel: Schulnoten. Eine 5 ist besser als eine 4. Aber der Abstand zwischen 5 und 4 ist nicht unbedingt gleich dem Abstand zwischen 4 und 3.
Die Intervallskala hat gleiche Abstände zwischen den Werten. Aber es gibt keinen natürlichen Nullpunkt. Beispiel: Temperatur in Celsius. Der Unterschied zwischen und ist gleich gross wie zwischen und . Aber bedeutet nicht “keine Temperatur”.
Die Verhältnisskala hat zusätzlich einen absoluten Nullpunkt. Du kannst sagen, dass ein Wert doppelt so gross ist wie ein anderer. Beispiel: Körpergewicht. ist doppelt so viel wie . Und bedeutet tatsächlich “kein Gewicht”.
Arten von statistischen Erhebungen
Abschnitt betitelt „Arten von statistischen Erhebungen“Je nach Untersuchungsziel und verfügbaren Ressourcen wählst du eine passende Erhebungsart.
Vollerhebung vs. Teilerhebung
Abschnitt betitelt „Vollerhebung vs. Teilerhebung“Bei einer Vollerhebung (auch Totalerhebung) untersuchst du jedes Element der Grundgesamtheit. Das bekannteste Beispiel ist die Volkszählung. Sie erfasst alle Einwohner eines Landes.
Vollerhebungen liefern exakte Ergebnisse. Aber sie sind teuer, zeitaufwendig und oft gar nicht durchführbar. Stell dir vor, du müsstest für eine Qualitätskontrolle alle produzierten Glühbirnen testen. Nach dem Test wären alle Birnen kaputt.
Bei einer Teilerhebung untersuchst du nur eine Stichprobe. Die Ergebnisse sind mit einer gewissen Unsicherheit behaftet. Dafür sparst du Zeit und Geld.
Primärerhebung vs. Sekundärerhebung
Abschnitt betitelt „Primärerhebung vs. Sekundärerhebung“Eine Primärerhebung sammelt neue, originale Daten. Du gehst selbst ins Feld und erhebst Informationen, die vorher nicht existierten. Beispiel: Du führst eine Umfrage in deiner Schule durch.
Eine Sekundärerhebung nutzt bereits vorhandene Daten. Du wertest Informationen aus, die für einen anderen Zweck erhoben wurden. Beispiel: Du analysierst Bevölkerungsstatistiken des Bundesamtes für Statistik.
Befragung, Beobachtung und Experiment
Abschnitt betitelt „Befragung, Beobachtung und Experiment“Die Befragung ist die häufigste Erhebungsmethode. Du stellst Fragen und dokumentierst die Antworten. Befragungen können mündlich (Interview), schriftlich (Fragebogen) oder online durchgeführt werden.
Mündliche Interviews ermöglichen Nachfragen und Vertiefungen. Der Interviewer kann bei Unklarheiten helfen. Allerdings sind sie zeitaufwendig und teuer. Zudem kann die Anwesenheit des Interviewers die Antworten beeinflussen.
Schriftliche Fragebögen erreichen viele Personen gleichzeitig. Sie sind kostengünstiger und anonymer. Dafür leidet oft die Rücklaufquote. Nicht alle ausgefüllten Bögen kommen zurück.
Online-Befragungen kombinieren Vorteile beider Methoden. Sie sind schnell, günstig und ermöglichen komplexe Fragenlogik. Das System kann automatisch zu relevanten Folgefragen springen. Der Nachteil: Nicht alle Bevölkerungsgruppen sind online gleich gut erreichbar.
Bei der Beobachtung registrierst du Verhaltensweisen oder Ereignisse, ohne aktiv einzugreifen. Beispiel: Du zählst, wie viele Fussgänger bei Rot über die Ampel gehen. Die Beobachtung erfasst tatsächliches Verhalten, nicht nur berichtetes. Menschen handeln oft anders, als sie angeben.
Man unterscheidet offene und verdeckte Beobachtung. Bei der offenen Beobachtung wissen die Beobachteten, dass sie beobachtet werden. Dies kann ihr Verhalten verändern. Bei der verdeckten Beobachtung merken sie nichts davon. Hier entstehen ethische Fragen zum Datenschutz.
Das Experiment unterscheidet sich von der Beobachtung durch einen aktiven Eingriff. Du veränderst gezielt bestimmte Bedingungen und beobachtest die Auswirkungen. Beispiel: Du testest, ob Schüler mit klassischer Musik im Hintergrund besser lernen.
Im Experiment arbeitest du typischerweise mit zwei Gruppen. Die Experimentalgruppe erfährt die Veränderung. Die Kontrollgruppe dient als Vergleich und wird nicht verändert. Nur so kannst du feststellen, ob die Veränderung tatsächlich eine Wirkung hat.
Häufige Fehler bei statistischen Erhebungen
Abschnitt betitelt „Häufige Fehler bei statistischen Erhebungen“1. Unklare Definition der Grundgesamtheit Viele Erhebungen scheitern, weil nicht präzise festgelegt wurde, wer zur Grundgesamtheit gehört. “Jugendliche” ist zu vage. “Personen im Alter von 14 bis 18 Jahren mit Wohnsitz in der Schweiz am 1.1.2024” ist eindeutig.
2. Nicht-repräsentative Stichprobe Wenn du nur deine Freunde befragst, erhältst du kein repräsentatives Bild. Die Stichprobe muss zufällig gezogen werden, um Verzerrungen zu vermeiden.
3. Verwechslung von Skalenniveaus Bei Schulnoten (Ordinalskala) ist der Durchschnitt mathematisch fragwürdig. Der Abstand zwischen 6 und 5 ist nicht gleich dem zwischen 5 und 4. Trotzdem berechnen viele einen Notendurchschnitt.
4. Suggestivfragen im Fragebogen “Finden Sie nicht auch, dass der neue Stundenplan schlecht ist?” Diese Frage beeinflusst die Antwort. Neutraler wäre: “Wie beurteilen Sie den neuen Stundenplan?“
3 Beispiele für statistische Erhebungen
Abschnitt betitelt „3 Beispiele für statistische Erhebungen“Beispiel 1: Umfrage zum Lieblingsfach
Abschnitt betitelt „Beispiel 1: Umfrage zum Lieblingsfach“Eine Schule möchte wissen, welches Fach bei den Schülern am beliebtesten ist.
Schritt 1: Grundgesamtheit definieren Alle Schülerinnen und Schüler der Kantonsschule Zürich Nord im Schuljahr 2024/25. Die Grundgesamtheit umfasst Personen.
Schritt 2: Stichprobe ziehen Zufallsstichprobe von Schülern (10% der Grundgesamtheit). Aus jeder Klasse werden per Losverfahren 3 Schüler ausgewählt.
Schritt 3: Merkmal bestimmen Das Merkmal “Lieblingsfach” ist qualitativ. Es hat nominales Skalenniveau. Mögliche Ausprägungen: Mathematik, Deutsch, Englisch, Geschichte, Sport, etc.
Schritt 4: Erhebungsmethode wählen Schriftliche Befragung mit standardisiertem Fragebogen. Teilerhebung (nur Stichprobe, nicht alle). Primärerhebung (neue Daten werden gesammelt).
Schritt 5: Ergebnisse dokumentieren Die Antworten werden in einer Tabelle erfasst. Für jedes Fach zählst du die Häufigkeit.
Beispiel 2: Messung der Reaktionszeit
Abschnitt betitelt „Beispiel 2: Messung der Reaktionszeit“Ein Sportwissenschaftler untersucht, ob Koffein die Reaktionszeit verbessert.
Schritt 1: Grundgesamtheit definieren Alle erwachsenen Amateursportler in der Deutschschweiz. Die Grundgesamtheit ist sehr gross und nicht exakt bezifferbar.
Schritt 2: Stichprobe ziehen Teilnehmer werden über Sportvereine rekrutiert. Geschichtete Stichprobe: 20 Frauen und 20 Männer.
Schritt 3: Merkmal bestimmen Das Merkmal “Reaktionszeit” ist quantitativ und stetig. Gemessen in Millisekunden (ms). Verhältnisskala (Nullpunkt existiert, Verhältnisse sind sinnvoll).
Schritt 4: Erhebungsmethode wählen Experiment mit zwei Gruppen:
- Experimentalgruppe: erhält Koffein
- Kontrollgruppe: erhält Placebo
Beide Gruppen führen einen Reaktionstest durch. Teilerhebung und Primärerhebung.
Schritt 5: Ergebnisse dokumentieren Die Reaktionszeiten werden auf die Millisekunde genau gemessen.
Die Differenz beträgt .
Beispiel 3: Analyse von Wahlergebnissen
Abschnitt betitelt „Beispiel 3: Analyse von Wahlergebnissen“Eine Politikwissenschaftlerin analysiert das Wahlverhalten in verschiedenen Regionen.
Schritt 1: Grundgesamtheit definieren Alle Stimmberechtigten, die bei den Nationalratswahlen 2023 abgestimmt haben. Millionen Personen.
Schritt 2: Art der Erhebung bestimmen Sekundärerhebung: Die Daten existieren bereits. Das Bundesamt für Statistik veröffentlicht detaillierte Wahlstatistiken.
Schritt 3: Merkmale identifizieren Mehrere Merkmale werden untersucht:
| Merkmal | Art | Skalenniveau |
|---|---|---|
| Gewählte Partei | qualitativ | nominal |
| Alter der Wähler | quantitativ, diskret | Verhältnisskala |
| Kanton | qualitativ | nominal |
| Wahlbeteiligung | quantitativ, stetig | Verhältnisskala |
Schritt 4: Daten aufbereiten Die Wahlergebnisse werden nach Kantonen gruppiert. Für jeden Kanton berechnest du den Stimmenanteil pro Partei in Prozent.
Schritt 5: Interpretation Die Wahlbeteiligung betrug im Durchschnitt .
Der höchste Wert lag in Schaffhausen bei , der tiefste in Genf bei .
Das Wichtigste in Kürze
Abschnitt betitelt „Das Wichtigste in Kürze“-
Grundgesamtheit bezeichnet alle Elemente, über die du Aussagen treffen willst. Sie muss räumlich, zeitlich und sachlich eindeutig abgegrenzt sein.
-
Stichproben sind Teilmengen der Grundgesamtheit. Sie müssen repräsentativ sein, um gültige Rückschlüsse zu ermöglichen.
-
Qualitative Merkmale beschreiben Kategorien (z.B. Geschlecht), quantitative Merkmale sind messbare Grössen (z.B. Körpergrösse).
-
Die vier Skalenniveaus (Nominal-, Ordinal-, Intervall-, Verhältnisskala) bestimmen, welche statistischen Operationen sinnvoll sind.
-
Primärerhebungen sammeln neue Daten, Sekundärerhebungen nutzen bestehende Daten.
Dein Wissen im Test
Abschnitt betitelt „Dein Wissen im Test“Eine Schule hat 850 Schüler. Du befragst 85 zufällig ausgewählte Schüler zu ihrem Medienkonsum. Wie gross ist die Grundgesamtheit und wie gross ist die Stichprobe ?
Lösung anzeigen
Die Grundgesamtheit umfasst alle 850 Schüler der Schule: .
Die Stichprobe besteht aus den 85 befragten Schülern: .
Der Stichprobenanteil beträgt:
Du erhebst die Körpergrösse von Schülern in cm. Angenommen, du berechnest den Durchschnitt und erhältst . Ist die Aussage “Schüler A mit ist doppelt so gross wie der halbe Durchschnitt” mathematisch sinnvoll? Begründe mit dem Skalenniveau.
Lösung anzeigen
Ja, die Aussage ist mathematisch sinnvoll.
Die Körpergrösse hat Verhältnisskala-Niveau. Es existiert ein absoluter Nullpunkt (0 cm bedeutet keine Länge), und Verhältnisse sind interpretierbar.
Der halbe Durchschnitt beträgt:
Das Doppelte davon ist:
Schüler A ist mit etwas grösser als das Doppelte des halben Durchschnitts. Bei der Verhältnisskala sind solche Berechnungen zulässig.
Du möchtest herausfinden, wie zufrieden Kunden mit einem neuen Produkt sind. Du befragst nur Kunden, die eine positive Online-Bewertung abgegeben haben. Warum ist das problematisch?
Lösung anzeigen
Die Stichprobe ist nicht repräsentativ.
Du befragst nur Kunden mit positiven Bewertungen. Diese Gruppe ist systematisch verzerrt: Sie enthält überproportional viele zufriedene Kunden.
Unzufriedene Kunden, die keine Bewertung abgegeben haben, fehlen komplett. Kunden mit negativen Bewertungen werden ebenfalls nicht berücksichtigt.
Das Ergebnis überschätzt die tatsächliche Zufriedenheit. Eine korrekte Erhebung müsste alle Kunden mit gleicher Wahrscheinlichkeit einbeziehen, unabhängig davon, ob und wie sie bewertet haben.
Dieser Fehler heisst Selektionsbias oder Auswahlverzerrung.
Ausblick: Was kommt als Nächstes?
Abschnitt betitelt „Ausblick: Was kommt als Nächstes?“Nachdem du nun weisst, wie Daten erhoben werden, folgt der nächste logische Schritt: die Aufbereitung und Darstellung dieser Daten. Du wirst lernen, wie du Häufigkeitsverteilungen erstellst, Diagramme zeichnest und Daten in Tabellen übersichtlich strukturierst.
Im Anschluss daran beschäftigst du dich mit den Lageparametern (Mittelwert, Median, Modus) und den Streuungsparametern (Varianz, Standardabweichung). Diese Kennzahlen fassen die erhobenen Daten zusammen und machen sie vergleichbar. Das Verständnis der Erhebungsarten und Skalenniveaus ist dafür unverzichtbar, denn nicht jeder Lageparameter ist für jedes Skalenniveau geeignet.