Loading...

Dateninformationen


Nettostichprobe: 7.232

Angestrebte Grundgesamtheit: Deutschsprachige Personen ab 14 Jahren in Privathaushalten in Deutschland

Erhebungszeitraum: 07.06.2018-19.01.2019

Modus: Telefonumfrage

Stichprobenrahmen: Dual-Frame Telefonstichprobe

Sonstiges: Um die Befragungsbelastung gering zu halten, wurden manche Fragen nur einer zufälligen Auswahl an Befragten gestellt. Dadurch verringert sich die Fallzahl für manche Items


Informationen zu Konfidenzintervallen

Bei der Betrachtung von statistischen Kennzahlen ist es notwendig, sich bewusst zu sein, dass die Kennzahlen anhand einer Stichprobe errechnet worden sind und die Übertragung der Stichprobenwerte auf die Bevölkerung nicht möglich ist, da nicht davon ausgegangen werden kann, dass der Stichprobenwert den wahren Wert in der Bevölkerung trifft. Denn die Stichprobenwerte fallen je nach Zufallsstichprobe mal höher oder niedriger aus. Aus diesem Grund ist es notwendig ein Intervall zu konstruieren, welches den Grad der Inkonsistenz in den Schätzungen über die verschiedenen Stichproben hinweg berücksichtigt. Diese Intervalle werden Konfidenzintervalle bezeichnet.

Den wahren Wert in der Bevölkerung können wir anhand von Stichproben niemals ermitteln, weshalb dieser nur geschätzt wird. Beispielsweise interessiert uns der Anteil an Frauen, die auf dem Arbeitsmarkt diskriminiert worden sind. Nehmen wir an, dass dieser Anteil in der Bevölkerung bei 36% liegt (Achtung: dies ist ein reines fiktives Beispiel und in der Praxis kennen wir den wahren Wert in der Bevölkerung nicht).


Anhand von Stichprobenstatistiken versuchen wir den wahren Wert zu schätzen. Angenommen wir ziehen eine Stichprobe und ermitteln den Anteil an Frauen, die auf dem Arbeitsmarkt Diskriminierungen erlebt haben, und dieser läge bei 42%. Eine zweite Stichprobenziehung ermittelt einen Anteilswert von 38%, eine weitere 32% und eine andere 14%. Jede gezogene Stichprobe wird einen anderen Anteilswert ermitteln und da der wahre Wert in der Bevölkerung unbekannt ist, wissen wir auch nicht, ob unser Stichprobenwert eine gute oder schlechte Schätzung des wahren Wertes ist. Anstatt sich auf den Stichprobenwert zu fixieren, wird stattdessen eine Intervallschätzung verwendet. Intervallschätzungen sind Grenzen, die so konstruiert sind, dass für einen bestimmten Prozentsatz (üblicherweise 95%) von Stichproben der wahre Wert der Bevölkerung innerhalb dieser Grenzen liegt.

Das bedeutet, wenn 20 Stichproben auf die identische Weise gezogen wurden und für jeden dieser Stichproben die Werte und das dazugehörige 95%-Konfidenzintervall berechnet wurde, enthalten 19 (95%) von 20 Konfidenzintervallen den wahren Wert und 1 (5%) von 20 Konfidenzintervallen enthält den wahren Wert nicht. Abbildung 1 soll das Prinzip des Konfidenzintervalls nochmal anschaulicher machen: die vertikal gestrichelte Linie stellt den wahren Wert dar. Jede horizontale Linie stellt das Konfidenzintervall einer Stichprobe dar, inklusive des Stichprobenwertes (Quadrat auf der Linie). 19 dieser Konfidenzintervalle beinhalten den wahren Wert in der Bevölkerung, ein Konfidenzintervall (das Intervall mit dem unbefüllten Quadrat) schließt den wahren Wert der Bevölkerung aus.

Zurück zur Grafik