Schweitzer Fachinformationen
Wenn es um professionelles Wissen geht, ist Schweitzer Fachinformationen wegweisend. Kunden aus Recht und Beratung sowie Unternehmen, öffentliche Verwaltungen und Bibliotheken erhalten komplette Lösungen zum Beschaffen, Verwalten und Nutzen von digitalen und gedruckten Medien.
Lernziele
Die grundlegende Problemstellung der Inferenzstatistik ist, von Daten, die an Stichproben gewonnen wurden, auf die Gegebenheiten in der Grundgesamtheit zu schließen (daher auch schließende Statistik). Die Stichprobe stellt einen möglichst repräsentativen Ausschnitt der Grundgesamtheit dar. Sie spiegelt die Gegebenheiten der Grundgesamtheit aber nicht exakt wider, sondern fehlerbelastet (Stichprobenfehler). Mittels der Inferenzstatistik lässt sich abschätzen, wie gut auf Basis der Stichprobe auf die Grundgesamtheit geschlossen werden kann.
Mit den Methoden der deskriptiven Statistik werden empirische Daten, die an Stichproben gewonnen wurden, durch zusammenfassende Kennwerte, grafische oder tabellarische Darstellungen beschrieben. Auf diese Weise können Verteilungseigenschaften von umfangreichen Einzeldaten ökonomisch und leicht fassbar dargestellt werden.
In der Wissenschaft geht es aber meist darum, allgemeingültige Aussagen zu treffen. Das heißt, dass das eigentliche Ziel nicht darin besteht, die Stichprobe darzustellen, sondern auf Basis der Stichprobendaten Aussagen zu treffen, die über diese hinausgehen: Es geht darum, die Stichprobenergebnisse auf die Grundgesamtheit zu verallgemeinern. Man spricht daher im Gegensatz zur beschreibenden oder deskriptiven Statistik auch von der schließenden Statistik oder Inferenzstatistik, da auf Basis einer relativ kleinen Menge von Untersuchungseinheiten (Stichprobe) auf alle potentiellen Untersuchungseinheiten (Grundgesamtheit) geschlossen werden soll.
Definition: Grundgesamtheit und Stichprobe
Unter der Grundgesamtheit (auch: Population) versteht man die Gesamtmenge aller potentiellen Untersuchungseinheiten. Eine Stichprobe ist ein Ausschnitt aus der Grundgesamtheit. Bei der Stichprobenziehung werden nach bestimmten Methoden aus der Population Untersuchungseinheiten ausgewählt, die im Rahmen der Datenerhebung tatsächlich untersucht werden und die Population möglichst gut repräsentieren sollen.
Je nachdem über welche Grundgesamtheit man Aussagen treffen will, kann diese breiter (z.?B. alle Menschen) oder enger definiert sein (z.?B. alle in Deutschland lebenden Menschen oder alle Psychologiestudierenden an deutschen Hochschulen).
In aller Regel ist die Population zu groß, um sie vollständig zu untersuchen. Es wäre z.?B. unrealistisch, alle in Deutschland lebenden Menschen untersuchen zu wollen (selbst wenn man nur eine Minute pro Person bräuchte, wäre man damit fast 150 Jahre beschäftigt - und zwar 24 h/Tag, 7 Tage/Woche, ohne zu schlafen oder Pausen zu machen). Stattdessen untersucht man lediglich einen Teil der Grundgesamtheit, eine sogenannte Stichprobe.
Stichprobendaten lassen sich mit Hilfe von Stichprobenkennwerten darstellen. So gibt das arithmetische Mittel () den durchschnittlichen Wert einer Variablen über alle Untersuchungsteilnehmer an. In gleicher Weise gibt es auch in der Population einen Durchschnittswert (µ; ausgesprochen: »mü«). Um statistische Kennwerte, die sich auf eine Stichprobe beziehen, und statistische Parameter, die sich auf die Grundgesamtheit beziehen, schnell unterscheiden zu können, kennzeichnet man diese bei Stichproben mit lateinischen Buchstaben. Wenn es dagegen um die Beschreibung von Grundgesamtheiten geht, zieht man griechische Buchstaben heran (? Tab. 1.1).
Tab. 1.1:Abkürzungen für Stichprobenkennwerte und Populationsparameter
Stichprobenkennwert
Populationsparameter
Arithmetischer Mittelwert
x¯
µ
Varianz
s2
Korrelation
r
?
Wahrscheinlichkeit
p
Wenn nun das Ziel der Inferenzstatistik darin besteht, mittels Stichprobendaten auf die Grundgesamtheit zu schließen, so liegt es nahe, die Stichprobenkennwerte zu nutzen, um auf die Populationsparameter zu schließen. Und genau dies tut man auch. Je besser die Stichprobe die zugrundeliegende Population abbildet, desto exakter lassen sich über die Stichprobenkennwerte die Populationsparameter abschätzen. Aber die Stichprobendaten sind nie ein exaktes Abbild der Population. Man muss immer damit rechnen, dass sie mehr oder weniger fehlerbehaftet sind. Daraus ergibt sich auch, dass Stichprobenkennwerte die jeweiligen Populationsparameter nicht exakt abbilden, sondern mehr oder weniger stark davon abweichen können. Sie können das leicht selbst ausprobieren:
Experiment zur Ungenauigkeit von Stichprobendaten
Das arithmetische Mittel der Population aller Würfelwürfe beträgt µ = 3,5 (da die theoretische Verteilung von Würfelwürfen bekannt ist, ist auch der Populationsparameter bekannt).
Wenn Sie nun anhand von Stichprobendaten µ abschätzen wollen, können Sie z.?B. 10-mal würfeln. Sie haben damit eine Stichprobe von n = 10 Würfelwürfen generiert. Bestimmen Sie den arithmetischen Mittelwert der 10 gewürfelten Augenzahlen. Vermutlich werden Sie feststellen, dass dieser Stichprobenmittelwert nicht exakt = 3,5 ist. Vermutlich werden Sie aber auch feststellen, dass er in der Nähe von 3,5 liegt. Führen Sie das Experiment noch einmal durch. Wieder wird der Mittelwert mehr oder weniger nahe an 3,5 liegen, aber vermutlich nicht exakt 3,5 betragen. Sie können dieses Experiment beliebig häufig wiederholen und werden feststellen, dass sich die Mittelwerte der einzelnen Stichprobenziehungen jeweils mehr oder weniger stark vom Populationsparameter = 3,5 und auch voneinander unterscheiden. Sie werden aber auch feststellen, dass die Ergebnisse in der Regel recht nahe bei 3,5 liegen und größere Abweichungen selten sind.
Wenn man das Würfelexperiment mit 10 Würfelwürfen und anschließender Bestimmung des arithmetischen Mittelwertes sehr häufig wiederholt, resultiert eine Verteilung der Mittelwerte, die sich um den Erwartungswert von = 3,5 verteilen wird (? Abb. 1.1).
Abb. 1.1:Verteilung der Mittelwerte bei n =10 Würfelwürfen
Man könnte das Beispiel auch mit anderen Kennwerten wiederholen (z.?B. könnte man die Standardabweichungen bestimmen etc.). Eines würde immer gleichbleiben: Die resultierenden Kennwerte schwanken mehr oder weniger stark um den »wahren« Wert in der Population, den Populationsparameter. Die resultierende Verteilung bezeichnen wir als Stichprobenkennwerteverteilung (oft auch verkürzt: Stichprobenverteilung; englisch: sampling distribution). Je größer die Schwankungen sind, desto ungenauer ist die Schätzung des Populationsparameters durch den Stichprobenkennwert und desto vorsichtiger müssen wir sein, wenn wir auf Basis der Stichprobendaten Aussagen über die Grundgesamtheit treffen wollen.
Es wäre hilfreich, wenn wir angeben könnten, wie ungenau unsere Aussagen über die Population sind, d.?h., wie groß die Schwankungen der Stichprobenkennwerteverteilung sind. Ein Kennwert, der bereits aus der deskriptiven Statistik bekannt ist, um die Schwankungen der Einzelwerte auszudrücken, ist die Standardabweichung. In äquivalenter Weise können die Schwankungen der Stichprobenkennwerte durch die Standardabweichung der Stichprobenkennwerteverteilung quantifiziert werden. Da es sich um einen besonderen Fall handelt, hat die Standardabweichung der Stichprobenkennwerteverteilung einen besonderen Namen: Sie wird als Standardfehler bezeichnet.
Definition: Standardfehler
Der Standardfehler (englisch: standard error [SE]) ist die Standardabweichung der Kennwerteverteilung von gleichgroßen Zufallsstichproben einer Grundgesamtheit.
Ein in der empirischen Forschung sehr häufiger Anwendungsfall betrifft Aussagen über den Mittelwert einer Variablen (Populationsparameter µ). Der Stichprobenmittelwert ist ein erwartungstreuer Schätzer des Populationsparameters µ (? Kap. 2) µ. Wie im Beispiel mit den 10 Würfelwürfen gesehen, verschätzt der Stichprobenmittelwert den Populationsparameter mehr oder weniger stark und es ergeben sich Schwankungen, so dass sich als Stichprobenkennwerteverteilung die Verteilung der Mittelwerte...
Dateiformat: ePUBKopierschutz: Wasserzeichen-DRM (Digital Rights Management)
Systemvoraussetzungen:
Das Dateiformat ePUB ist sehr gut für Romane und Sachbücher geeignet - also für „fließenden” Text ohne komplexes Layout. Bei E-Readern oder Smartphones passt sich der Zeilen- und Seitenumbruch automatisch den kleinen Displays an. Mit Wasserzeichen-DRM wird hier ein „weicher” Kopierschutz verwendet. Daher ist technisch zwar alles möglich – sogar eine unzulässige Weitergabe. Aber an sichtbaren und unsichtbaren Stellen wird der Käufer des E-Books als Wasserzeichen hinterlegt, sodass im Falle eines Missbrauchs die Spur zurückverfolgt werden kann.
Weitere Informationen finden Sie in unserer E-Book Hilfe.