1 - Vorwort [Seite 1]
2 - Inhaltsverzeichnis [Seite 8]
3 - 1 Was ist Statistik überhaupt? [Seite 14]
3.1 - 1.1 Die Statistik lügt [Seite 14]
3.2 - 1.2 Zielsetzungen [Seite 1]
3.3 - 1.3 Zum Begriff der Statistik [Seite 16]
3.4 - 1.4 Anwendungsbereiche [Seite 18]
3.5 - 1.5 Methodengruppen [Seite 20]
3.6 - 1.6 Grundbegriffe [Seite 22]
4 - 2 Excel - Grundlagen [Seite 24]
4.1 - 2.1 Im Schweiße meines Angesichts [Seite 24]
4.2 - 2.2 Statistik und Excel [Seite 25]
4.3 - 2.3 Der Start von Excel [Seite 26]
4.4 - 2.4 Ein erstes Beispiel [Seite 28]
4.5 - 2.5 Veränderungen [Seite 33]
4.6 - 2.6 Mathematische Berechnungen [Seite 37]
4.7 - 2.7 Drucken [Seite 45]
4.8 - 2.8 Diagramme [Seite 46]
4.9 - 2.9 Daten importieren [Seite 48]
5 - 3 Sortieren, Gruppieren, Klassifizieren [Seite 50]
5.1 - 3.1 Der Lottospieler [Seite 50]
5.2 - 3.2 Wie man statistische Daten gewinnt [Seite 51]
5.3 - 3.3 Von der Urliste zur Häufigkeitsverteilung [Seite 56]
5.4 - 3.4 Zeitreihen [Seite 66]
5.5 - 3.5 Kreuztabellen [Seite 66]
6 - 4 Mittelwerte [Seite 70]
6.1 - 4.1 Wo bitte ist die Mitte? [Seite 70]
6.2 - 4.2 Wozu braucht man Mittelwerte? [Seite 70]
6.3 - 4.3 Das arithmetische Mittel [Seite 72]
6.4 - 4.4 Der häufigste Wert (Modus) [Seite 78]
6.5 - 4.5 Der Zentralwert (Median) [Seite 81]
6.6 - 4.6 Das geometrische Mittel [Seite 82]
7 - 5 Streuungsmaße [Seite 86]
7.1 - 5.1 Am Frühstückstisch [Seite 86]
7.2 - 5.2 Spannweite [Seite 86]
7.3 - 5.3 Mittlere lineare Abweichung [Seite 88]
7.4 - 5.4 Standardabweichung [Seite 90]
7.5 - 5.5 Quartile und Semiquartilsabstand [Seite 93]
8 - 6 Konzentrationsmaße [Seite 98]
8.1 - 6.1 Isabella [Seite 98]
8.2 - 6.2 Was bedeutet Konzentration? [Seite 98]
8.3 - 6.3 Herfindahl-Index [Seite 99]
8.4 - 6.4 Maß von Lorenz/Münzner [Seite 101]
8.5 - 6.5 Die Lorenzkurve [Seite 102]
8.6 - 6.6 Der Lorenzkoeffizient [Seite 107]
9 - 7 Grafische Darstellungen [Seite 112]
9.1 - 7.1 Chinesische Tusche [Seite 112]
9.2 - 7.2 Die Vorzüge grafischer Darstellungen [Seite 112]
9.3 - 7.3 Säulendiagramm [Seite 114]
9.4 - 7.4 Kreisdiagramm [Seite 118]
9.5 - 7.5 Streudiagramm [Seite 120]
10 - 8 Indexberechnungen [Seite 126]
10.1 - 8.1 Alles wird immer teurer [Seite 126]
10.2 - 8.2 Gliederungszahlen, Messziffern, Wachstumsraten [Seite 126]
10.3 - 8.3 Umbasierung und Verkettung [Seite 131]
10.4 - 8.4 Preisindex [Seite 133]
10.5 - 8.5 Mengenindex [Seite 139]
10.6 - 8.6 Wertindex [Seite 141]
11 - 9 Regressionsrechnung (bivariat) [Seite 144]
11.1 - 9.1 Auf dem Tennisplatz [Seite 144]
11.2 - 9.2 Zielsetzungen [Seite 144]
11.3 - 9.3 Mathematische Grundlagen [Seite 149]
11.4 - 9.4 Die Methode der kleinsten Quadrate [Seite 150]
11.5 - 9.5 Beispiel zur Regressionsrechnung [Seite 153]
11.6 - 9.6 Fallstricke [Seite 160]
12 - 10 Zusammenhangsrechnung [Seite 164]
12.1 - 10.1 Das Klassenbuch [Seite 164]
12.2 - 10.2 Korrelations- und Determinationskoeffizient [Seite 164]
12.3 - 10.3 Rangkorrelation [Seite 175]
12.4 - 10.4 Zusammenhangsmaße für Nominaldaten [Seite 177]
12.5 - 10.5 Der Alleskönner [Seite 182]
13 - 11 Trendfunktionen und Trendprognosen [Seite 186]
13.1 - 11.1 Statistik lügt? [Seite 186]
13.2 - 11.2 Zielsetzungen [Seite 186]
13.3 - 11.3 Glättung einer Zeitreihe [Seite 189]
13.4 - 11.4 Linearer Zeitreihentrend [Seite 192]
13.5 - 11.5 Exponentieller Trend [Seite 197]
13.6 - 11.6 Saisonale Schwankungen [Seite 198]
14 - 12 Grundlagen der Wahrscheinlichkeitstheorie [Seite 204]
14.1 - 12.1 Pfälzer Leberwurst [Seite 204]
14.2 - 12.2 Ereignisse [Seite 205]
14.3 - 12.3 Kombinatorik [Seite 207]
14.4 - 12.4 Kombinatorische Praxisaufgaben [Seite 216]
14.5 - 12.5 Bestimmung der Wahrscheinlichkeit [Seite 217]
15 - 13 Wahrscheinlichkeitsverteilungen [Seite 224]
15.1 - 13.1 Mensch ärgere Dich nicht! [Seite 224]
15.2 - 13.2 Grafische Darstellung von Wahrscheinlichkeiten [Seite 225]
15.3 - 13.3 Der Additionssatz [Seite 226]
15.4 - 13.4 Der Multiplikationssatz [Seite 229]
15.5 - 13.5 Zwei weitere Sätze [Seite 231]
15.6 - 13.6 Zufallsvariable [Seite 235]
15.7 - 13.7 Diskrete Wahrscheinlichkeitsverteilungen [Seite 237]
15.8 - 13.8 Stetige Wahrscheinlichkeitsverteilungen [Seite 239]
15.9 - 13.9 Erwartungswert und Varianz von Zufallsvariablen [Seite 244]
16 - 14 Spezielle Wahrscheinlichkeitsverteilungen [Seite 248]
16.1 - 14.1 Das neue Fahrrad [Seite 248]
16.2 - 14.2 Vorbemerkung [Seite 249]
16.3 - 14.3 Binomialverteilung [Seite 249]
16.4 - 14.4 Normalverteilung [Seite 260]
16.5 - 14.5 Multinomialverteilung [Seite 269]
16.6 - 14.6 Hypergeometrische Verteilung [Seite 270]
16.7 - 14.7 Poisson-Verteilung [Seite 273]
16.8 - 14.8 Student-t-Verteilung [Seite 275]
16.9 - 14.9 Chi-Quadrat-Verteilung [Seite 275]
16.10 - 14.10 F-Verteilung [Seite 276]
17 - 15 Stichproben und Stichprobenverteilungen [Seite 278]
17.1 - 15.1 Zufall? [Seite 278]
17.2 - 15.2 Auswahlverfahren für Stichproben [Seite 278]
17.3 - 15.3 Bewusste Auswahlen [Seite 280]
17.4 - 15.4 Zufällige Auswahlen [Seite 281]
17.5 - 15.5 Stichprobenverteilungen [Seite 287]
17.6 - 15.6 Das zentrale Grenzwerttheorem [Seite 292]
17.7 - 15.7 Stichprobenverteilungen wichtiger Maßzahlen [Seite 293]
17.8 - 15.8 Notationen [Seite 303]
18 - 16 Der parametrische Hypothesentest [Seite 304]
18.1 - 16.1 An der Theke [Seite 304]
18.2 - 16.2 Beispiel: Der Zigarettentest [Seite 305]
18.3 - 16.3 Mittelwerttest [Seite 307]
18.4 - 16.4 Entscheidungsfehler [Seite 311]
18.5 - 16.5 Weitere Parametertests [Seite 319]
18.6 - 16.6 Die Güte eines Tests [Seite 327]
19 - 17 Hochrechnungen [Seite 332]
19.1 - 17.1 Modifizierte Bundestagswahl [Seite 332]
19.2 - 17.2 Aufgaben der Schätzstatistik [Seite 332]
19.3 - 17.3 Punktschätzverfahren [Seite 333]
19.4 - 17.4 Intervallschätzungen [Seite 338]
20 - 18 Tests bei kleinen Stichprobenumfängen [Seite 344]
20.1 - 18.1 Die sparsamste Lösung [Seite 344]
20.2 - 18.2 Ausgangslage [Seite 344]
20.3 - 18.3 Anteilswerttest [Seite 345]
20.4 - 18.4 Anteilswertdifferenzentest (Fisher-Test) [Seite 347]
20.5 - 18.5 Mittelwerttest [Seite 350]
20.6 - 18.6 Mittelwertdifferenzentest [Seite 352]
20.7 - 18.7 Varianzquotiententest [Seite 353]
20.8 - 18.8 Mittelwerte aus mehr als zwei Stichproben [Seite 355]
21 - 19 Anpassungstestverfahren [Seite 362]
21.1 - 19.1 Total normal? [Seite 362]
21.2 - 19.2 Aufgaben von Anpassungstests [Seite 362]
21.3 - 19.3 Chi-Quadrat-Anpassungstest [Seite 365]
21.4 - 19.4 Fisher-Test und Chi-Quadrat-Homogenitätstest [Seite 376]
21.5 - 19.5 Kolmogoroff-Smirnow-Test [Seite 378]
22 - 20 Testen statistischer Zusammenhänge [Seite 382]
22.1 - 20.1 Die Streitfrage [Seite 382]
22.2 - 20.2 Chi-Quadrat-Unabhängigkeitstest (Nominaldaten) [Seite 382]
22.3 - 20.3 Unabhängigkeitstest bei Ordinaldaten [Seite 388]
22.4 - 20.4 Test des Korrelationskoeffizienten r [Seite 390]
22.5 - 20.5 Test des Regressionskoeffizienten [Seite 393]
22.6 - 20.6 Schätzen der Regressionsgeraden [Seite 395]
23 - 21 Multiple Regression und partielle Korrelation [Seite 398]
23.1 - 21.1 Vom Sinn der Aufklärung [Seite 398]
23.2 - 21.2 Drittvariablen [Seite 399]
23.3 - 21.3 Partielle Korrelationsrechnung [Seite 401]
23.4 - 21.4 Multiple lineare Regression [Seite 404]
23.5 - 21.5 Multipler Determinationskoeffizient [Seite 407]
23.6 - 21.6 Nichtmetrische Daten [Seite 408]
24 - 22 Weitere Verfahren [Seite 410]
24.1 - 22.1 Der Kollege [Seite 410]
24.2 - 22.2 Was fehlt? [Seite 411]
24.3 - 22.3 Zusätzliche Testverfahren [Seite 411]
24.4 - 22.4 Multivariate Verfahren [Seite 415]
25 - 23 Spezielle Diagramme [Seite 422]
25.1 - 23.1 Wo die Liebe hinfällt [Seite 422]
25.2 - 23.2 Das Layout von Diagrammen [Seite 422]
25.3 - 23.3 Stabdiagramm, Histogramm und Ogive [Seite 435]
25.4 - 23.4 Spezialitäten zu Streudiagrammen [Seite 443]
25.5 - 23.5 Die grafische Darstellung von Zeitreihen [Seite 449]
25.6 - 23.6 Sonstige Diagramme [Seite 456]
25.7 - 23.7 Zeichnungen und Organigramme [Seite 469]
26 - Excel-Funktionen [Seite 486]
27 - Glossar [Seite 492]
28 - Register [Seite 510]
29 - Mehr eBooks bei www.ciando.com [Seite 0]
1 Was ist Statistik überhaupt? (S. 13)
„Ich glaube keiner Statistik, die ich nicht selbst gefälscht habe." (W. Churchill, brit. Premierminister, 1944)
1.1 Die Statistik lügt
Ein bekanntes deutsches Wirtschaftsforschungsinstitut veröffentlichte Mitte der 60er-Jahre des vergangenen Jahrhunderts eine statistische Prognose, nach der es mit der zukünftigen Wirtschaftsentwicklung in der Bundesrepublik Deutschland schlecht bestellt sei. Für die 70er-Jahre erwartete es deutliche konjunkturelle Einbrüche und vor allem stark anwachsende Arbeitslosenzahlen. Aufgrund der Veröffentlichung dieser Prognosen in einem viel beachteten Gutachten unternahmen die verantwortlichen Wirtschaftspolitiker, der Kanzler, der Wirtschaftsminister und der Finanzminister, alle Anstrengungen, um den prognostizierten Konjunktureinbruch zu verhindern. Zur Konjunkturbeeinflussung gibt es ja bekanntlich einige wirtschafts- und finanzpolitische Instrumente, die dann tatsächlich zum Einsatz kamen. Der Erfolg dieser Bemühungen war deutlich: Zwar konnte der konjunkturelle Einbruch nicht ganz verhindert, aber doch wesentlich abgeschwächt werden. Mehr noch: Es kam rasch wieder zu einer wirtschaftlichen Erholung, die unter dem Namen „Aufschwung nach Maß" den älteren Lesern vielleicht noch bekannt sein dürfte.
Dieser schöne Erfolg verführte einige Politiker dazu, bei nächstbester Gelegenheit – als nämlich von den Statistikern Befunde veröffentlicht wurden, die der Tagespolitik nicht sehr angenehm waren – davon zu sprechen, dass man der Statistik nicht trauen könne. „Das hat man doch gesehen, meine Damen und Herren", wurde vom Rednerpult des Bundestages herunter verkündet, „da wurden von den Statistikern schwerwiegende konjunkturelle Einbrüche prognostiziert – und was ist passiert? Ich frage dieses hohe Haus, was ist passiert? Genau das Gegenteil ist eingetreten! Dank unserer hervorragenden Politik ist uns ein Aufschwung nach Maß gelungen, meine Damen und Herren. Man darf den Statistikern nicht glauben, meine Damen und Herren!" Meine Schwiegermutter pflegte diese Erkenntnis kürzer zu formulieren. Sie sagte einfach: „Die Statistik lügt!"
Aufgabe dieses Buches ist es zu zeigen, was Statistik wirklich ist, genauer, was man mit statistischen Methoden machen kann. Dass man damit ab und zu auch ein bisschen schwindeln kann (man muss es aber nicht), wird sich dabei ebenfalls zeigen. Doch nun zur Sache.
1.2 Zielsetzungen
Tag für Tag lesen Sie in den Zeitungen oder hören in den Rundfunk- und Fernsehnachrichten von Sozialprodukt, Konjunktur, Wirtschaftswachstum, Arbeitslosenquote oder Preisniveau und Lebenshaltungskosten, von „neuer Armut", vom „Pisa-Schock" usw. Natürlich stehen diese und ähnliche Begriffe nicht für sich allein da, sondern werden interessant und aussagefähig, wenn sie mit Zahlen, mit statistischen Daten belegt sind:
Der Trend in der Entwicklung des Sozialprodukts in der Bundesrepublik Deutschland zeigt aufwärts.
Der Anteil potenzieller FDP-Wähler steigt seit etwa zwei Jahren signifikant an im Vergleich zum vorhergehenden langjährigen Durchschnitt.
In der Zeit von 1990 bis 2004 stiegen die Lebenshaltungskosten durchschnittlich pro Jahr um 1,8%.
Die Arbeitslosenquote lag im Jahr 2004 bei 8,1%.
Der Anteil von Abiturienten aus Familien schwächerer sozialer Schichten ist unterdurchschnittlich.
Solche und ähnliche Aussagen werden häufig von unseren Politikern formuliert. Man kann sie aber nur dann richtig verstehen und bewerten, wenn man weiß, was ein Trend ist und wie man ihn bestimmt, wenn man den Begriff der statistischen Signifikanz kennt, wenn man erfährt, wie die Statistiker Durchschnitte oder Prozentanteile berechnen und was sie unter Lebenshaltungskosten oder unter einem Preisindex verstehen.