Statistik mit Excel für Dummies

 
 
Wiley-VCH (Verlag)
  • 2. Auflage
  • |
  • erschienen am 17. Februar 2017
  • |
  • 535 Seiten
 
E-Book | ePUB mit Adobe DRM | Systemvoraussetzungen
978-3-527-81170-0 (ISBN)
 
Statistiken und Aussagen zu Wahrscheinlichkeiten begegnen uns heute überall: Die Umsatzentwicklung in Unternehmen, Hochrechnungen für Wahlergebnisse, PISA-Ergebnisse fünfzehnjähriger Schüler sind nur drei von zahlreichen Beispielen. Joseph Schmuller zeigt Ihnen in diesem Buch, wie Sie die Zahlen in den Griff bekommen und Daten, Statistiken und Wahrscheinlichkeiten richtig lesen und interpretieren. Dafür brauchen Sie keinen Statistikkurs zu belegen und kein Mathegenie zu sein. Für alles gibt es in Excel die passende Funktion und das passende Werkzeug. So können Sie Theorie und Praxis sofort miteinander verbinden.
2. Auflage
  • Deutsch
  • Weinheim
  • |
  • Deutschland
  • 31,09 MB
978-3-527-81170-0 (9783527811700)
3527811702 (3527811702)
weitere Ausgaben werden ermittelt
Joseph Schmuller hat langjährige Erfahrung im Unterrichten von Statistik an der Universität, zur Zeit arbeitet er als Professor in den USA.
  • Schummelseite
  • Titel
  • Impressum
  • Über den Autor
  • Inhaltsverzeichnis
  • Einleitung
  • Teil I: Statistik und Excel: Wie füreinander geschaffen
  • Kapitel 1: Echte Daten auswerten
  • Die statistischen (und damit verwandten) Begriffe, die Sie einfach kennen müssen
  • Inferenzstatistik: Testen von Hypothesen
  • Was ist neu in Excel 2016?
  • Was ist alt in Excel 2016?
  • Die Grundlagen kennen
  • Kapitel 2: Grundlegendes zu den statistischen Funktionen von Excel
  • Erste Schritte
  • Machen Sie sich bereit für die Statistik
  • Auf oft verwendete Funktionen zugreifen
  • Teil II: Daten beschreiben
  • Kapitel 3: Präsentieren: Daten in Diagrammen darstellen
  • Warum Diagramme verwenden?
  • Einige grundlegende Dinge
  • Die Diagramm-Features von Excel
  • So werden Sie ein Säulenheiliger
  • Segmente eines Kreisdiagramms
  • Eine Linie ziehen
  • Minidiagramme mit Sparklines
  • Balken über Balken
  • Punkt, Punkt, Komma, Strich .
  • Ein weiterer Einsatzzweck für das Punktdiagramm
  • Die Blasen schmecken
  • Alles auf Kurs
  • An der Oberfläche kratzen
  • Im Netz gefangen
  • Eine Treemap blühen und die Sonne hervorbrechen lassen
  • Ein Histogramm erstellen
  • Säulen sortieren: Pareto
  • Kastengrafik: Kästchen und Antennen
  • 3D-Karten
  • Kapitel 4: Suchen Sie Ihre Mitte
  • Mittelwert: Die Lehre vom Durchschnitt
  • Mediane: Auf halber Strecke erwischt
  • Der Modalwert
  • Kapitel 5: Abweichungen vom Durchschnitt
  • Die Streuung berechnen
  • Zurück zu den Wurzeln: Standardabweichung
  • Verwandte Funktionen
  • Kapitel 6: Standards und Wertungen kennenlernen
  • Z-Werte einfangen
  • Wo stehen Sie?
  • Kapitel 7: Alles zusammenfassen
  • Auszählen
  • Groß und klein
  • Jetzt wird es esoterisch
  • Nun kommt die Häufigkeit ins Spiel
  • Können Sie mir eine Beschreibung geben?
  • Schnelle Analysen
  • Schnelle Kenngrößen
  • Kapitel 8: Was ist normal?
  • So kratzen Sie die Kurve
  • Eine ganz besondere Verteilung
  • Eine Standardnormalverteilung als Diagramm darstellen
  • Teil III: Rückschlüsse aus Daten ziehen
  • Kapitel 9: Die Sache mit dem Vertrauen: Schätzung
  • Stichprobenverteilungen verstehen
  • Ein BESONDERS wichtiges Konzept: der zentrale Grenzwertsatz
  • Die Vertrauensgrenzen
  • Passend für ein t
  • Kapitel 10: Ein-Stichproben-Hypothesentest
  • Hypothesen, Tests und Fehler
  • Noch einmal z-Werte
  • t-Test für eine Stichprobe
  • Eine t-Verteilung visualisieren
  • Testen einer Varianz
  • Eine Chi-Quadrat-Verteilung visualisieren
  • Kapitel 11: Zwei-Stichproben-Hypothesentest
  • Hypothesen für zwei
  • Noch einmal Stichprobenverteilungen
  • t-Test für zwei Stichproben
  • Ein passendes Paar: Hypothesentest für abhängige Stichproben
  • Zwei Varianzen testen
  • Die F-Verteilung visualisieren
  • Kapitel 12: Mehr als zwei Stichproben testen
  • Mehr als zwei Stichproben testen
  • Eine andere Art Hypothese, eine andere Art Test
  • Kapitel 13: Etwas komplexere Tests
  • Die Kombinationen knacken
  • Noch einmal Kombinationen knacken
  • Zwei Arten von Variablen, und zwar gleichzeitig
  • Excel mit einem gemischten Design verwenden
  • Die Ergebnisse als Diagramm darstellen
  • Nach der ANOVA
  • Kapitel 14: Lineare und multiple Regression
  • Das Streudiagramm
  • Geraden zeichnen
  • Regression: Was für eine Gerade!
  • Tabellenblattfunktionen für die Regression
  • Datenanalysetool: Regression
  • Irrsinnig viele Zusammenhänge auf einmal: multiple Regression
  • Excel-Tools für multiple Regression
  • Kapitel 15: Korrelation: Aufstieg und Fall von Zusammenhängen
  • Noch einmal Streudiagramme
  • Korrelation und Regression
  • Hypothesen über Korrelationen testen
  • Tabellenblattfunktionen für die Korrelation
  • Datenanalysetool: Korrelation
  • Datenanalysetool: Kovarianz
  • Hypothesen über Korrelationen testen
  • Kapitel 16: Es wird höchste Zeit
  • Eine Zeitreihe und ihre Komponenten
  • Sanftes Gleiten
  • Exponentielles Glätten
  • Prognosen mit einem Klick
  • Kapitel 17: Parameterfreie Statistik
  • Unabhängige Stichproben
  • Parallelstichproben
  • Spearmans Rangkorrelationskoeffizient
  • Ein paar Hinweise zum Schluss
  • Teil IV: Wahrscheinlichkeit
  • Kapitel 18: Einführung in die Wahrscheinlichkeit
  • Was ist Wahrscheinlichkeit?
  • Zusammengesetzte Ereignisse
  • Bedingte Wahrscheinlichkeit
  • Große Wahrscheinlichkeitsräume
  • Tabellenblattfunktionen
  • Zufallsvariablen: diskret und stetig
  • Wahrscheinlichkeitsverteilungen und Dichtefunktionen
  • Die Binomialverteilung
  • Tabellenblattfunktionen
  • Hypothesen mit der Binomialverteilung testen
  • Weitere Informationen zum Testen von Hypothesen
  • Die hypergeometrische Verteilung
  • Kapitel 19: Mehr zur Wahrscheinlichkeit
  • Betaverteilung
  • BETA.INV
  • Poissonverteilung
  • Gammaverteilung
  • Exponentialverteilung
  • Kapitel 20: Modelle
  • Die Modellierung einer Verteilung
  • Prüfen, ob das Modell passt
  • Simulationen
  • Den Würfel »zinken«
  • Teil V: Der Top-Ten-Teil
  • Kapitel 21: Zehn Tipps und Fallstricke bei der Arbeit mit Statistiken und Grafiken
  • Signifikant bedeutet nicht immer wichtig
  • Der Versuch, eine Nullhypothese nicht zu verwerfen, hat einige Auswirkungen
  • Regressionen sind nicht immer linear
  • Extrapolieren über die Grenzen eines Streuungsdiagramms hinaus ist eine ganz schlechte Idee
  • Untersuchen Sie die Variabilität um eine Regressionsgerade herum
  • Eine Stichprobe kann auch zu groß sein
  • Achse ist nicht gleich Achse
  • Eine kategorische Variable grafisch so darzustellen, als sei sie eine quantitative Variable, ist ganz einfach falsch
  • Wann immer möglich, sollten Sie Variabilität in Ihr Diagramm einschließen
  • Seien Sie vorsichtig, wenn Sie Konzepte aus Statistikbüchern in Excel übertragen
  • Kapitel 22: Zehn Dinge (eigentlich zwölf), die einfach nicht in die anderen Kapitel passten
  • Diagrammdarstellung des Standardfehlers des Mittelwerts
  • Wahrscheinlichkeiten und Verteilungen
  • Stichproben ziehen
  • Unabhängigkeit testen: die wahre Verwendung von CHIQU.TEST
  • Logarithmica Esoterica
  • Daten sortieren
  • Anahng A: Wenn Ihr Arbeitsblatt eine Datenbank ist
  • Einführung in Excel-Datenbanken
  • Datensätze zählen und Auszüge aus der Datenbank
  • Arithmetik
  • Statistiken
  • Datenmasken verwenden
  • PivotTable-Berichte
  • Anahng B: Die Kovarianzanalyse
  • Kovarianz unter die Lupe genommen
  • Warum Sie die Kovarianz analysieren
  • Wie Sie die Kovarianz analysieren
  • ANCOVA mit Excel
  • Eins hab ich noch
  • Stichwortverzeichnis
  • Eula

Kapitel 1

Echte Daten auswerten


In diesem Kapitel

Im Rahmen der Statistik geht es immer darum, Entscheidungen zu treffen, die auf Zahlengruppen beruhen. Statistiker stellen ständig Fragen: Was sagen uns die Zahlen? Welche Trends zeichnen sich ab? Welche Vorhersagen können wir treffen? Welche Schlüsse können wir ziehen?

Um diese Fragen zu beantworten, haben Statistiker eine beeindruckende Menge an Analysetools entwickelt. Mit diesen Tools wird den Bergen an Daten, die darauf warten, dass wir uns eingehend mit ihnen beschäftigen, eine Bedeutung zugeschrieben. Und mit diesen Tools können wir die Zahlen verstehen, die wir bei unserer Arbeit generieren.

Die statistischen (und damit verwandten) Begriffe, die Sie einfach kennen müssen


Da intensives Rechnen häufig fester Bestandteil der Arbeit eines Statistikers ist, haben viele Leute die falsche Vorstellung, dass es bei der Statistik ausschließlich um die Verarbeitung großer Zahlenmengen geht. Das Rechnen ist jedoch nur ein kleiner Teil auf dem Weg hin zu einer vernünftigen Entscheidung.

Die Software nimmt uns diese Arbeit ab, so dass wir auf unserem Weg schneller vorankommen. Einige Software-Pakete sind auf die statistische Analyse spezialisiert und enthalten viele der Tools, die Statistiker verwenden. Excel wird zwar nicht explizit als Statistikpaket verkauft, enthält aber dennoch eine Reihe dieser Tools. Daher habe ich auch dieses Buch geschrieben.

Ich schrieb, Rechnen sei nur ein kleiner Teil auf dem Weg hin zu einer vernünftigen Entscheidung. Der wichtigste Teil sind die Konzepte, mit denen Statistiker arbeiten, und um diese geht es in diesem Kapitel in erster Linie.

Stichproben und Grundgesamtheiten


An Wahlabenden sagen Fernsehkommentatoren regelmäßig noch vor Schließung der Wahllokale das Ergebnis der Wahlen voraus. Meist liegen sie richtig. Wie geht das?

Ganz einfach: Eine Stichprobe von Wählern wird nach Abgabe ihrer Stimme befragt. Unter der Voraussetzung, dass die Wähler ehrlich sagen, wen sie gewählt haben, und vorausgesetzt, die Stichprobe ist für die Grundgesamtheit (oder Population) repräsentativ, können die Analysten in den Fernsehanstalten aufgrund der Stichprobendaten Rückschlüsse auf die Grundgesamtheit der Wähler ziehen.

Das ist die Aufgabe von Statistikern: aufgrund der Ergebnisse einer Stichprobe Rückschlüsse auf die Grundgesamtheit zu ziehen, aus der die Stichprobe entnommen wurde. Manchmal erweisen sich jedoch die anhand der Zahlen gezogenen Rückschlüsse als falsch. Das falsche Ergebnis einer Wahlumfrage führte zu dem denkwürdigen Bild von US-Präsident Harry Truman mit einer Ausgabe der Chicago Daily Tribune in der Hand mit der berühmten, aber falschen Schlagzeile »Dewey Defeats Truman« (Dewey schlägt Truman) nach der Wahl 1948. Zu der Aufgabe eines Statistikers gehört es mitzuteilen, für wie realistisch er die Schlussfolgerung hält. Ein anderes Beispiel ebenfalls aus dem Bereich der Wahlforschung zeigt, dass derartige Schlussfolgerungen durchaus realistisch sein können. Das Ergebnis einer Wahlumfrage (wir gehen wieder von einer repräsentativen Stichprobe von Wählern aus) gibt an, wie viel Prozent der Wähler aus der Stichprobe die einzelnen Kandidaten favorisieren. Das Meinungsforschungsinstitut gibt an, für wie genau das Umfrageergebnis eingeschätzt wird. Wenn ein Nachrichtensprecher so etwas wie »auf 3 % genau« sagt, hören Sie eine Beurteilung der Glaubwürdigkeit.

Noch ein Beispiel. Nehmen wir einmal an, Sie haben die Aufgabe, die durchschnittliche Lesegeschwindigkeit aller Fünftklässler herauszufinden, Sie verfügen jedoch weder über die Zeit noch über die finanziellen Mittel, alle Fünftklässler zu testen. Was würden Sie tun?

Am besten nehmen Sie eine Stichprobe von Fünftklässlern, messen deren Lesegeschwindigkeit (in Wörtern pro Minute) und berechnen den Mittelwert dieser Lesegeschwindigkeit der Stichprobe. Sie können dann den Mittelwert der Stichprobe zur Schätzung des Mittelwerts der Grundgesamtheit heranziehen.

Das Schließen auf den Mittelwert einer Grundgesamtheit ist eine Art Inferenz, die Statistiker aus Stichprobendaten ziehen. Die Inferenz wird im Abschnitt »Inferenzstatistik: Testen von Hypothesen« ausführlicher beschrieben.

  • , s, r) für Statistiken. In Abbildung 1.1 sind die Beziehungen zwischen Grundgesamtheiten und Stichproben sowie zwischen Parametern und Statistiken dargestellt.

Abbildung 1.1: Die Beziehung zwischen Grundgesamtheiten, Stichproben, Parametern und Statistiken

Abhängige und unabhängige Variablen


Einfach ausgedrückt, ist eine Variable etwas, das mehrere Werte annehmen kann. (Etwas, das nur einen Wert annehmen kann, wird Konstante genannt.) Einige Variablen, die Sie bereits kennen, sind Tagestemperatur, Dow-Jones-Index, Ihr Alter und der Wert des Dollar in Euro.

Für Statistiker sind zwei Arten von Variablen wichtig: unabhängige Variablen und abhängige Variablen. Beide Variablen tauchen in jeder Studie und Untersuchung auf und Statistiker bewerten die Beziehung zwischen beiden.

Stellen Sie sich beispielsweise vor, es gebe eine neue Möglichkeit, Lesen so zu lehren, dass Fünftklässler schneller lesen können. Bevor diese neue Methode an Schulen eingeführt wird, soll sie getestet werden. Dazu müsste ein Forscher eine Stichprobe von Fünftklässlern nach dem Zufallsprinzip in zwei Gruppen teilen. Eine Gruppe wird nach der neuen Methode unterrichtet, die andere nach der herkömmlichen. Der Forscher misst vor und nach dem Unterricht die Lesegeschwindigkeit aller Kinder, die an dieser Studie teilnehmen. Was dann geschieht, erfahren Sie in einem der nächsten Abschnitte (»Inferenzstatistik: Testen von Hypothesen«).

Hier geht es zunächst darum, dass Sie wissen, dass die unabhängige Variable in diesem Beispiel die Unterrichtmethode ist. Die beiden möglichen Werte dieser Variablen sind Neu und Herkömmlich. Die abhängige Variable ist die Lesegeschwindigkeit.

Arten von Daten


Es gibt vier verschiedene Arten von Daten. Wenn Sie mit einer Variablen arbeiten, hängt es von der Datenart ab, wie Sie mit der Variablen arbeiten.

Die erste Art wird als nominalskalierte oder nominale Daten bezeichnet. Wenn eine Zahl eine nominale Variable ist, handelt es sich lediglich um einen Namen. Der Zahlenwert bedeutet nichts. Ein gutes Beispiel hierfür ist die Zahl auf dem Trikot eines Sportlers. Sie dient lediglich der Identifizierung des Sportlers, um ihn von den anderen Mitgliedern seines Teams unterscheiden zu können. Die Zahl ist kein Hinweis auf das Können des Sportlers.

Als Nächstes kommen die ordinalskalierten oder ordinalen Daten. Bei ordinalen Daten geht es um Ordnung. Die Zahlen erhalten eine Bedeutung, die über die bloße Identifizierung hinausgeht. Eine höhere Zahl bedeutet, dass eine Eigenschaft in einem höheren Maß vorhanden ist als bei einer niedrigeren Zahl. Ein Beispiel hierfür ist die Mohssche Härteskala. Diese Skala wird seit 1822 verwendet und gibt Werte zwischen 1 und 10 an. Mit dieser Skala geben Mineralogen den Härtegrad von Mineralen an. Diamant ist mit dem Härtegrad 10 das härteste Mineral und Talk mit dem Härtegrad 1 das weichste. Mit einem Mineral einer bestimmten Härte lässt sich jedes Mineral mit einer geringeren Härte ritzen.

Was bei der Mohsschen Skala (und allen Ordinalskalen) fehlt, ist das Konzept von gleichen Intervallen oder gleichen Differenzen. Die Differenz zwischen dem Härtegrad 10 und dem Härtegrad 8 ist nicht dieselbe wie zwischen dem Härtegrad 6 und dem Härtegrad 4.

Intervallskalierte Daten geben Differenzen an. Temperaturangaben in Celsius und Fahrenheit sind ein Beispiel für intervallskalierte Daten. Die Differenz zwischen 10 °C und 20 °C ist dasselbe wie die Differenz zwischen 30 °C und 40 °C.

Eine Tatsache bei den Temperaturangaben in Celsius oder Fahrenheit wird Sie überraschen: 20 °C ist nicht doppelt so warm wie 10 °C. Um eine Aussage hinsichtlich der Relation (doppelt so viel wie, halb so viel wie) machen zu können, muss null bedeuten, dass vom gemessenen Attribut absolut nichts vorhanden ist. Ein Temperaturwert von 0 °C bedeutet jedoch nicht, dass keine Wärme vorhanden ist. 0 °C ist lediglich ein willkürlicher Punkt auf der Celsius-Skala.

Zum letzten Datentyp zählen verhältnisskalierte Daten. Hier ist ein sinnvoll interpretierbarer Nullpunkt vorhanden. Bei Temperaturangaben liefert die Kelvin-Skala verhältnisskalierte Daten. 100 °K ist doppelt so warm wie 50 °K. Dies liegt daran, dass der Nullpunkt der Kelvin-Skala ein absoluter Nullpunkt ist, bei dem es keine molekulare Bewegung (die Voraussetzung für Wärme) mehr gibt. Ein weiteres Beispiel ist das Lineal. 8 cm ist doppelt so lang wie 4 cm. Der Wert 0 bedeutet, dass keine Länge vorhanden ist.

Ein bisschen Wahrscheinlichkeit


Wenn Statistiker Rückschlüsse ziehen, drücken sie ihre Einschätzung der...

Dateiformat: EPUB
Kopierschutz: Adobe-DRM (Digital Rights Management)

Systemvoraussetzungen:

Computer (Windows; MacOS X; Linux): Installieren Sie bereits vor dem Download die kostenlose Software Adobe Digital Editions (siehe E-Book Hilfe).

Tablet/Smartphone (Android; iOS): Installieren Sie bereits vor dem Download die kostenlose App Adobe Digital Editions (siehe E-Book Hilfe).

E-Book-Reader: Bookeen, Kobo, Pocketbook, Sony, Tolino u.v.a.m. (nicht Kindle)

Das Dateiformat EPUB ist sehr gut für Romane und Sachbücher geeignet - also für "fließenden" Text ohne komplexes Layout. Bei E-Readern oder Smartphones passt sich der Zeilen- und Seitenumbruch automatisch den kleinen Displays an. Mit Adobe-DRM wird hier ein "harter" Kopierschutz verwendet. Wenn die notwendigen Voraussetzungen nicht vorliegen, können Sie das E-Book leider nicht öffnen. Daher müssen Sie bereits vor dem Download Ihre Lese-Hardware vorbereiten.

Weitere Informationen finden Sie in unserer E-Book Hilfe.


Download (sofort verfügbar)

23,99 €
inkl. 19% MwSt.
Download / Einzel-Lizenz
ePUB mit Adobe DRM
siehe Systemvoraussetzungen
E-Book bestellen

Unsere Web-Seiten verwenden Cookies. Mit der Nutzung dieser Web-Seiten erklären Sie sich damit einverstanden. Mehr Informationen finden Sie in unserem Datenschutzhinweis. Ok