Schweitzer Fachinformationen
Wenn es um professionelles Wissen geht, ist Schweitzer Fachinformationen wegweisend. Kunden aus Recht und Beratung sowie Unternehmen, öffentliche Verwaltungen und Bibliotheken erhalten komplette Lösungen zum Beschaffen, Verwalten und Nutzen von digitalen und gedruckten Medien.
Einführung 23
Über dieses Buch 23
Was Sie nicht lesen müssen 24
Törichte Annahmen über den Leser 24
Wie dieses Buch aufgebaut ist 24
Teil I: Statistik und Excel: Wie füreinander geschaffen 25
Teil II: Daten beschreiben 25
Teil III: Schlüsse aus Daten ziehen 25
Teil IV: Umgang mit der Wahrscheinlichkeit 25
Teil V: Der Top-Ten-Teil 25
Anhang A: Wenn Ihr Arbeitsblatt eine Datenbank ist 26
Anhang B: Die Kovarianzanalyse 26
Symbole, die in diesem Buch verwendet werden 26
Die Beispieldateien 27
Wie es weitergeht 27
TEIL I STATISTIK UND EXCEL: WIE FÜREINANDER GESCHAFFEN 29
Kapitel 1 Echte Daten auswerten 31
Die statistischen (und damit verwandten) Begriffe, die Sie einfach kennen müssen 31
Stichproben und Grundgesamtheiten 32
Abhängige und unabhängige Variablen 33
Arten von Daten 34
Ein bisschen Wahrscheinlichkeit 35
Inferenzstatistik: Testen von Hypothesen 36
Nullhypothese und Alternativhypothese 37
Zwei Arten von Fehlern 38
Was ist neu in Excel 2016? 39
Was ist alt in Excel 2016? 40
Die Grundlagen kennen 45
Automatisches Ausfüllen von Zellen 45
Auf Zellen verweisen 48
Kapitel 2 Grundlegendes zu den statistischen Funktionen von Excel 51
Erste Schritte 51
Machen Sie sich bereit für die Statistik 54
Tabellenblattfunktionen in Excel 2016 54
Schnell auf statistische Funktionen zugreifen 58
Arrayfunktionen 60
Was bedeutet schon ein Name? Ein Array voller Möglichkeiten 63
Eigene Arrayformeln erstellen 71
Die Datenanalysetools verwenden 73
Auf oft verwendete Funktionen zugreifen 78
TEIL II DATEN BESCHREIBEN 81
Kapitel 3 Präsentieren: Daten in Diagrammen darstellen 83
Warum Diagramme verwenden? 83
Einige grundlegende Dinge 85
Die Diagramm-Features von Excel 85
Ein Diagramm einfügen 86
So werden Sie ein Säulenheiliger 87
Säulen stapeln 91
Segmente eines Kreisdiagramms 93
Der Rat des Weisen 95
Eine Linie ziehen 95
Minidiagramme mit Sparklines 98
Balken über Balken 100
Punkt, Punkt, Komma, Strich ... 103
Ein weiterer Einsatzzweck für das Punktdiagramm 107
Die Blasen schmecken 109
Alles auf Kurs 110
An der Oberfläche kratzen 112
Im Netz gefangen 113
Eine Treemap blühen und die Sonne hervorbrechen lassen 114
Ein Histogramm erstellen 115
Säulen sortieren: Pareto 116
Kastengrafik: Kästchen und Antennen 117
3D-Karten 118
Kapitel 4 Suchen Sie Ihre Mitte 123
Mittelwert: Die Lehre vom Durchschnitt 123
Den Mittelwert berechnen 123
MITTELWERT und MITTELWERT 125
MITTELWERTWENN und MITTELWERTWENNS 127
GESTUTZTMITTEL1 30
Und schließlich noch ein paar andere Mittel 132
Mediane: Auf halber Strecke erwischt 134
Den Median ermitteln 134
MEDIAN 135
Der Modalwert136
Den Modalwert ermitteln 136
MODUS.EINF und MODUS.VIELF 136
Kapitel 5 Abweichungen vom Durchschnitt 141
Die Streuung berechnen 142
Mittelwert von quadratischen Abweichungen: Varianz, und wie sie berechnet wird 142
VAR.P und VARIANZENA 144
Varianz einer Stichprobe 146
VAR.S und VARIANZA 147
Zurück zu den Wurzeln: Standardabweichung 148
Standardabweichung einer Grundgesamtheit 148
STABW.N und STABWNA 149
Standardabweichung einer Stichprobe 150
STABW.S und STABWA 150
Die fehlenden Funktionen: STABWWENN und STABWWENNS 151
Verwandte Funktionen 155
SUMQUADABW 155
Mittlere Abweichung 155
MITTELABW 156
Kapitel 6 Standards und Wertungen kennenlernen 159
Z-Werte einfangen 159
Eigenschaften von z-Werten 160
Bonds und Ruth 160
Prüfungsergebnisse 161
STANDARDISIERUNG 162
Wo stehen Sie?165
RANG.GLEICH und RANG.MITTELW 165
KGRÖSSTE und KKLEINSTE 167
QUANTIL.INKL und QUANTIL.EXKL 167
QUANTILSRANG.INKL und QUANTILSRANG.EXKL 171
Datenanalysetool: Rang und Quantil 173
Kapitel 7 Alles zusammenfassen 177
Auszählen 177
ANZAHL, ANZAHL2, ANZAHLLEEREZELLEN, ZÄHLENWENN und ZÄHLENWENNS 177
Groß und klein 180
MAX, MAXA, MIN und MINA 180
Jetzt wird es esoterisch 182
SCHIEFE und SCHIEFE.P 182
KURT 184
Nun kommt die Häufigkeit ins Spiel 186
HÄUFIGKEIT 186
Datenanalysetool: Histogramm 188
Können Sie mir eine Beschreibung geben? 190
Datenanalysetool: Populationskenngrößen 190
Schnelle Analysen 192
Schnelle Kenngrößen 194
Kapitel 8 Was ist normal? 197
So kratzen Sie die Kurve 197
Tiefer graben 198
Parameter einer Normalverteilung 199
NORM.VERT 200
NORM.INV 202
Eine ganz besondere Verteilung 203
NORM.S.VERT 204
NORM.S.INV 205
PHI und GAUSS 205
Eine Standardnormalverteilung als Diagramm darstellen 206
TEIL III RÜCKSCHLÜSSE AUS DATEN ZIEHEN 209
Kapitel 9 Die Sache mit demVertrauen: Schätzung 211
Stichprobenverteilungen verstehen 211
Ein BESONDERS wichtiges Konzept: der zentrale Grenzwertsatz 213
(Näherungsweise) den zentralen Grenzwertsatz simulieren 215
Die Vertrauensgrenzen 219
So suchen Sie die Vertrauensgrenzen für einen Mittelwert 219
KONFIDENZ.NORM 221
Passend für ein t 222
KONFIDENZ.T 224
Kapitel 10 Ein-Stichproben-Hypothesentest 225
Hypothesen, Tests und Fehler 225
Hypothesentests und Stichprobenverteilungen 226
Noch einmal z-Werte 228
G.TEST 230
t-Test für eine Stichprobe 232
T.VERT, T.VERT.RE und T.VERT.2S 233
T.INV und T.INV.2S 234
Eine t-Verteilung visualisieren 235
Testen einer Varianz 236
CHIQU.VERT und CHIQU.VERT.RE 238
CHIQU.INV und CHIQU.INV.RE 239
Eine Chi-Quadrat-Verteilung visualisieren 241
Kapitel 11 Zwei-Stichproben-Hypothesentest 243
Hypothesen für zwei 243
Noch einmal Stichprobenverteilungen 244
Den zentralen Grenzwertsatz anwenden 245
Noch einmal z-Werte 246
Datenanalysetool: Zweistichproben-Test bei bekannten Varianzen 248
t-Test für zwei Stichproben 251
Wie ein Ei dem anderen: gleiche Varianzen 251
Wie Äpfel und Birnen: unterschiedliche Varianzen 252
T.TEST 253
Datenanalysetool: Zweistichproben t-Test: Gleicher Varianzen 254
Ein passendes Paar: Hypothesentest für abhängige Stichproben 258
T.TEST für abhängige Stichproben 259
Datenanalysetool: Zweistichproben t-Test bei abhängigen Stichproben 260
Zwei Varianzen testen 263
F zusammen mit t verwenden 265
F.TEST 265
F.VERT und F.VERT.RE 267
F.INV und F.INV.RE 268
Datenanalysetool: Zwei-Stichproben F-Test 269
Die F-Verteilung visualisieren 271
Kapitel 12 Mehr als zwei Stichproben testen 275
Mehr als zwei Stichproben testen 275
Eine harte Nuss 276
Eine Lösung 277
Wichtige Zusammenhänge 280
Nach dem F-Test 281
Datenanalysetool: Einfaktorielle Varianzanalyse 285
Mittelwerte vergleichen 286
Eine andere Art Hypothese, eine andere Art Test 289
Mit wiederholten Messungen bei der Varianzanalyse arbeiten 289
Jetzt wird es trendy 291
Datenanalysetool: Zweifaktorielle Varianzanalyse ohne Messwiederholung 295
Kapitel 13 Etwas komplexere Tests 299
Die Kombinationen knacken 299
Die Varianzen analysieren 300
Datenanalysetool: Zweifaktorielle Varianzanalyse ohne Messwiederholung 301
Noch einmal Kombinationen knacken 303
Zeilen und Spalten 303
Wechselwirkungen 304
Die Analyse 305
Datenanalysetool: Zweifaktorielle Varianzanalyse mit Messwiederholung 306
Zwei Arten von Variablen, und zwar gleichzeitig 309
Excel mit einem gemischten Design verwenden 310
Die Ergebnisse als Diagramm darstellen 315
Nach der ANOVA 317
Kapitel 14 Lineare undmultiple Regression 319
Das Streudiagramm 319
Geraden zeichnen 321
Regression: Was für eine Gerade! 322
Die Regression für Schätzungen verwenden 324
Streuung um die Regressionsgerade 324
Hypothesen über die Regression testen 326
Tabellenblattfunktionen für die Regression 331
STEIGUNG, ACHSENABSCHNITT, STFEHLERYX 332
PROGNOSE.LINEAR 334
Arrayfunktion: TREND 335
Arrayfunktion: RGP 339
Datenanalysetool: Regression 341
Ergebnis in Tabellen 342
Die grafische Ausgabe344
Irrsinnig viele Zusammenhänge auf einmal: multiple Regression 345
Excel-Tools für multiple Regression 346
Noch einmal TREND 346
Noch einmal RGP 348
Noch einmal das Datenanalysetool Regression 351
Kapitel 15 Korrelation: Aufstieg und Fall von Zusammenhängen 353
Noch einmal Streudiagramme 353
Korrelation und Regression 356
Hypothesen über Korrelationen testen 358
Ist ein Korrelationskoeffizient größer als null? 359
Unterscheiden sich zwei Korrelationskoeffizienten voneinander? 359
Tabellenblattfunktionen für die Korrelation 361
KORREL und PEARSON 361
BESTIMMTHEITSMASS 363
KOVARIANZ.P und KOVARIANZ.S 363
Datenanalysetool: Korrelation 364
Ergebnis in Tabellen 365
Datenanalysetool: Kovarianz 368
Hypothesen über Korrelationen testen 369
Tabellenblattfunktionen: FISHER, FISHERINV 369
Kapitel 16 Es wird höchste Zeit 370
Eine Zeitreihe und ihre Komponenten 371
Sanftes Gleiten 372
Den Trend als Linie darstellen 373
Datenanalysewerkzeug: Gleitender Durchschnitt 374
Exponentielles Glätten 376
Prognosen mit einem Klick 377
Kapitel 17 Parameterfreie Statistik 383
Unabhängige Stichproben 383
Zwei Stichproben: Mann-Whitney-U-Test 384
Mehr als zwei Stichproben: Kruska-Wallis einseitiger ANOVA-Test 386
Parallelstichproben 387
Zwei Stichproben :Wilcoxon-Vorzeichen-Rang-Test 387
Mehr als zwei Stichproben: zweiseitige Friedman-Varianzanalyse 389
Mehr als zwei Stichproben: Cochran-Q-Test 391
Spearmans Rangkorrelationskoeffizient 392
Ein paar Hinweise zum Schluss 394
TEIL IV WAHRSCHEINLICHKEIT 395
Kapitel 18 Einführung in die Wahrscheinlichkeit 397
Was ist Wahrscheinlichkeit? 397
Experimente, Versuche, Ereignisse und Stichprobenräume 398
Wahrscheinlichkeitsräume und Wahrscheinlichkeit 398
Zusammengesetzte Ereignisse 399
Vereinigung und Schnitt 399
Noch mehr zum Schnitt 400
Bedingte Wahrscheinlichkeit 401
Mit Wahrscheinlichkeiten arbeiten 401
Die Grundlage des Testens von Hypothesen 402
Große Wahrscheinlichkeitsräume 402
Permutationen 403
Kombinationen 404
Tabellenblattfunktionen 404
FAKULTÄT 405
VARIATIONEN und VARIATIONEN2 405
KOMBINATIONEN und KOMBINATIONEN2 406
Zufallsvariablen: diskret und stetig 407
Wahrscheinlichkeitsverteilungen und Dichtefunktionen 407
Die Binomialverteilung 409
Tabellenblattfunktionen 410
BINOM.VERT und BINOM.VERT.BEREICH 410
NEGBINOM.VERT 412
Hypothesen mit der Binomialverteilung testen 413
BINOM.INV 414
Weitere Informationen zum Testen von Hypothesen 415
Die hypergeometrische Verteilung 417
HYPGEOM.VERT 417
Kapitel 19 Mehr zur Wahrscheinlichkeit 421
Betaverteilung 421
BETA.VERT 423
BETA.INV 425
Poissonverteilung 426
POISSON.VERT 427
Gammaverteilung 429
Die Gammafunktion und GAMMA 429
Die Gammaverteilung und GAMMA.VERT 429
GAMMA.INV 432
Exponentialverteilung 432
EXPON.VERT 433
Kapitel 20 Modelle 435
Die Modellierung einer Verteilung 435
Näheres zur Poissonverteilung 436
Die Poissonverteilung visualisieren 437
Mit der Poissonverteilung arbeiten 437
Die POISSON.VERT-Funktion nochmal anwenden 438
Prüfen, ob das Modell passt 439
Ein kurzer Hinweis zu CHIQU.TEST 442
Modelle für Baseballstatistiken 443
Simulationen 446
Es darauf ankommen lassen: die Monte-Carlo-Methode 446
Den Würfel »zinken« 447
Simulation des zentralen Grenzwertsatzes 451
TEIL V DER TOP-TEN-TEIL 457
Kapitel 21 Zehn Tipps und Fallstricke bei der Arbeit mit Statistiken und Grafiken 459
Signifikant bedeutet nicht immer wichtig 459
Der Versuch, eine Nullhypothese nicht zu verwerfen, hat einige Auswirkungen 460
Regressionen sind nicht immer linear 460
Extrapolieren über die Grenzen eines Streuungsdiagramms hinaus ist eine ganz schlechte Idee 461
Untersuchen Sie die Variabilität um eine Regressionsgerade herum 461
Eine Stichprobe kann auch zu groß sein 461
Achse ist nicht gleich Achse 462
Eine kategorische Variable grafisch so darzustellen, als sei sie eine quantitative Variable, ist ganz einfach falsch 462
Wann immer möglich, sollten Sie Variabilität in Ihr Diagramm einschließen 463
Seien Sie vorsichtig, wenn Sie Konzepte aus Statistikbüchern in Excel übertragen 464
Kapitel 22 Zehn Dinge (eigentlich zwölf), die einfach nicht in die anderen Kapitel passten 465
Diagrammdarstellung des Standardfehlers des Mittelwerts 465
Wahrscheinlichkeiten und Verteilungen 469
WAHRSCHBEREICH 469
WEIBULL.VERT 470
Stichproben ziehen 471
Unabhängigkeit testen: die wahre Verwendung von CHIQU.TEST 472
Logarithmica Esoterica 475
Was ist ein Logarithmus? 475
Was ist e? 477
LOGNORM.VERT 480
LOGNORM.INV 481
Arrayfunktion: RKP 482
Arrayfunktion: VARIATION 486
Die Logs von Gamma 490
Daten sortieren 490
Anhang A Wenn Ihr Arbeitsblatt eine Datenbank ist 493
Einführung in Excel-Datenbanken 493
Die Trabanten-Datenbank 493
Der Kriterienbereich 495
Das Format einer Datenbankfunktion 496
Datensätze zählen und Auszüge aus der Datenbank 497
DBANZAHL und DBANZAHL2 498
DBAUSZUG 498
Arithmetik 499
DBMAX und DBMIN 499
DBSUMME 499
DBPRODUKT 500
Statistiken 500
DBMITTELWERT 500
DBVARIANZ und DBVARIANZEN 500
DBSTDABW und DBSTDABWN 501
Datenmasken verwenden 501
PivotTable-Berichte 502
Anhang B Die Kovarianzanalyse 509
Kovarianz unter die Lupe genommen 509
Warum Sie die Kovarianz analysieren 510
Wie Sie die Kovarianz analysieren 511
ANCOVA mit Excel 512
Methode 1: ANOVA 513
Methode 2: Regression 516
Nach der ANCOVA 519
Eins hab ich noch 520
Stichwortverzeichnis 523
Kapitel 1
In diesem Kapitel
Im Rahmen der Statistik geht es immer darum, Entscheidungen zu treffen, die auf Zahlengruppen beruhen. Statistiker stellen ständig Fragen: Was sagen uns die Zahlen? Welche Trends zeichnen sich ab? Welche Vorhersagen können wir treffen? Welche Schlüsse können wir ziehen?
Um diese Fragen zu beantworten, haben Statistiker eine beeindruckende Menge an Analysetools entwickelt. Mit diesen Tools wird den Bergen an Daten, die darauf warten, dass wir uns eingehend mit ihnen beschäftigen, eine Bedeutung zugeschrieben. Und mit diesen Tools können wir die Zahlen verstehen, die wir bei unserer Arbeit generieren.
Da intensives Rechnen häufig fester Bestandteil der Arbeit eines Statistikers ist, haben viele Leute die falsche Vorstellung, dass es bei der Statistik ausschließlich um die Verarbeitung großer Zahlenmengen geht. Das Rechnen ist jedoch nur ein kleiner Teil auf dem Weg hin zu einer vernünftigen Entscheidung.
Die Software nimmt uns diese Arbeit ab, so dass wir auf unserem Weg schneller vorankommen. Einige Software-Pakete sind auf die statistische Analyse spezialisiert und enthalten viele der Tools, die Statistiker verwenden. Excel wird zwar nicht explizit als Statistikpaket verkauft, enthält aber dennoch eine Reihe dieser Tools. Daher habe ich auch dieses Buch geschrieben.
Ich schrieb, Rechnen sei nur ein kleiner Teil auf dem Weg hin zu einer vernünftigen Entscheidung. Der wichtigste Teil sind die Konzepte, mit denen Statistiker arbeiten, und um diese geht es in diesem Kapitel in erster Linie.
An Wahlabenden sagen Fernsehkommentatoren regelmäßig noch vor Schließung der Wahllokale das Ergebnis der Wahlen voraus. Meist liegen sie richtig. Wie geht das?
Ganz einfach: Eine Stichprobe von Wählern wird nach Abgabe ihrer Stimme befragt. Unter der Voraussetzung, dass die Wähler ehrlich sagen, wen sie gewählt haben, und vorausgesetzt, die Stichprobe ist für die Grundgesamtheit (oder Population) repräsentativ, können die Analysten in den Fernsehanstalten aufgrund der Stichprobendaten Rückschlüsse auf die Grundgesamtheit der Wähler ziehen.
Das ist die Aufgabe von Statistikern: aufgrund der Ergebnisse einer Stichprobe Rückschlüsse auf die Grundgesamtheit zu ziehen, aus der die Stichprobe entnommen wurde. Manchmal erweisen sich jedoch die anhand der Zahlen gezogenen Rückschlüsse als falsch. Das falsche Ergebnis einer Wahlumfrage führte zu dem denkwürdigen Bild von US-Präsident Harry Truman mit einer Ausgabe der Chicago Daily Tribune in der Hand mit der berühmten, aber falschen Schlagzeile »Dewey Defeats Truman« (Dewey schlägt Truman) nach der Wahl 1948. Zu der Aufgabe eines Statistikers gehört es mitzuteilen, für wie realistisch er die Schlussfolgerung hält. Ein anderes Beispiel ebenfalls aus dem Bereich der Wahlforschung zeigt, dass derartige Schlussfolgerungen durchaus realistisch sein können. Das Ergebnis einer Wahlumfrage (wir gehen wieder von einer repräsentativen Stichprobe von Wählern aus) gibt an, wie viel Prozent der Wähler aus der Stichprobe die einzelnen Kandidaten favorisieren. Das Meinungsforschungsinstitut gibt an, für wie genau das Umfrageergebnis eingeschätzt wird. Wenn ein Nachrichtensprecher so etwas wie »auf 3 % genau« sagt, hören Sie eine Beurteilung der Glaubwürdigkeit.
Noch ein Beispiel. Nehmen wir einmal an, Sie haben die Aufgabe, die durchschnittliche Lesegeschwindigkeit aller Fünftklässler herauszufinden, Sie verfügen jedoch weder über die Zeit noch über die finanziellen Mittel, alle Fünftklässler zu testen. Was würden Sie tun?
Am besten nehmen Sie eine Stichprobe von Fünftklässlern, messen deren Lesegeschwindigkeit (in Wörtern pro Minute) und berechnen den Mittelwert dieser Lesegeschwindigkeit der Stichprobe. Sie können dann den Mittelwert der Stichprobe zur Schätzung des Mittelwerts der Grundgesamtheit heranziehen.
Das Schließen auf den Mittelwert einer Grundgesamtheit ist eine Art Inferenz, die Statistiker aus Stichprobendaten ziehen. Die Inferenz wird im Abschnitt »Inferenzstatistik: Testen von Hypothesen« ausführlicher beschrieben.
, s, r) für Statistiken. In Abbildung 1.1 sind die Beziehungen zwischen Grundgesamtheiten und Stichproben sowie zwischen Parametern und Statistiken dargestellt.
Abbildung 1.1: Die Beziehung zwischen Grundgesamtheiten, Stichproben, Parametern und Statistiken
Einfach ausgedrückt, ist eine Variable etwas, das mehrere Werte annehmen kann. (Etwas, das nur einen Wert annehmen kann, wird Konstante genannt.) Einige Variablen, die Sie bereits kennen, sind Tagestemperatur, Dow-Jones-Index, Ihr Alter und der Wert des Dollar in Euro.
Für Statistiker sind zwei Arten von Variablen wichtig: unabhängige Variablen und abhängige Variablen. Beide Variablen tauchen in jeder Studie und Untersuchung auf und Statistiker bewerten die Beziehung zwischen beiden.
Stellen Sie sich beispielsweise vor, es gebe eine neue Möglichkeit, Lesen so zu lehren, dass Fünftklässler schneller lesen können. Bevor diese neue Methode an Schulen eingeführt wird, soll sie getestet werden. Dazu müsste ein Forscher eine Stichprobe von Fünftklässlern nach dem Zufallsprinzip in zwei Gruppen teilen. Eine Gruppe wird nach der neuen Methode unterrichtet, die andere nach der herkömmlichen. Der Forscher misst vor und nach dem Unterricht die Lesegeschwindigkeit aller Kinder, die an dieser Studie teilnehmen. Was dann geschieht, erfahren Sie in einem der nächsten Abschnitte (»Inferenzstatistik: Testen von Hypothesen«).
Hier geht es zunächst darum, dass Sie wissen, dass die unabhängige Variable in diesem Beispiel die Unterrichtmethode ist. Die beiden möglichen Werte dieser Variablen sind Neu und Herkömmlich. Die abhängige Variable ist die Lesegeschwindigkeit.
Es gibt vier verschiedene Arten von Daten. Wenn Sie mit einer Variablen arbeiten, hängt es von der Datenart ab, wie Sie mit der Variablen arbeiten.
Die erste Art wird als nominalskalierte oder nominale Daten bezeichnet. Wenn eine Zahl eine nominale Variable ist, handelt es sich lediglich um einen Namen. Der Zahlenwert bedeutet nichts. Ein gutes Beispiel hierfür ist die Zahl auf dem Trikot eines Sportlers. Sie dient lediglich der Identifizierung des Sportlers, um ihn von den anderen Mitgliedern seines Teams unterscheiden zu können. Die Zahl ist kein Hinweis auf das Können des Sportlers.
Als Nächstes kommen die ordinalskalierten oder ordinalen Daten. Bei ordinalen Daten geht es um Ordnung. Die Zahlen erhalten eine Bedeutung, die über die bloße Identifizierung hinausgeht. Eine höhere Zahl bedeutet, dass eine Eigenschaft in einem höheren Maß vorhanden ist als bei einer niedrigeren Zahl. Ein Beispiel hierfür ist die Mohssche Härteskala. Diese Skala wird seit 1822 verwendet und gibt Werte zwischen 1 und 10 an. Mit dieser Skala geben Mineralogen den Härtegrad von Mineralen an. Diamant ist mit dem Härtegrad 10 das härteste Mineral und Talk mit dem Härtegrad 1 das weichste. Mit einem Mineral einer bestimmten Härte lässt sich jedes Mineral mit einer geringeren Härte ritzen.
Was bei der Mohsschen Skala (und allen Ordinalskalen) fehlt, ist das Konzept von gleichen Intervallen oder gleichen Differenzen. Die Differenz zwischen dem Härtegrad 10 und dem Härtegrad 8 ist nicht dieselbe wie zwischen dem Härtegrad 6 und dem Härtegrad 4.
Intervallskalierte Daten geben Differenzen an. Temperaturangaben in Celsius und Fahrenheit sind ein Beispiel für intervallskalierte Daten. Die Differenz zwischen 10 °C und 20 °C ist dasselbe wie die Differenz zwischen 30 °C und 40 °C.
Eine Tatsache bei den Temperaturangaben in Celsius oder Fahrenheit wird Sie überraschen: 20 °C ist nicht doppelt so warm wie 10 °C. Um eine Aussage hinsichtlich der Relation (doppelt so viel wie, halb so viel wie) machen zu können, muss null bedeuten, dass vom gemessenen Attribut absolut nichts vorhanden ist. Ein Temperaturwert von 0 °C bedeutet jedoch nicht, dass keine Wärme vorhanden ist. 0 °C ist lediglich ein willkürlicher Punkt auf der Celsius-Skala.
Zum letzten Datentyp zählen verhältnisskalierte Daten. Hier ist ein sinnvoll interpretierbarer Nullpunkt vorhanden. Bei Temperaturangaben liefert die Kelvin-Skala verhältnisskalierte Daten. 100 °K ist doppelt so warm wie 50 °K. Dies liegt daran, dass der Nullpunkt der Kelvin-Skala ein absoluter Nullpunkt ist, bei dem es keine molekulare Bewegung (die Voraussetzung für Wärme) mehr gibt. Ein weiteres Beispiel ist das Lineal. 8 cm ist doppelt so lang wie 4 cm. Der Wert 0 bedeutet, dass keine Länge vorhanden ist.
Wenn Statistiker Rückschlüsse ziehen, drücken sie ihre Einschätzung der...
Dateiformat: ePUBKopierschutz: Adobe-DRM (Digital Rights Management)
Systemvoraussetzungen:
Das Dateiformat ePUB ist sehr gut für Romane und Sachbücher geeignet – also für „fließenden” Text ohne komplexes Layout. Bei E-Readern oder Smartphones passt sich der Zeilen- und Seitenumbruch automatisch den kleinen Displays an. Mit Adobe-DRM wird hier ein „harter” Kopierschutz verwendet. Wenn die notwendigen Voraussetzungen nicht vorliegen, können Sie das E-Book leider nicht öffnen. Daher müssen Sie bereits vor dem Download Ihre Lese-Hardware vorbereiten.Bitte beachten Sie: Wir empfehlen Ihnen unbedingt nach Installation der Lese-Software diese mit Ihrer persönlichen Adobe-ID zu autorisieren!
Weitere Informationen finden Sie in unserer E-Book Hilfe.