Schweitzer Fachinformationen
Wenn es um professionelles Wissen geht, ist Schweitzer Fachinformationen wegweisend. Kunden aus Recht und Beratung sowie Unternehmen, öffentliche Verwaltungen und Bibliotheken erhalten komplette Lösungen zum Beschaffen, Verwalten und Nutzen von digitalen und gedruckten Medien.
Einführung 31
Teil I: Eine Einführung in R 35
Kapitel 1: R - Was es macht und wie es dies macht 37
Kapitel 2: Mit Packages arbeiten, Importieren und Exportieren 65
Teil II: Daten beschreiben 79
Kapitel 3: Grafik 81
Kapitel 4: Finden Sie Ihre Mitte! 119
Kapitel 5: Weg vom Durchschnitt 129
Kapitel 6: Standards und Ränge 137
Kapitel 7: Eine Zusammenfassung des Ganzen 147
Kapitel 8: Was ist normal? 165
Teil III: Daten analysieren 183
Kapitel 9: Ein Spiel mit dem Vertrauen: Schätzung 185
Kapitel 10: Hypothesentests mit einer Stichprobe 201
Kapitel 11: Hypothesentests mit zwei Stichproben 227
Kapitel 12: Tests von mehr als zwei Stichproben 253
Kapitel 13: Kompliziertere Tests 277
Kapitel 14: Regression: Lineare und multiple und das allgemeine lineare Modell 297
Kapitel 15: Korrelation: Aufstieg und Fall von Beziehungen 331
Kapitel 16: Kurvilineare Regression: Wenn Beziehungen kompliziert werden 351
Kapitel 17: Zu gegebener Zeit 375
Kapitel 18: Nichtparametrische Statistik 387
Kapitel 19: Einführung in die Wahrscheinlichkeitsrechnung 407
Kapitel 20: Wahrscheinlichkeit trifft auf Regression: Logistische Regression 427
Teil IV: Aus Daten lernen 435
Kapitel 21: Tools und Daten für Projekte zum maschinellen Lernen 437
Kapitel 22: Entscheidungen, Entscheidungen! 463
Kapitel 23: In den Wald - per Zufall 481
Kapitel 24: Unterstützen Sie Ihren lokalen Vektor 497
Kapitel 25: k-Means-Clustering 517
Kapitel 26: Neuronale Netze 533
Kapitel 27: Datenerforschung im Marketing 549
Kapitel 28: Aus der Stadt, die niemals schläft 567
Teil V: R in der Praxis: Einige Projekte, die Sie auf Trab halten 583
Kapitel 29: Mit einem Browser arbeiten 585
Kapitel 30: Dashboards verwenden 613
Abbildungsverzeichnis 647
Stichwortverzeichnis 657
R Alles-in-einem-Band für Dummies
R bietet eine umfangreiche Palette von Funktionen, die Sie bei Ihrer Arbeit unterstützen - von einfachen Statistiken bis hin zu komplexen Analysen.
Auf dieser Schummelseite können Sie die wichtigsten Funktionen für Statistik, interaktive Anwendungen, maschinelles Lernen, Datenbanken und Bilder der Basisinstallation von R nachschlagen.
Hier finden Sie eine Auswahl an statistischen Funktionen, die in der Basisinstallation von R enthalten sind. Viele weitere nützliche Funktionen finden Sie in verschiedenen R-Packages.
Funktion
Was sie berechnet
mean(x)
Mittelwert der Zahlen im Vektor x
x
median(x)
Median der Zahlen im Vektor x
var(x)
Geschätzte Varianz der Grundgesamtheit, der die Zahlen für den Vektor x entnommen werden
sd(x)
Geschätzte Standardabweichung der Grundgesamtheit, der die Zahlen für den Vektor x entnommen werden
scale(x)
Standardwerte (z-Werte) für die Zahlen im Vektor x
sort(x)
Die Zahlen im Vektor x in aufsteigender Reihenfolge
sort(x)[n]
Die n. kleinste Zahl im Vektor x
rank(x)
Ränge der Zahlen (in aufsteigender Reihenfolge) im Vektor x
rank(-x)
Ränge der Zahlen (in absteigender Reihenfolge) im Vektor x
rank(x, ties.method= "average")
Ränge der Zahlen (in aufsteigender Reihenfolge) im Vektor x, wobei gleichrangige Zahlen den Durchschnitt der Ränge erhalten, die die Gleichrangigen erreicht hätten
rank(x, ties.method= "min")
Ränge der Zahlen (in aufsteigender Reihenfolge) im Vektor x, wobei gleichrangige Zahlen das Minimum der Ränge erhalten, die die Gleichrangigen erreicht hätten
rank(x, ties.method = "max")
Ränge der Zahlen (in aufsteigender Reihenfolge) im Vektor x, wobei gleichrangige Zahlen das Maximum der Ränge erhalten, die die Gleichrangigen erreicht hätten
quantile(x)
Das 0., 25., 50., 75. und 100. Perzentil (mit anderen Worten: die Quartile) der Zahlen im Vektor x. (Das ist kein Druckfehler: quantile(x) gibt die Quartile von x zurück.)
t.test(x,mu=n, alternative = "two.sided")
Zweiseitiger t-Test, dass der Mittelwert der Zahlen im Vektor x von n verschieden ist.
t.test(x,mu=n, alternative = "greater")
Einseitiger t-Test, dass der Mittelwert der Zahlen im Vektor x größer als n ist.
t.test(x,mu=n, alternative = "less")
Einseitiger t-Test, dass der Mittelwert der Zahlen im Vektor x kleiner als n ist.
t.test(x,y,mu=0, var.equal = TRUE, alternative = "two.sided")
Zweiseitiger t-Test, dass sich der Mittelwert der Zahlen im Vektor x vom Mittelwert der Zahlen im Vektor y unterscheidet. Die Varianzen in den beiden Vektoren werden als gleich angenommen.
y
t.test(x,y,mu=0, alternative = "two.sided", paired = TRUE)
Zweiseitiger t-Test, dass sich der Mittelwert der Zahlen in Vektor x vom Mittelwert der Zahlen in Vektor y unterscheidet. Die Vektoren stellen paarweise Stichproben dar.
aov(y~x, data = d)
Einfaktorielle ANOVA, wobei die Zahlen im Vektor y die abhängige Variable und die Elemente des Vektors x die Stufen der unabhängigen Variable darstellen. Die Daten befinden sich im Datenrahmen d.
d.
aov(y~x + Error(w/x), data = d)
ANOVA mit wiederholten Messungen, wobei die Zahlen im Vektor y die abhängige Variable und die Elemente im Vektor x die Stufen einer unabhängigen Variablen darstellen. Error(w/x) gibt an, dass jedes Element im Vektor w alle Stufen von x durchläuft. (Mit anderen Worten: x ist eine wiederholte Messung.) Die Daten befinden sich im Datenrahmen d.
Error(w/x)
w
d
aov(y~x*z, data = d)
Zweifaktorielle ANOVA, wobei die Zahlen im Vektor y die abhängige Variable und die Elemente der Vektoren x und z die Stufen der beiden unabhängigen Variablen darstellen. Die Daten befinden sich im Datenrahmen d.
z
aov(y~x*z + Error(w/z), data = d)
Gemischte ANOVA, mit den Zahlen im Vektor z als abhängige Variable und den Elementen der Vektoren x und y als die Stufen der beiden unabhängigen Variablen. Error(w/z) gibt an, dass jedes Element im Vektor w alle Niveaus von z durchläuft. (Mit anderen Worten: z ist eine wiederholte Messung.) Die Daten befinden sich im Datenrahmen d.
Error(w/z)
cor(x,y)
Korrelationskoeffizient zwischen den Zahlen im Vektor x und den Zahlen im Vektor y
cor.test(x,y)
Korrelationskoeffizient zwischen den Zahlen in Vektor x und den Zahlen in Vektor y, zusammen mit einem t-Test auf die Signifikanz des Korrelationskoeffizienten.
lm(y~x, data = d)
Lineare Regressionsanalyse mit den Zahlen im Vektor y als abhängige Variable und den Zahlen im Vektor x als unabhängige Variable. Die Daten befinden sich im Datenrahmen d.
Coefficients(a)
Steigung und Schnittpunkt des linearen Regressionsmodells a.
confint(a)
Konfidenzintervalle der Steigung und des Schnittpunkts des linearen Regressionsmodells a.
a
lm(y~x+z, data = d)
Multiple Regressionsanalyse mit den Zahlen im Vektor y als abhängige Variable und den Zahlen in den Vektoren x und z als unabhängige Variablen. Die Daten befinden sich im Datenrahmen d.
Wenn Sie eine ANOVA oder eine Regressionsanalyse durchführen, speichern Sie die Analyse...
Dateiformat: ePUBKopierschutz: Adobe-DRM (Digital Rights Management)
Systemvoraussetzungen:
Das Dateiformat ePUB ist sehr gut für Romane und Sachbücher geeignet – also für „fließenden” Text ohne komplexes Layout. Bei E-Readern oder Smartphones passt sich der Zeilen- und Seitenumbruch automatisch den kleinen Displays an. Mit Adobe-DRM wird hier ein „harter” Kopierschutz verwendet. Wenn die notwendigen Voraussetzungen nicht vorliegen, können Sie das E-Book leider nicht öffnen. Daher müssen Sie bereits vor dem Download Ihre Lese-Hardware vorbereiten.Bitte beachten Sie: Wir empfehlen Ihnen unbedingt nach Installation der Lese-Software diese mit Ihrer persönlichen Adobe-ID zu autorisieren!
Weitere Informationen finden Sie in unserer E-Book Hilfe.