R Alles-in-einem-Band für Dummies

Name: R Alles-in-einem-Band für Dummies
Brand: Wiley-VCH
Price: 29.99 EUR
Availability: OnlineOnly

Joseph Schmuller(Autor*in)

Wiley-VCH (Verlag)

1. Auflage

Erschienen am 25. Juli 2023

672 Seiten

E-Book

ePUB mit Adobe-DRM

Systemvoraussetzungen

978-3-527-84451-7 (ISBN)

29,99 €inkl. 7% MwSt.

Systemvoraussetzungen

für ePUB mit Adobe-DRM

E-Book Einzellizenz

Als Download verfügbar

Beschreibung

Weitere Details

Weitere Ausgaben

Personen

Inhalt

Einführung 31

Teil I: Eine Einführung in R 35

Kapitel 1: R - Was es macht und wie es dies macht 37

Kapitel 2: Mit Packages arbeiten, Importieren und Exportieren 65

Teil II: Daten beschreiben 79

Kapitel 3: Grafik 81

Kapitel 4: Finden Sie Ihre Mitte! 119

Kapitel 5: Weg vom Durchschnitt 129

Kapitel 6: Standards und Ränge 137

Kapitel 7: Eine Zusammenfassung des Ganzen 147

Kapitel 8: Was ist normal? 165

Teil III: Daten analysieren 183

Kapitel 9: Ein Spiel mit dem Vertrauen: Schätzung 185

Kapitel 10: Hypothesentests mit einer Stichprobe 201

Kapitel 11: Hypothesentests mit zwei Stichproben 227

Kapitel 12: Tests von mehr als zwei Stichproben 253

Kapitel 13: Kompliziertere Tests 277

Kapitel 14: Regression: Lineare und multiple und das allgemeine lineare Modell 297

Kapitel 15: Korrelation: Aufstieg und Fall von Beziehungen 331

Kapitel 16: Kurvilineare Regression: Wenn Beziehungen kompliziert werden 351

Kapitel 17: Zu gegebener Zeit 375

Kapitel 18: Nichtparametrische Statistik 387

Kapitel 19: Einführung in die Wahrscheinlichkeitsrechnung 407

Kapitel 20: Wahrscheinlichkeit trifft auf Regression: Logistische Regression 427

Teil IV: Aus Daten lernen 435

Kapitel 21: Tools und Daten für Projekte zum maschinellen Lernen 437

Kapitel 22: Entscheidungen, Entscheidungen! 463

Kapitel 23: In den Wald - per Zufall 481

Kapitel 24: Unterstützen Sie Ihren lokalen Vektor 497

Kapitel 25: k-Means-Clustering 517

Kapitel 26: Neuronale Netze 533

Kapitel 27: Datenerforschung im Marketing 549

Kapitel 28: Aus der Stadt, die niemals schläft 567

Teil V: R in der Praxis: Einige Projekte, die Sie auf Trab halten 583

Kapitel 29: Mit einem Browser arbeiten 585

Kapitel 30: Dashboards verwenden 613

Abbildungsverzeichnis 647

Stichwortverzeichnis 657

R
Alles-in-einem-Band für Dummies

Schummelseite

R bietet eine umfangreiche Palette von Funktionen, die Sie bei Ihrer Arbeit unterstützen - von einfachen Statistiken bis hin zu komplexen Analysen.

Auf dieser Schummelseite können Sie die wichtigsten Funktionen für Statistik, interaktive Anwendungen, maschinelles Lernen, Datenbanken und Bilder der Basisinstallation von R nachschlagen.

Statistische Funktionen im grundlegenden R

Hier finden Sie eine Auswahl an statistischen Funktionen, die in der Basisinstallation von R enthalten sind. Viele weitere nützliche Funktionen finden Sie in verschiedenen R-Packages.

LAGEMAßE UND VARIANZ

Funktion

Was sie berechnet

mean(x)

Mittelwert der Zahlen im Vektor x

median(x)

Median der Zahlen im Vektor x

var(x)

Geschätzte Varianz der Grundgesamtheit, der die Zahlen für den Vektor x entnommen werden

sd(x)

Geschätzte Standardabweichung der Grundgesamtheit, der die Zahlen für den Vektor x entnommen werden

scale(x)

Standardwerte (z-Werte) für die Zahlen im Vektor x

RELATIVE LAGE

Funktion

Was sie berechnet

sort(x)

Die Zahlen im Vektor x in aufsteigender Reihenfolge

sort(x)[n]

Die n. kleinste Zahl im Vektor x

rank(x)

Ränge der Zahlen (in aufsteigender Reihenfolge) im Vektor x

rank(-x)

Ränge der Zahlen (in absteigender Reihenfolge) im Vektor x

rank(x, ties.method= "average")

Ränge der Zahlen (in aufsteigender Reihenfolge) im Vektor x, wobei gleichrangige Zahlen den Durchschnitt der Ränge erhalten, die die Gleichrangigen erreicht hätten

rank(x, ties.method= "min")

Ränge der Zahlen (in aufsteigender Reihenfolge) im Vektor x, wobei gleichrangige Zahlen das Minimum der Ränge erhalten, die die Gleichrangigen erreicht hätten

rank(x, ties.method = "max")

Ränge der Zahlen (in aufsteigender Reihenfolge) im Vektor x, wobei gleichrangige Zahlen das Maximum der Ränge erhalten, die die Gleichrangigen erreicht hätten

quantile(x)

Das 0., 25., 50., 75. und 100. Perzentil (mit anderen Worten: die Quartile) der Zahlen im Vektor x. (Das ist kein Druckfehler: quantile(x) gibt die Quartile von x zurück.)

t-TESTS

Funktion

Was sie berechnet

t.test(x,mu=n, alternative = "two.sided")

Zweiseitiger t-Test, dass der Mittelwert der Zahlen im Vektor x von n verschieden ist.

t.test(x,mu=n, alternative = "greater")

Einseitiger t-Test, dass der Mittelwert der Zahlen im Vektor x größer als n ist.

t.test(x,mu=n, alternative = "less")

Einseitiger t-Test, dass der Mittelwert der Zahlen im Vektor x kleiner als n ist.

t.test(x,y,mu=0, var.equal = TRUE, alternative = "two.sided")

Zweiseitiger t-Test, dass sich der Mittelwert der Zahlen im Vektor x vom Mittelwert der Zahlen im Vektor y unterscheidet. Die Varianzen in den beiden Vektoren werden als gleich angenommen.

t.test(x,y,mu=0, alternative = "two.sided", paired = TRUE)

Zweiseitiger t-Test, dass sich der Mittelwert der Zahlen in Vektor x vom Mittelwert der Zahlen in Vektor y unterscheidet. Die Vektoren stellen paarweise Stichproben dar.

ANALYSE DER VARIANZ (ANOVA)

Funktion

Was sie berechnet

aov(y~x, data = d)

Einfaktorielle ANOVA, wobei die Zahlen im Vektor y die abhängige Variable und die Elemente des Vektors x die Stufen der unabhängigen Variable darstellen. Die Daten befinden sich im Datenrahmen d.

aov(y~x + Error(w/x), data = d)

ANOVA mit wiederholten Messungen, wobei die Zahlen im Vektor y die abhängige Variable und die Elemente im Vektor x die Stufen einer unabhängigen Variablen darstellen. Error(w/x) gibt an, dass jedes Element im Vektor w alle Stufen von x durchläuft. (Mit anderen Worten: x ist eine wiederholte Messung.) Die Daten befinden sich im Datenrahmen d.

aov(y~x*z, data = d)

Zweifaktorielle ANOVA, wobei die Zahlen im Vektor y die abhängige Variable und die Elemente der Vektoren x und z die Stufen der beiden unabhängigen Variablen darstellen. Die Daten befinden sich im Datenrahmen d.

aov(y~x*z + Error(w/z), data = d)

Gemischte ANOVA, mit den Zahlen im Vektor z als abhängige Variable und den Elementen der Vektoren x und y als die Stufen der beiden unabhängigen Variablen. Error(w/z) gibt an, dass jedes Element im Vektor w alle Niveaus von z durchläuft. (Mit anderen Worten: z ist eine wiederholte Messung.) Die Daten befinden sich im Datenrahmen d.

KORRELATION UND REGRESSION

Funktion

Was sie berechnet

cor(x,y)

Korrelationskoeffizient zwischen den Zahlen im Vektor x und den Zahlen im Vektor y

cor.test(x,y)

Korrelationskoeffizient zwischen den Zahlen in Vektor x und den Zahlen in Vektor y, zusammen mit einem t-Test auf die Signifikanz des Korrelationskoeffizienten.

lm(y~x, data = d)

Lineare Regressionsanalyse mit den Zahlen im Vektor y als abhängige Variable und den Zahlen im Vektor x als unabhängige Variable. Die Daten befinden sich im Datenrahmen d.

Coefficients(a)

Steigung und Schnittpunkt des linearen Regressionsmodells a.

confint(a)

Konfidenzintervalle der Steigung und des Schnittpunkts des linearen Regressionsmodells a.

lm(y~x+z, data = d)

Multiple Regressionsanalyse mit den Zahlen im Vektor y als abhängige Variable und den Zahlen in den Vektoren x und z als unabhängige Variablen. Die Daten befinden sich im Datenrahmen d.

Wenn Sie eine ANOVA oder eine Regressionsanalyse durchführen, speichern Sie die Analyse...

Systemvoraussetzungen

Als PDF speichern Als Link merken