
R für Data Science
Beschreibung
Alles über E-Books | Antworten auf Fragen rund um E-Books, Kopierschutz und Dateiformate finden Sie in unserem Info- & Hilfebereich.
Weitere Details
Weitere Ausgaben
Andere Ausgaben


Personen
Inhalt
- Intro
- Impressum
- Inhalt
- Modellieren
- Big Data
- Python, Julia und Konsorten
- R
- RStudio
- Das Tidyverse
- Kapitel 1: Datenvisualisierung
- Einführung
- Voraussetzungen
- Erste Schritte
- Der Dataframe penguins
- Zielsetzung
- Ein ggplot-Diagramm erstellen
- Ästhetiken und Schichten hinzufügen
- Übungen
- ggplot2-Aufrufe
- Verteilungen visualisieren
- Eine kategoriale Variable
- Eine numerische Variable
- Übungen
- Beziehungen visualisieren
- Eine numerische und eine kategoriale Variable
- Zwei kategoriale Variablen
- Zwei numerische Variablen
- Drei oder mehr Variablen
- Übungen
- Diagramme speichern
- Übungen
- Häufige Probleme
- Zusammenfassung
- Kapitel 2: Workflow: Grundlagen
- Grundlagen der Codierung
- Kommentare
- Was macht einen Namen aus?
- Funktionen aufrufen
- Übungen
- Zusammenfassung
- Kapitel 3: Datentransformation
- Einführung
- Voraussetzungen
- nycflights13
- dplyr-Grundlagen
- Zeilen
- filter()
- Häufige Fehler
- arrange()
- distinct()
- Übungen
- Spalten
- mutate()
- select()
- rename()
- relocate()
- Übungen
- Die Pipe
- Gruppen
- group_by()
- summarize()
- Die slice_-Funktionen
- Gruppieren nach mehreren Variablen
- Gruppierung aufheben
- .by
- Übungen
- Fallstudie: Aggregate und Stichprobengröße
- Zusammenfassung
- Kapitel 4: Workflow: Programmierstil
- Namen
- Leerzeichen
- Pipes
- ggplot2
- Abschnittskommentare
- Übungen
- Zusammenfassung
- Kapitel 5: Datenaufbereitung
- Einführung
- Voraussetzungen
- Aufbereitete Daten
- Übungen
- Daten länger machen
- Daten in Spaltennamen
- Wie funktioniert Pivotieren?
- Viele Variablen in Spaltennamen
- Daten und Variablennamen in den Spaltenüberschriften
- Daten breiter machen
- Wie funktioniert pivot_wider()?
- Zusammenfassung
- Kapitel 6: Workflow: Skripte und Projekte
- Skripte
- Code ausführen
- RStudio-Fehlerdiagnose
- Speichern und benennen
- Projekte
- Was ist die Quelle der Wahrheit?
- Wo ist Ihre Analyse gespeichert?
- RStudio-Projekte
- Relative und absolute Pfade
- Übungen
- Zusammenfassung
- Kapitel 7: Daten importieren
- Einführung
- Voraussetzungen
- Daten aus einer Datei lesen
- Praktischer Ratschlag
- Andere Argumente
- Andere Dateitypen
- Übungen
- Spaltentypen steuern
- Typen erraten
- Fehlende Werte, Spaltentypen und Probleme
- Spaltentypen
- Daten aus mehreren Dateien einlesen
- In eine Datei schreiben
- Dateneingabe
- Zusammenfassung
- Kapitel 8: Workflow: Hilfe abrufen
- Google ist Ihr Freund
- Ein Reprex erstellen
- Sich selbst einbringen
- Zusammenfassung
- Kapitel 9: Datenvisualisierung
- Einführung
- Voraussetzungen
- Ästhetische Zuordnungen
- Übungen
- Geometrische Objekte
- Übungen
- Facetten
- Übungen
- Statistische Transformationen
- Übungen
- Positionsanpassungen
- Übungen
- Koordinatensysteme
- Übungen
- Die geschichtete Grammatik der grafischen Darstellung
- Zusammenfassung
- Kapitel 10: Explorative Datenanalyse
- Einführung
- Voraussetzungen
- Fragen
- Variation
- Typische Werte
- Ungewöhnliche Werte
- Übungen
- Ungewöhnliche Werte
- Übungen
- Kovariation
- Eine kategoriale und eine numerische Variable
- Übungen
- Zwei kategoriale Variablen
- Übungen
- Zwei numerische Variablen
- Übungen
- Muster und Modelle
- Zusammenfassung
- Kapitel 11: Kommunikation
- Einführung
- Voraussetzungen
- Beschriftungen
- Übungen
- Anmerkungen
- Übungen
- Skalen
- Standardskalen
- Achsenteilungen und Legendenschlüssel
- Legendenlayout
- Eine Skala ersetzen
- Zoomen
- Übungen
- Themen
- Übungen
- Layout
- Übungen
- Zusammenfassung
- Kapitel 12: Logische Vektoren
- Einführung
- Voraussetzungen
- Vergleiche
- Vergleiche mit Gleitkommazahlen
- Fehlende Werte
- is.na()
- Übungen
- Boolesche Algebra
- Fehlende Werte
- Reihenfolge der Operationen
- %in%
- Übungen
- Zusammenfassungen
- Logische Zusammenfassungen
- Numerische Zusammenfassungen logischer Vektoren
- Logische Teilmengen bilden
- Übungen
- Bedingte Transformationen
- if_else()
- case_when()
- Kompatible Typen
- Übungen
- Zusammenfassung
- Kapitel 13: Zahlen
- Einführung
- Voraussetzungen
- Zahlen erzeugen
- Zähler
- Übungen
- Numerische Transformationen
- Arithmetische und Recycling-Regeln
- Minimum und Maximum
- Modulo-Arithmetik
- Logarithmen
- Runden
- Zahlen in Bereiche aufteilen
- Kumulative und gleitende Aggregate
- Übungen
- Allgemeine Transformationen
- Rangfunktionen
- Offsets
- Aufeinanderfolgende Bezeichner
- Übungen
- Numerische Zusammenfassungen
- Mittelwerte
- Minimum, Maximum und Quantile
- Streuung
- Verteilungen
- Positionen
- Zusammenfassungen mit mutate()
- Übungen
- Zusammenfassung
- Kapitel 14: Strings
- Einführung
- Voraussetzungen
- Einen String erzeugen
- Escapesequenzen
- Rohstrings
- Andere Sonderzeichen
- Übungen
- Viele Strings aus Daten erstellen
- str_c()
- str_glue()
- str_flatten()
- Übungen
- Daten aus Strings extrahieren
- Aufteilung in Zeilen
- Aufteilung in Spalten
- Verbreiterungsprobleme diagnostizieren
- Buchstaben
- Länge
- Teilstrings bilden
- Übungen
- Nicht englischer Text
- Codierung
- Buchstabenvarianten
- Gebietsschemaabhängige Funktionen
- Zusammenfassung
- Kapitel 15: Reguläre Ausdrücke
- Einführung
- Voraussetzungen
- Muster - Grundlagen
- Wichtige Funktionen
- Übereinstimmungen erkennen
- Übereinstimmungen zählen
- Werte ersetzen
- Variablen extrahieren
- Übungen
- Details zu Mustern
- Escapezeichen
- Anker
- Zeichenklassen
- Quantoren
- Operatorvorrang und Klammern
- Gruppieren und erfassen
- Übungen
- Mustersteuerung
- Regex-Flags
- Feste Übereinstimmungen
- Praxis
- Überprüfen Ihrer Arbeit
- Boolesche Operationen
- Ein Muster mit Code erstellen
- Übungen
- Reguläre Ausdrücke an anderen Stellen
- Tidyverse
- Basis-R
- Zusammenfassung
- Kapitel 16: Faktoren
- Einführung
- Voraussetzungen
- Faktoren-Basics
- General Social Survey
- Übung
- Faktorreihenfolge ändern
- Übungen
- Faktorlevels ändern
- Übungen
- Geordnete Faktoren
- Zusammenfassung
- Kapitel 17: Datum und Uhrzeit
- Einführung
- Voraussetzungen
- Datums-/Zeitwerte erzeugen
- Datums-/Zeitwerte beim Importieren
- Datums-/Zeitwerte aus Strings
- Datums-/Zeitwerte aus einzelnen Komponenten
- Datums-/Zeitwerte aus anderen Typen
- Übungen
- Datums-/Zeitkomponenten
- Komponenten abrufen
- Runden
- Komponenten modifizieren
- Übungen
- Zeiträume
- Dauern
- Perioden
- Intervalle
- Übungen
- Zeitzonen
- Zusammenfassung
- Kapitel 18: Fehlende Werte
- Einführung
- Voraussetzungen
- Explizit fehlende Werte
- Letzte Beobachtung übertragen
- Feste Werte
- NaN
- Implizit fehlende Werte
- Pivoting
- Vervollständigen
- Verknüpfungen
- Übungen
- Faktoren und leere Gruppen
- Zusammenfassung
- Kapitel 19: Verknüpfungen
- Einführung
- Voraussetzungen
- Schlüssel
- Primär- und Fremdschlüssel
- Primärschlüssel überprüfen
- Ersatzschlüssel
- Übungen
- Grundlegende Verknüpfungen
- Verändernde Verknüpfungen
- Verknüpfungsschlüssel festlegen
- Filternde Verknüpfungen
- Übungen
- Wie funktionieren Verknüpfungen?
- Zeilenübereinstimmung
- Filternde Verknüpfungen
- Nicht-Gleichheitsverknüpfungen
- Kreuzverknüpfungen
- Ungleichheitsverknüpfungen
- Rollierende Verknüpfungen
- Überlappende Verknüpfungen
- Übungen
- Zusammenfassung
- Kapitel 20: Tabellenkalkulationen
- Einführung
- Excel
- Voraussetzungen
- Erste Schritte
- Excel-Tabellenblätter lesen
- Arbeitsblätter lesen
- Ein Blatt teilweise einlesen
- Datentypen
- Schreiben in Excel
- Formatierte Ausgabe
- Übungen
- Google Sheets
- Voraussetzungen
- Erste Schritte
- Google Sheets lesen
- Schreiben in Google Sheets
- Authentifizierung
- Übungen
- Zusammenfassung
- Kapitel 21: Datenbanken
- Einführung
- Voraussetzungen
- Datenbankgrundlagen
- Mit einer Datenbank verbinden
- In diesem Buch
- Einige Daten laden
- Grundlagen von DBI
- Grundlagen von dbplyr
- SQL
- SQL-Grundlagen
- SELECT
- FROM
- GROUP BY
- WHERE
- ORDER BY
- Unterabfragen
- Verknüpfungen (Joins)
- Andere Verben
- Übungen
- Übersetzung von Funktionen
- Zusammenfassung
- Kapitel 22: Arrow
- Einführung
- Voraussetzungen
- Die Daten erhalten
- Ein Datenset öffnen
- Das Parquet-Format
- Vorteile von Parquet
- Partitionierung
- Die Daten der Seattle-Bibliothek neu schreiben
- Das Paket dplyr mit Arrow verwenden
- Performance
- Das Paket dbplyr mit Arrow verwenden
- Zusammenfassung
- Kapitel 23: Hierarchische Daten
- Einführung
- Voraussetzungen
- Listen
- Hierarchien
- Listenspalten
- Verschachtelung beseitigen
- unnest_wider()
- unnest_longer()
- Inkonsistente Typen
- Andere Funktionen
- Übungen
- Fallstudien
- Sehr breite Daten
- Relationale Daten
- Tief verschachtelt
- Übungen
- JSON
- Datentypen
- jsonlite
- Den Rectangling-Vorgang starten
- Übungen
- Zusammenfassung
- Kapitel 24: Web-Scraping
- Einführung
- Voraussetzungen
- Ethische und rechtliche Anmerkungen zum Scraping
- Nutzungsbedingungen
- Personenbezogene Daten
- Copyright
- HTML-Grundlagen
- Elemente
- Attribute
- Daten extrahieren
- Elemente finden
- Auswahlen verschachteln
- Text und Attribute
- Tabellen
- Die richtigen Selektoren finden
- Alles zusammen
- Star Wars
- Top-Filme der IMDb
- Dynamische Sites
- Zusammenfassung
- Kapitel 25: Funktionen
- Einführung
- Voraussetzungen
- Vektorfunktionen
- Eine Funktion schreiben
- Unsere Funktion verbessern
- Änderungsfunktionen
- Zusammenfassungsfunktionen
- Übungen
- Dataframe-Funktionen
- Indirektion und Tidy Evaluation
- Wann einklammern?
- Allgemeine Anwendungsfälle
- Datenmaskierung vs. Tidy Selection
- Übungen
- Diagrammfunktionen
- Mehr Variablen
- Mit anderen Tidyverse-Paketen kombinieren
- Beschriftung
- Übungen
- Stil
- Übungen
- Zusammenfassung
- Kapitel 26: Iteration
- Einführung
- Voraussetzungen
- Mehrere Spalten ändern
- Spalten mit .cols auswählen
- Eine einzelne Funktion aufrufen
- Mehrere Funktionen aufrufen
- Spaltennamen
- Filtern
- across() in Funktionen
- across() vs. pivot_longer()
- Übungen
- Mehrere Dateien lesen
- Dateien in einem Verzeichnis auflisten
- Listen
- purrr::map() und list_rbind()
- Daten im Pfad
- Ihre Arbeit speichern
- Viele einfache Iterationen
- Heterogene Daten
- Mit Fehlern umgehen
- Mehrere Ausgaben speichern
- In eine Datenbank schreiben
- CSV-Dateien schreiben
- Diagramme speichern
- Zusammenfassung
- Kapitel 27: Ein Praxisleitfaden zu Basis-R
- Einführung
- Voraussetzungen
- Mehrere Elemente mit [ auswählen
- Subsetting mit Vektoren
- Subsetting mit Dataframes
- Äquivalente dplyr-Verben
- Übungen
- Ein einzelnes Element mit $ und [[ auswählen
- Dataframes
- Tibbles
- Listen
- Übungen
- Familie der apply-Funktionen
- for-Schleifen
- Diagramme
- Zusammenfassung
- Kapitel 28: Quarto
- Einführung
- Voraussetzungen
- Quarto-Grundlagen
- Übungen
- Visueller Editor
- Übungen
- Quelltexteditor
- Übungen
- Codeblöcke
- Benennung von Codeblöcken (Chunk Label)
- Chunk-Optionen
- Globale Optionen
- Inline-Code
- Übungen
- Bilder
- Größenanpassung von Bildern
- Andere wichtige Optionen
- Übungen
- Tabellen
- Übungen
- Zwischenspeichern (Caching)
- Übungen
- Fehlersuche
- YAML-Header
- Eigenständige Dokumente
- Parameter
- Bibliografien und Zitate
- Workflow
- Zusammenfassung
- Kapitel 29: Quarto-Formate
- Einführung
- Ausgabeoptionen
- Dokumente
- Präsentationen
- Interaktivität
- htmlwidgets
- Shiny
- Websites und Bücher
- Andere Formate
- Zusammenfassung
- Index
- Über die Autorin und die Autoren
- Kolophon
Systemvoraussetzungen
Dateiformat: PDF
Kopierschutz: Wasserzeichen-DRM (Digital Rights Management)
Systemvoraussetzungen:
- Computer (Windows; MacOS X; Linux): Verwenden Sie zum Lesen die kostenlose Software Adobe Reader, Adobe Digital Editions oder einen anderen PDF-Viewer Ihrer Wahl (siehe E-Book Hilfe).
- Tablet/Smartphone (Android; iOS): Installieren Sie bereits vor dem Download die kostenlose App Adobe Digital Editions oder die App PocketBook (siehe E-Book Hilfe).
- E-Book-Reader: Bookeen, Kobo, Pocketbook, Sony, Tolino u.v.a.m.
Das Dateiformat PDF zeigt auf jeder Hardware eine Buchseite stets identisch an. Daher ist eine PDF auch für ein komplexes Layout geeignet, wie es bei Lehr- und Fachbüchern verwendet wird (Bilder, Tabellen, Spalten, Fußnoten). Bei kleinen Displays von E-Readern oder Smartphones sind PDF leider eher nervig, weil zu viel Scrollen notwendig ist. Mit Wasserzeichen-DRM wird hier ein „weicher” Kopierschutz verwendet. Daher ist technisch zwar alles möglich – sogar eine unzulässige Weitergabe. Aber an sichtbaren und unsichtbaren Stellen wird der Käufer des E-Books als Wasserzeichen hinterlegt, sodass im Falle eines Missbrauchs die Spur zurückverfolgt werden kann.
Weitere Informationen finden Sie in unserer E-Book Hilfe.