Werde ein Data Head

Name: Werde ein Data Head | Data Science, Machine Learning und Statistik verstehen und datenintensive Jobs meistern
Brand: O'Reilly
Price: 27.9 EUR
Availability: OnlineOnly

Data Science, Machine Learning und Statistik verstehen und datenintensive Jobs meistern

Alex J. Gutman Jordan Goldmeier(Author)

O'Reilly (Publisher)

Published on 2. May 2022

268 pages

E-Book

PDF with digital watermarking

System requirements

978-3-96010-667-8 (ISBN)

€27.90incl. 7% vat

System requirements

for PDF with digital watermarking

E-Book Single Licence to 17.06.2026

Available for download

Description

More details

Other editions

Persons

Content

Intro
Inhalt
Vorwort
Einleitung
Die Data-Science-Industrie
Warum uns das Thema so wichtig ist
Die Krise auf dem US-amerikanischen Subprime- Hypothekenmarkt
Die US-Präsidentschaftswahl von 2016
Unsere Hypothese
Daten am Arbeitsplatz
Die berühmte Sitzungssaal-Szene
Sie können das große Ganze verstehen
Restaurants klassifizieren
Ja und?
Für wen dieses Buch geschrieben wurde
Warum wir dieses Buch geschrieben haben
Was Sie lernen werden
Wie dieses Buch strukturiert ist
Ein letzter Punkt, bevor es wirklich losgeht
Teil I: Denken wie ein Data Head
Kapitel 1: Was ist das Problem?
Fragen, die ein Data Head stellen sollte
Warum ist das Problem wichtig?
Wen betrifft das Problem?
Was ist, wenn wir nicht die richtigen Daten haben?
Wann ist das Projekt zu Ende?
Was tun wir, wenn uns die Ergebnisse nicht gefallen?
Verstehen, warum Datenprojekte scheitern
Szenario: Kundenwahrnehmung
Diskussion
An den wichtigen Problemen arbeiten
Zusammenfassung
Kapitel 2: Was sind Daten?
Daten oder Informationen?
Ein Beispiel-Datensatz
Datentypen
Wie Daten gesammelt und strukturiert werden
Beobachtungsbasierte versus experimentelle Daten
Strukturierte versus unstrukturierte Daten
Die Basics der zusammenfassenden Statistik
Zusammenfassung
Kapitel 3: Vorbereitungen für das statistische Denken
Stellen Sie Fragen!
In allen Dingen ist Variation
Szenario: Kundenwahrnehmung (die Fortsetzung)
Fallstudie: Nierenkrebsraten
Wahrscheinlichkeitsrechnung und Statistik
Wahrscheinlichkeit oder Intuition
Entdeckungen mit Statistiken
Zusammenfassung
Teil II: Sprechen wie ein Data Head
Kapitel 4: Daten infrage stellen
Was würden Sie tun?
Katastrophe durch fehlende Daten
Erzählen Sie mir die Herkunftsgeschichte der Daten
Wer hat die Daten gesammelt?
Wie wurden die Daten gesammelt?
Sind die Daten repräsentativ?
Gibt es eine Stichprobenverzerrung?
Wie wurde mit Ausreißern umgegangen?
Welche Daten sehe ich nicht?
Wie gehen Sie mit fehlenden Werten um?
Können die Daten abbilden, was Sie mit ihnen messen wollen?
Stellen Sie Daten infrage, egal wie groß die Datenmenge ist
Zusammenfassung
Kapitel 5: Daten erkunden
Ihre Rolle in der explorativen Datenanalyse
Wie ein Forscher denken
Leitfragen
Der Versuchsaufbau
Können die Daten Ihre Frage beantworten?
Legen Sie Erwartungen fest und benutzen Sie Ihren gesunden Menschenverstand
Ergeben die Werte intuitiv einen Sinn?
Achtung: Ausreißer und fehlende Werte
Sind Ihnen irgendwelche Beziehungen aufgefallen?
Korrelation verstehen
Achtung: Korrelation falsch interpretieren
Achtung: Korrelation bedeutet nicht Kausalität
Haben Sie in den Daten neue Einsatzmöglichkeiten oder unentdeckte Potenziale gefunden?
Zusammenfassung
Kapitel 6: Wahrscheinlichkeiten untersuchen
Raten Sie mal
Die Spielregeln
Schreibweise
Bedingte Wahrscheinlichkeit und unabhängige Ereignisse
Die Wahrscheinlichkeit mehrfacher Ereignisse
Gedankenexperiment zur Wahrscheinlichkeit
Die nächsten Schritte
Seien Sie vorsichtig bei der Annahme von Abhängigkeiten
Fallen Sie nicht auf den Spieler-Fehlschluss herein
Alle Wahrscheinlichkeiten unterliegen bestimmten Bedingungen
Vertauschen Sie Abhängigkeiten nicht
Der Satz von Bayes
Stellen Sie sicher, dass die Wahrscheinlichkeiten einen Sinn ergeben
Kalibrierung
Seltene Ereignisse können und werden eintreffen
Zusammenfassung
Kapitel 7: Hinterfragen Sie Statistiken
Kleine Einführung in die statistische Inferenz
Schaffen Sie sich etwas Spielraum
Mehr Daten, mehr Evidenz
Hinterfragen Sie den Status quo
Beweise für das Gegenteil (Evidenz)
Entscheidungsfehler ausgleichen
Die Vorgehensweise der statistischen Inferenz
Die Fragen, die Sie stellen sollten, um Statistiken zu hinterfragen
Was ist der Kontext für diese Statistik?
Wie groß ist der Stichprobenumfang?
Was testen Sie?
Wie lautet die Nullhypothese?
Wie hoch ist das Signifikanzniveau?
Wie viele Tests führen Sie durch?
Kann ich bitte die Konfidenzintervalle sehen?
Ist dies von praktischer Bedeutung?
Gehen Sie von einer Kausalität aus?
Zusammenfassung
Teil III: Den Werkzeugkasten des Data Scientist verstehen
Kapitel 8: Nach versteckten Gruppen suchen
Unüberwachtes Lernen
Dimensionsreduktion
Zusammengefasste Features erstellen
Hauptkomponentenanalyse
Beispiel: HKA für die sportliche Leistungsfähigkeit
Zusammenfassung zur HKA
Mögliche Fallen
Clustering
Clustering mit dem k-Means-Algorithmus
Beispiel: Clustering von Verkaufsfilialen
Mögliche Fallen
Zusammenfassung
Kapitel 9: Das Regressionsmodell verstehen
Überwachtes Lernen
Was macht die lineare Regression?
Kleinste-Quadrate-Regression: mehr als nur ein hübscher Name
Vorteile der linearen Regression
Auf mehrere Features erweitern
Probleme und Fallstricke der linearen Regression
Unberücksichtigte Variablen
Multikollinearität
Data Leakage
Extrapolationsfehler
Viele Beziehungen sind nicht linear
Erklärst du noch, oder machst du schon Vorhersagen?
Leistungsfähigkeit der Regression
Andere Regressionsmodelle
Zusammenfassung
Kapitel 10: Das Klassifikationsmodell verstehen
Einführung in die Klassifikation
Was Sie lernen werden
Klassifikationsproblem: Versuchsaufbau
Logistische Regression
Logistische Regression: Na und?
Entscheidungsbäume
Ensemblemethoden
Zufallswälder
Gradientenverstärkte Bäume
Interpretierbarkeit von Ensemblemethoden
Achten Sie auf Fallstricke
Falsche Anwendung des Problems
Data Leakage
Keine Aufteilung der Daten
Den richtigen Cut-off-Wert wählen
Falsch verstandene Genauigkeit
Konfusionsmatrizen
Zusammenfassung
Kapitel 11: Textanalyse verstehen
Erwartungen an die Textanalyse
Wie aus Text Zahlen werden
Ein großer Sack voll Wörter
N-Gramme
Worteinbettungen
Topic Modeling
Textklassifikation
Naive Bayes
Sentimentanalyse
Praktische Überlegungen bei der Arbeit mit Text
Die großen Technologiekonzerne haben die Oberhand
Zusammenfassung
Kapitel 12: Konzepte des Deep Learning
Neuronale Netzwerke
Worin besteht die Ähnlichkeit zwischen neuronalen Netzwerken und dem Gehirn?
Ein einfaches neuronales Netzwerk
Wie ein neuronales Netzwerk lernt
Ein etwas komplexeres neuronales Netzwerk
Anwendungen des Deep Learning
Die Vorteile des Deep Learning
Wie Computer Bilder »sehen«
Neuronale Konvolutionsnetze
Deep Learning für Sprache und Wortsequenzen
Deep Learning in der Praxis
Haben Sie Daten?
Sind Ihre Daten strukturiert?
Wie wird das Netzwerk aussehen?
Die künstliche Intelligenz und Sie
Die großen Technologiekonzerne haben die Oberhand
Ethik im Deep Learning
Zusammenfassung
Teil IV: Den Erfolg sichern
Kapitel 13: Achten Sie auf Fallstricke
Bias und seltsame Datenphänomene
Survivorship Bias
Regression zur Mitte
Das Simpson-Paradoxon
Confirmation Bias
Effort Bias
Algorithmischer Bias
Weitere Formen von Bias
Die große Liste möglicher Fallstricke
Fallstricke der Statistik und des Machine Learning
Projektbezogene Fallstricke
Zusammenfassung
Kapitel 14: Menschen und Persönlichkeiten kennen
Sieben Szenarien typischer Kommunikationspannen
Das Postmortem
Märchenstunde
Stille Post
Verzettelt
Der Realitätsabgleich
Die Übernahme
Der Angeber
Datenpersönlichkeiten
Datenenthusiasten
Datenzyniker
Data Heads
Zusammenfassung
Kapitel 15: Was kommt danach?
Danksagungen
Index

System requirements

Save as PDF Copy link into clipboard

Schweitzer Fachinformationen

Werde ein Data Head

Description

More details

Other editions

Additional editions

Persons

Content

System requirements