
Werde ein Data Head
Description
Alles über E-Books | Antworten auf Fragen rund um E-Books, Kopierschutz und Dateiformate finden Sie in unserem Info- & Hilfebereich.
More details
Other editions
Additional editions


Persons
Content
- Intro
- Inhalt
- Vorwort
- Einleitung
- Die Data-Science-Industrie
- Warum uns das Thema so wichtig ist
- Die Krise auf dem US-amerikanischen Subprime- Hypothekenmarkt
- Die US-Präsidentschaftswahl von 2016
- Unsere Hypothese
- Daten am Arbeitsplatz
- Die berühmte Sitzungssaal-Szene
- Sie können das große Ganze verstehen
- Restaurants klassifizieren
- Ja und?
- Für wen dieses Buch geschrieben wurde
- Warum wir dieses Buch geschrieben haben
- Was Sie lernen werden
- Wie dieses Buch strukturiert ist
- Ein letzter Punkt, bevor es wirklich losgeht
- Teil I: Denken wie ein Data Head
- Kapitel 1: Was ist das Problem?
- Fragen, die ein Data Head stellen sollte
- Warum ist das Problem wichtig?
- Wen betrifft das Problem?
- Was ist, wenn wir nicht die richtigen Daten haben?
- Wann ist das Projekt zu Ende?
- Was tun wir, wenn uns die Ergebnisse nicht gefallen?
- Verstehen, warum Datenprojekte scheitern
- Szenario: Kundenwahrnehmung
- Diskussion
- An den wichtigen Problemen arbeiten
- Zusammenfassung
- Kapitel 2: Was sind Daten?
- Daten oder Informationen?
- Ein Beispiel-Datensatz
- Datentypen
- Wie Daten gesammelt und strukturiert werden
- Beobachtungsbasierte versus experimentelle Daten
- Strukturierte versus unstrukturierte Daten
- Die Basics der zusammenfassenden Statistik
- Zusammenfassung
- Kapitel 3: Vorbereitungen für das statistische Denken
- Stellen Sie Fragen!
- In allen Dingen ist Variation
- Szenario: Kundenwahrnehmung (die Fortsetzung)
- Fallstudie: Nierenkrebsraten
- Wahrscheinlichkeitsrechnung und Statistik
- Wahrscheinlichkeit oder Intuition
- Entdeckungen mit Statistiken
- Zusammenfassung
- Teil II: Sprechen wie ein Data Head
- Kapitel 4: Daten infrage stellen
- Was würden Sie tun?
- Katastrophe durch fehlende Daten
- Erzählen Sie mir die Herkunftsgeschichte der Daten
- Wer hat die Daten gesammelt?
- Wie wurden die Daten gesammelt?
- Sind die Daten repräsentativ?
- Gibt es eine Stichprobenverzerrung?
- Wie wurde mit Ausreißern umgegangen?
- Welche Daten sehe ich nicht?
- Wie gehen Sie mit fehlenden Werten um?
- Können die Daten abbilden, was Sie mit ihnen messen wollen?
- Stellen Sie Daten infrage, egal wie groß die Datenmenge ist
- Zusammenfassung
- Kapitel 5: Daten erkunden
- Ihre Rolle in der explorativen Datenanalyse
- Wie ein Forscher denken
- Leitfragen
- Der Versuchsaufbau
- Können die Daten Ihre Frage beantworten?
- Legen Sie Erwartungen fest und benutzen Sie Ihren gesunden Menschenverstand
- Ergeben die Werte intuitiv einen Sinn?
- Achtung: Ausreißer und fehlende Werte
- Sind Ihnen irgendwelche Beziehungen aufgefallen?
- Korrelation verstehen
- Achtung: Korrelation falsch interpretieren
- Achtung: Korrelation bedeutet nicht Kausalität
- Haben Sie in den Daten neue Einsatzmöglichkeiten oder unentdeckte Potenziale gefunden?
- Zusammenfassung
- Kapitel 6: Wahrscheinlichkeiten untersuchen
- Raten Sie mal
- Die Spielregeln
- Schreibweise
- Bedingte Wahrscheinlichkeit und unabhängige Ereignisse
- Die Wahrscheinlichkeit mehrfacher Ereignisse
- Gedankenexperiment zur Wahrscheinlichkeit
- Die nächsten Schritte
- Seien Sie vorsichtig bei der Annahme von Abhängigkeiten
- Fallen Sie nicht auf den Spieler-Fehlschluss herein
- Alle Wahrscheinlichkeiten unterliegen bestimmten Bedingungen
- Vertauschen Sie Abhängigkeiten nicht
- Der Satz von Bayes
- Stellen Sie sicher, dass die Wahrscheinlichkeiten einen Sinn ergeben
- Kalibrierung
- Seltene Ereignisse können und werden eintreffen
- Zusammenfassung
- Kapitel 7: Hinterfragen Sie Statistiken
- Kleine Einführung in die statistische Inferenz
- Schaffen Sie sich etwas Spielraum
- Mehr Daten, mehr Evidenz
- Hinterfragen Sie den Status quo
- Beweise für das Gegenteil (Evidenz)
- Entscheidungsfehler ausgleichen
- Die Vorgehensweise der statistischen Inferenz
- Die Fragen, die Sie stellen sollten, um Statistiken zu hinterfragen
- Was ist der Kontext für diese Statistik?
- Wie groß ist der Stichprobenumfang?
- Was testen Sie?
- Wie lautet die Nullhypothese?
- Wie hoch ist das Signifikanzniveau?
- Wie viele Tests führen Sie durch?
- Kann ich bitte die Konfidenzintervalle sehen?
- Ist dies von praktischer Bedeutung?
- Gehen Sie von einer Kausalität aus?
- Zusammenfassung
- Teil III: Den Werkzeugkasten des Data Scientist verstehen
- Kapitel 8: Nach versteckten Gruppen suchen
- Unüberwachtes Lernen
- Dimensionsreduktion
- Zusammengefasste Features erstellen
- Hauptkomponentenanalyse
- Beispiel: HKA für die sportliche Leistungsfähigkeit
- Zusammenfassung zur HKA
- Mögliche Fallen
- Clustering
- Clustering mit dem k-Means-Algorithmus
- Beispiel: Clustering von Verkaufsfilialen
- Mögliche Fallen
- Zusammenfassung
- Kapitel 9: Das Regressionsmodell verstehen
- Überwachtes Lernen
- Was macht die lineare Regression?
- Kleinste-Quadrate-Regression: mehr als nur ein hübscher Name
- Vorteile der linearen Regression
- Auf mehrere Features erweitern
- Probleme und Fallstricke der linearen Regression
- Unberücksichtigte Variablen
- Multikollinearität
- Data Leakage
- Extrapolationsfehler
- Viele Beziehungen sind nicht linear
- Erklärst du noch, oder machst du schon Vorhersagen?
- Leistungsfähigkeit der Regression
- Andere Regressionsmodelle
- Zusammenfassung
- Kapitel 10: Das Klassifikationsmodell verstehen
- Einführung in die Klassifikation
- Was Sie lernen werden
- Klassifikationsproblem: Versuchsaufbau
- Logistische Regression
- Logistische Regression: Na und?
- Entscheidungsbäume
- Ensemblemethoden
- Zufallswälder
- Gradientenverstärkte Bäume
- Interpretierbarkeit von Ensemblemethoden
- Achten Sie auf Fallstricke
- Falsche Anwendung des Problems
- Data Leakage
- Keine Aufteilung der Daten
- Den richtigen Cut-off-Wert wählen
- Falsch verstandene Genauigkeit
- Konfusionsmatrizen
- Zusammenfassung
- Kapitel 11: Textanalyse verstehen
- Erwartungen an die Textanalyse
- Wie aus Text Zahlen werden
- Ein großer Sack voll Wörter
- N-Gramme
- Worteinbettungen
- Topic Modeling
- Textklassifikation
- Naive Bayes
- Sentimentanalyse
- Praktische Überlegungen bei der Arbeit mit Text
- Die großen Technologiekonzerne haben die Oberhand
- Zusammenfassung
- Kapitel 12: Konzepte des Deep Learning
- Neuronale Netzwerke
- Worin besteht die Ähnlichkeit zwischen neuronalen Netzwerken und dem Gehirn?
- Ein einfaches neuronales Netzwerk
- Wie ein neuronales Netzwerk lernt
- Ein etwas komplexeres neuronales Netzwerk
- Anwendungen des Deep Learning
- Die Vorteile des Deep Learning
- Wie Computer Bilder »sehen«
- Neuronale Konvolutionsnetze
- Deep Learning für Sprache und Wortsequenzen
- Deep Learning in der Praxis
- Haben Sie Daten?
- Sind Ihre Daten strukturiert?
- Wie wird das Netzwerk aussehen?
- Die künstliche Intelligenz und Sie
- Die großen Technologiekonzerne haben die Oberhand
- Ethik im Deep Learning
- Zusammenfassung
- Teil IV: Den Erfolg sichern
- Kapitel 13: Achten Sie auf Fallstricke
- Bias und seltsame Datenphänomene
- Survivorship Bias
- Regression zur Mitte
- Das Simpson-Paradoxon
- Confirmation Bias
- Effort Bias
- Algorithmischer Bias
- Weitere Formen von Bias
- Die große Liste möglicher Fallstricke
- Fallstricke der Statistik und des Machine Learning
- Projektbezogene Fallstricke
- Zusammenfassung
- Kapitel 14: Menschen und Persönlichkeiten kennen
- Sieben Szenarien typischer Kommunikationspannen
- Das Postmortem
- Märchenstunde
- Stille Post
- Verzettelt
- Der Realitätsabgleich
- Die Übernahme
- Der Angeber
- Datenpersönlichkeiten
- Datenenthusiasten
- Datenzyniker
- Data Heads
- Zusammenfassung
- Kapitel 15: Was kommt danach?
- Danksagungen
- Index
System requirements
File format: PDF
Copy protection: Watermark-DRM (Digital Rights Management)
System requirements:
- Computer (Windows; MacOS X; Linux): Use the free software Adobe Reader, Adobe Digital Editions, or any other PDF viewer of your choice (see eBook Help).
- Tablet/Smartphone (Android; iOS): Install the free app Adobe Digital Editions or another reading app for eBooks, e.g., PocketBook (see eBook Help).
- E-reader: Bookeen, Kobo, Pocketbook, Sony, Tolino and many more (only limited: Kindle).
The file format PDF always displays a book page identically on any hardware. This makes PDF suitable for complex layouts such as those used in textbooks and reference books (images, tables, columns, footnotes). Unfortunately, on the small screens of e-readers or smartphones, PDFs are rather annoying, requiring too much scrolling.
This eBook uses Watermark-DRM, a „soft” copy protection. This means that there are no technical restrictions to prevent illegal distribution. However, there is a personalised watermark embedded in the eBook that can be used to identify the purchaser of the eBook in the event of misuse and to provide evidence for legal purposes.
For more information, see our eBook Help page.