Data Science mit Python für Dummies

 
 
Wiley-VCH (Verlag)
  • erschienen am 5. Mai 2016
  • |
  • 424 Seiten
 
E-Book | ePUB mit Adobe-DRM | Systemvoraussetzungen
978-3-527-80714-7 (ISBN)
 
Sie wollen sich ernsthaft mit wissenschaftlicher Datenanalyse beschäftigen und wissen, dass Sie da an Python nur schwer vorbeikommen? Dann ist dieses das richtige Buch für Sie. John Paul Mueller erklärt Ihnen, was Sie in Python beherrschen müssen, um sich der Datenanalyse zu widmen inklusive Objekten, Funktionen, Modulen und Bibliotheken. Außerdem erläutert er die wichtigsten Bibliotheken für die Datenanalyse wie NumPy, SciPy, BeautifulSoup, Pandas, und MatPlobLib. So lernen Sie Python für die Datenanalyse richtig einsetzen.
1. Auflage
  • Deutsch
  • Berlin
  • |
  • Deutschland
  • 11,85 MB
978-3-527-80714-7 (9783527807147)
weitere Ausgaben werden ermittelt
John Paul Mueller ist Journalist und wissenschaftlicher Datenanalyst. Er studierte in Santa Barbara Finanzmathematik und Statistik.
  • Intro
  • Schummelseite
  • Titelei
  • Inhaltsverzeichnis
  • Über die Autoren
  • Luca Massarons Widmung
  • John Muellers Widmung
  • Luca Massarons Danksagung
  • John Muellers Danksagung
  • Einleitung
  • Über dieses Buch
  • Törichte Annahmen
  • Im Buch verwendete Symbole
  • Über das Buch hinaus
  • Wie es weitergeht
  • Teil I Erste Schritte mit Python für Data Science
  • 1 Wie Data Science und Python zusammenpassen
  • Die Definition des geilsten Jobs des 21. Jahrhunderts
  • Die Entstehung von Data Science
  • Umriss der Kernkompetenzen eines Data Scientists
  • Die Verbindung von Data Science und Big Data
  • Das Verständnis der Rolle der Programmierung
  • Die Entwicklung einer Data-Science-Pipeline
  • Vorbereitung der Daten
  • Darstellung der beschreibenden Datenanalyse
  • Von den Daten lernen
  • Visualisierung
  • Erkenntnisse und Ergebnisse
  • Die Rolle von Python in Data Science
  • Das sich wandelnde Profil eines Data Scientists
  • Die Arbeit mit einer vielseitigen, einfachen und effizienten Sprache
  • Der schnelle Einstieg in Python
  • Daten laden
  • Ein Modell ableiten
  • Anzeige eines Ergebnisses
  • 2 Einführung in Pythons Fähigkeiten und Möglichkeiten
  • Warum Python?
  • Verständnis der Kernphilosophie Pythons
  • Gegenwärtige und zukünftige Entwicklungsziele entdecken
  • Arbeiten mit Python
  • Ein Vorgeschmack auf die Sprache
  • Die Notwendigkeit von Einrückungen verstehen
  • Arbeiten mit der Kommandozeile oder IDE
  • Schnelles Prototyping und Experimentieren
  • Die Geschwindigkeit der Ausführung
  • Die Kraft der Visualisierung
  • Das Python-Ökosystem für Data Science
  • Mit SciPy auf wissenschaftliche Werkzeuge zugreifen
  • Grundlagen des wissenschaftlichen Rechnens mit NumPy
  • Datenanalyse mit Pandas
  • Implementierung des maschinellen Lernens mit Scikit-learn
  • Plotten mit MatPlotLib
  • Syntaxanalyse von HTML-Dokumenten mit Beautiful Soup
  • 3 Einrichtung von Python für Data Science
  • Betrachtung der üblichen wissenschaftlichen Distributionen
  • Continuum Analytics Anaconda
  • Enthought Canopy Express
  • Pythonxy
  • WinPython
  • Installation von Anaconda auf Windows
  • Installation von Anaconda auf Linux
  • Installation von Anaconda auf Mac OS X
  • Download der Datensätze und des Beispielcodes
  • Die Nutzung von IPython Notebook
  • Festlegung des Code-Archivs
  • Verständnis der in diesem Buch verwendeten Datensätze
  • 4 Die Grundlagen von Python
  • Arbeiten mit Zahlen und Logik
  • Zuordnung von Variablen
  • Arithmetik
  • Vergleichen von Daten mit booleschen Ausdrücken
  • Erstellung und Nutzung von Zeichenketten
  • Interaktionen mit einer Zeitangabe
  • Erstellung und Verwendung von Funktionen
  • Entwicklung wiederverwendbarer Funktionen
  • Der Aufruf einer Funktion auf unterschiedliche Arten
  • Verwendung von bedingten und iterativen Anweisungen
  • Entscheidungsfindung mit der if-Anweisung
  • Die Wahl zwischen mehreren Optionen mit verschachtelten Entscheidungen
  • Ausführung sich wiederholender Aufgaben mit dem for-Kommando
  • Verwendung der while-Anweisung
  • Daten mit Mengen, Listen und Tupeln speichern
  • Operationen mit Mengen
  • Die Arbeit mit Listen
  • Erstellung und Verwendung von Tupeln
  • Definition nützlicher Iteratoren
  • Indizierung von Daten mit Dictionaries
  • Teil II Mit Daten arbeiten
  • 5 Arbeiten mit richtigen Daten
  • Upload, Streaming und Auswahl von Daten
  • Laden kleiner Datenmengen in den Speicher
  • Laden großer Datenmengen in den Speicher
  • Auswahl von Daten
  • Daten in strukturierter Flatfile-Form
  • Aus einer Textdatei lesen
  • Lesen des CSV-Formats
  • Lesen von Excel- oder anderen Microsoft-Dateien
  • Laden von Daten aus unstrukturierten Dateien
  • Verwaltung von Daten aus relationalen Datenbanken
  • Interaktion mit Daten einer NoSQL-Datenbank
  • Verwendung von Daten aus dem Internet
  • 6 Konditionierung der Daten
  • Zwischen NumPy und Pandas hin- und herjonglieren
  • Wann man NumPy verwendet
  • Wann man Pandas verwendet
  • Validierung der Daten
  • Herausfinden, was in Ihren Daten steckt
  • Duplikate entfernen
  • Erstellung einer Datenkarte und eines Datenplans
  • Manipulation kategorialer Variablen
  • Erstellung kategorialer Variablen
  • Umbenennen der Ebenen
  • Die Kombination von Ebenen
  • Der Umgang mit Zeitangaben in Ihren Daten
  • Formatierung von Datums- und Zeitangaben
  • Die richtige Zeittransformation
  • Umgang mit fehlenden Daten
  • Fehlende Daten finden
  • Codierung fehlender Daten
  • Einspeisung fehlender Daten
  • Schneiden und Vereinzeln: Filtern und Auswählen von Daten
  • Zeilen schneiden
  • Spalten schneiden
  • Vereinzelung
  • Verkettung und Transformation
  • Neue Fälle und Variablen hinzufügen
  • Entfernen von Daten
  • Sortieren und Mischen
  • Aggregation von Daten auf einer Ebene
  • 7 Daten in Form bringen
  • Arbeiten mit HTML-Seiten
  • Parsen von XML und HTML
  • Benutzung von XPath für die Extraktion von Daten
  • Die Arbeit mit reinem Text
  • Die Arbeit mit Unicode
  • Stemming und Entfernen von Stoppwörtern
  • Einführung in reguläre Ausdrücke
  • Verwendung des Bag-of-Words-Modells und anderer Modelle
  • Funktionsweise des Bag-of-Words-Modells
  • Arbeiten mit N-Grammen
  • Implementierung von TF-IDF Transformationen
  • Arbeiten mit Graphdaten
  • Die Adjazenzmatrix
  • Grundlagen in NetworkX
  • 8 Das, was Sie schon wissen, in die Tat umsetzen
  • Kontextualisierung von Problemen und Daten
  • Auswertung eines Data-Science-Problems
  • Erforschung von Lösungen
  • Formulierung einer Hypothese
  • Vorbereitung Ihrer Daten
  • Betrachtung der Erstellung von Merkmalen
  • Definition der Merkmalserstellung
  • Kombination von Variablen
  • Klasseneinteilung und Diskretisierung
  • Verwendung von Indikatorvariablen
  • Umwandlung von Verteilungen
  • Operationen mit Arrays
  • Vektorisierung
  • Einfache Arithmetik mit Vektoren und Matrizen
  • Matrix-Vektor-Multiplikation
  • Matrix-Multiplikation
  • Teil III Visualisierung des Unsichtbaren
  • 9 Ein Crashkurs in MatPlotLib
  • Mit einem Graphen beginnen
  • Definition eines Plots
  • Zeichnen mehrerer Linien und Plots
  • Speichern Sie Ihre Arbeit
  • Einstellen der Achsen, Intervalle und Gitternetzlinien
  • Die Achsen
  • Formatierung der Achsen
  • Hinzufügen von Gitternetzen
  • Das Erscheinungsbild von Linien festlegen
  • Die Arbeit mit Linienstilen
  • Verwendung von Farben
  • Marker hinzufügen
  • Labels, Anmerkungen und Legenden
  • Hinzufügen von Labels
  • Hinzufügen von Anmerkungen zum Diagramm
  • Erstellen einer Legende
  • 10 Visualisierung von Daten
  • Die Wahl der richtigen Grafik
  • Darstellung von Teilen eines Ganzen mit Kreisdiagrammen
  • Darstellung von Vergleichen mit Balkendiagrammen
  • Darstellung von Vergleichen mit Histogrammen
  • Darstellung von Gruppen mit Boxplots
  • Sehen von Datenmustern mit Streudigrammen
  • Erstellung erweiterter Streudiagramme
  • Darstellung von Gruppen
  • Darstellung von Korrelationen
  • Plotten von Zeitreihen
  • Abbildung der Zeit auf den Achsen
  • Plotten von Trends über einen bestimmten Zeitraum
  • Plotten geografischer Daten
  • Visualisierung mit Graphen
  • Erstellung ungerichteter Graphen
  • Erstellung gerichteter Graphen
  • 11 Die Tools verstehen
  • Arbeiten mit der IPython-Konsole
  • Arbeiten mit Bildschirmtext
  • Wechseln der Fensteranzeige
  • Die Python-Hilfe
  • Die IPython-Hilfe
  • Nutzung der magischen Funktionen
  • Objekte untersuchen
  • Das IPython Notebook
  • Arbeiten mit Formatvorlagen
  • Neustarten des Kernels
  • Wiederherstellung eines Checkpoints
  • Multimedia- und Grafikintegration
  • Einbetten von Plots und anderen Bildern
  • Laden von Beispielen aus Webseiten
  • Erhalt von Online-Grafiken und Multimedia
  • Teil IV Daten handhabbar machen
  • 12 Pythons Möglichkeiten erweitern
  • Mit Scikit-learn spielen
  • Klassen in Scikit-learn verstehen
  • Anwendungen für Data Science erkennen
  • Den Hashing-Trick durchführen
  • Hash-Funktionen nutzen
  • Hash-Tricks demonstrieren
  • Mit deterministischer Selektion arbeiten
  • Zeit und Performance berücksichtigen
  • Benchmarking mit timeit
  • Mit dem Speicher-Profiler arbeiten
  • Parallele Verarbeitung
  • Mehrkern-Verarbeitung durchführen
  • Mehrkern-Verarbeitung demonstrieren
  • 13 Datenanalyse erforschen
  • Der EDA-Ansatz
  • Beschreibende Statistik für numerische Daten
  • Lagemaße bestimmen
  • Messung von Varianz und Spannweite
  • Arbeiten mit Perzentilen
  • Normalitätsmaße
  • Zählen von kategorialen Daten
  • Häufigkeiten verstehen
  • Kontingenztafeln erstellen
  • Angewandte Visualisierung für EDA
  • Boxplots untersuchen
  • T-Test nach dem Boxplot durchführen
  • Parallele Koordinaten beobachten
  • Grafische Darstellung von Verteilungen
  • Streudiagramme zeichnen
  • Korrelation verstehen
  • Kovarianz und Korrelation nutzen
  • Nichtparametrische Korrelation nutzen
  • Chi-Quadrat für Tabellen betrachten
  • Datenverteilungen modifizieren
  • Die Normalverteilung nutzen
  • Eine Z-Score-Standardisierung erstellen
  • Andere beachtenswerte Verteilungen transformieren
  • 14 Dimensionalität verringern
  • SVD verstehen
  • Auf der Suche nach Dimensionalitätsverringerung
  • SVD nutzen, um das Unsichtbare zu messen
  • Faktor- und Hauptkomponentenanalyse durchführen
  • Das psychometrische Modell berücksichtigen
  • Nach versteckten Faktoren suchen
  • Komponenten nutzen, nicht Faktoren
  • Dimensionalitätsverringerung erreichen
  • Einige Anwendungen verstehen
  • Gesichter erkennen mit PCA
  • Themen mit NMF extrahieren
  • Filme empfehlen
  • 15 Clustering
  • Mit K-means clustern
  • K-means-Algorithmen verstehen
  • Ein Beispiel mit Bilddaten
  • Nach optimalen Lösungen suchen
  • Big Data clustern
  • Hierarchisches Clustering durchführen
  • Jenseits von runden Clustern: DBScan
  • 16 Ausreißer in Daten aufspüren
  • Das Aufspüren von Ausreißern in Betracht ziehen
  • Weitere Dinge finden, die schiefgehen können
  • Anomalien bei neuen Daten verstehen
  • Eine einfache univariate Methode untersuchen
  • Auf die Gauß-Verteilung zählen
  • Annahmen machen und überprüfen
  • Einen multivariaten Ansatz entwickeln
  • Hauptkomponentenanalyse nutzen
  • Cluster-Analyse nutzen
  • Ausreißer mit SVM automatisch erkennen
  • Teil V Aus Daten lernen
  • 17 Vier einfache und effektive Algorithmen erkunden
  • Die Zahl schätzen: Lineare Regression
  • Die Familie der linearen Modelle definieren
  • Mehr Variablen nutzen
  • Limitierungen und Probleme verstehen
  • Zur logistischen Regression wechseln
  • Logistische Regression anwenden
  • Betrachtung, wenn es mehrere Klassen sind
  • Die Dinge einfach machen - Naiver Bayes
  • Herausfinden, dass naiver Bayes nicht so naiv ist
  • Textklassifizierungen vorhersagen
  • Faul lernen mit der Nearest-Neighbors-Methode
  • Vorhersagen nach der Beobachtung von Nachbarn
  • Wählen Sie Ihren k-Parameter geschickt
  • 18 Kreuzvalidierung, Selektion und Optimierung durchführen
  • Über das Problem der Anpassung eines Modells nachdenken
  • Trend und Varianz verstehen
  • Eine Strategie zur Modellauswahl definieren
  • Zwischen Trainings- und Testsatz trennen
  • Kreuzvalidierung
  • Kreuzvalidierung auf k Teilmengen anwenden
  • Probenschichtung für komplexe Daten
  • Variablen wie ein Profi auswählen
  • Durch univariate Maße selektieren
  • Eine Greedy-Suche nutzen
  • Ihre Hyperparameter aufbessern
  • Eine Rastersuche implementieren
  • Eine Zufallssuche versuchen
  • 19 Steigerung der Komplexität mit linearen und nichtlinearen Tricks
  • Nichtlineare Transformationen nutzen
  • Variablentransformation ausüben
  • Interaktionen zwischen Variablen erstellen
  • Lineare Modelle regularisieren
  • Sich auf die Kamm-Regression (L2) verlassen
  • Das Lasso (L1) nutzen
  • Nutzung der Regularisierung
  • Elasticnet: L1 & L2 kombinieren
  • Kampf mit Big Data Stück für Stück
  • Bestimmen, ob es zu viele Daten sind
  • Implementierung des stochastischen Gradientenabstiegs
  • Support Vector Machines verstehen
  • Auf ein Berechnungsverfahren verlassen
  • Viele neue Parameter festlegen
  • Mit SVC klassifizieren
  • Nichtlinear arbeiten ist einfach
  • Regression mittels SVR ausführen
  • Stochastische Lösungen mit einer SVM erstellen
  • 20 Die Macht der Vielen verstehen
  • Mit einfachen Entscheidungsbäumen anfangen
  • Einen Entscheidungsbaum verstehen
  • Klassifikations- und Regressionsbäume erstellen
  • Maschinelles Lernen zugänglich machen
  • Mit einem Random Forest Classifier arbeiten
  • Mit einem Random-Forest-Regressor arbeiten
  • Einen Random Forest optimieren
  • Vorhersagen stärken
  • Wissen, dass viele schwache Prädiktoren gewinnen
  • Einen Gradient-Boosting-Klassifikator erstellen
  • Einen Gradient-Boosting-Regressor erstellen
  • GBM-Hyperparameter nutzen
  • Teil VI Der Top-Ten-Teil
  • 21 Zehn wichtige Data-Science-Ressourcensammlungen
  • Einblicke mit Data Science Weekly erhalten
  • Eine Ressourcenliste bei U-Climb-Higher erhalten
  • Einen guten Start mit KDnuggets
  • Auf die lange Liste von Ressourcen auf Data-Science-Central zugreifen
  • Die Fakten über Open-Source-Data-Science von Meistern erhalten
  • Gratis-Lernressourcen mit Quora aufspüren
  • Hilfe zu fortgeschrittenen Themen auf Conductrics erhalten
  • Neue Tricks vom Aspirational Data Scientist lernen
  • Data-Intelligence- und Analytics-Quellen auf AnalyticBridge finden
  • Mit Jonathan Bower die Ressourcen der Entwickler entdecken
  • 22 Zehn Datenherausforderungen, die Sie annehmen sollten
  • Der Data-Science-London + Scikit-learn-Herausforderung begegnen
  • Das Überleben auf der Titanic vorhersagen
  • Einen Kaggle-Wettbewerb finden, der Ihren Bedürfnissen entspricht
  • An Ihren Überanpassungsstrategien feilen
  • Durch den MovieLens-Datensatz gehen
  • Spam-E-Mails loswerden
  • Mit handgeschriebenen Informationen arbeiten
  • Mit Bildern arbeiten
  • Amazon.com-Reviews analysieren
  • Mit einem riesigen Graphen interagieren
  • Stichwortverzeichnis
  • End User License Agreement

Einleitung

Sie verlassen sich Tag für Tag auf wissenschaftliche Daten, um eine Fülle von Aufgaben zu meistern, oder Sie haben die Aufgabe, bestimmte Dienstleistungen für andere zu erfüllen. Tatsächlich verlassen Sie sich aber auf wissenschaftliche Daten in einer Weise, die Ihnen sicher gar nicht klar ist. Haben Sie zum Beispiel heute Morgen für eine Suche Ihre bevorzugte Suchmaschine verwendet, haben Sie Vorschläge für alternative Suchbegriffe erhalten, die auf Basis wissenschaftlicher Daten geliefert werden. Sind Sie letzte Woche zu Ihrem Arzt gegangen und hörten, dass der Knoten, den Sie bei sich fanden, kein Krebs war, ist es wahrscheinlich, dass der Arzt diese Diagnose auf Grundlage wissenschaftlicher Daten gestellt hat. Tatsächlich könnten Sie jeden Tag mit wissenschaftlichen Daten arbeiten und würden es nicht einmal bemerken. Data Science mit Python für Dummies führt Sie nicht nur in den Gebrauch wissenschaftlicher Daten ein, um eine Fülle an praktischen Aufgaben lösen zu können, sondern zeigt Ihnen auch die Vielseitigkeit der Anwendung wissenschaftlicher Daten auf. Wenn Sie wissen, wie Probleme mit wissenschaftlichen Daten zu lösen sind und wo Sie sie anwenden können, erhöhen Sie Ihre Chancen etwa auf eine Beförderung oder Ihren Traumjob signifikant.

Über dieses Buch

Das große Ziel von Data Science mit Python für Dummies ist es, wissenschaftlichen Daten den Schrecken zu nehmen, indem gezeigt wird, dass die Arbeit mit diesen Daten und Python allgemein nicht nur interessant, sondern auch durchaus machbar ist. Vielleicht denken Sie, ein Computergenie sein zu müssen, um die komplexen Aufgaben, die normalerweise mit wissenschaftlichen Daten verbunden sind, zu lösen, jedoch verfügt Python über eine Vielzahl von nützlichen Bibliotheken, die all die schwierigen Aufgaben für Sie im Hintergrund erledigen. Sie werden gar nicht bemerken, was alles vor sich geht, und Sie müssen sich auch nicht damit beschäftigen. Sie müssen lediglich wissen, dass Sie spezifische Aufgaben lösen wollen und dass dieses Ziel durch Python ganz leicht erreicht werden kann.

Einer der Schwerpunkte dieses Buches liegt auf der Verwendung der richtigen Tools. Sie beginnen mit Anaconda, einem Paket, das IPython und IPython Notebook beinhaltet - zwei Tools, die die Arbeit mit Python erleichtern. Sie experimentieren mit IPython in einer komplett interaktiven Entwicklungsumgebung. Der Code, den Sie in IPython Notebook verwenden, hat Präsentationsqualität, und Sie können ihn mit zahlreichen Präsentationselementen in Ihrem Dokument kombinieren. Es ist also weit mehr als nur eine Entwicklungsumgebung.

Sie werden in diesem Buch viele interessante Techniken kennenlernen. Beispielsweise können Sie Grafiken aller Ihrer Daten mit MatPlotLib erstellen, wofür Sie in diesem Buch alles finden, was Sie wissen müssen. Außerdem wird Ihnen in diesem Buch sehr umfassend gezeigt, welche Möglichkeiten es gibt und wie Sie diese nutzen können, um interessante Kalkulationen zu erstellen. Viele möchten gerne wissen, wie man die Handschrifterkennung realisieren kann - und wenn Sie auch dazugehören, können Sie dieses Buch nutzen, um einen Einblick darin zu erhalten.

Möglicherweise beunruhigt Sie die ganze Programmierumgebungsproblematik ein wenig, aber dieses Buch wird Sie ganz sicher nicht im Regen stehen lassen. Am Anfang finden Sie komplette Installationsanleitungen für Anaconda und ein Kurzlehrbuch (mit Referenzen) für die notwenigen Grundlagen der Python-Programmierung. Der Fokus liegt darauf, so schnell wie möglich beginnen zu können und einfache Beispiele zur Verfügung zu stellen, damit der Code keinen Stolperstein für das Lernen darstellt.

Um die Konzepte einfacher auszuführen, nutzt dieses Buch die folgenden Grundsätze:

Text, den Sie genau so eingeben sollen, wie er in diesem Buch steht, ist in Schreibmaschinenschrift gedruckt. Wenn Sie eine digitale Version dieses Buches auf einem Gerät lesen, das mit dem Internet verbunden ist, bedenken Sie, dass Sie die Webseiten anklicken können, um sie zu besuchen, beispielsweise diese hier: http://www.wiley-vch.de/dummies.

Bei kursiv geschriebenen Wörtern als Teil eines Befehls müssen Sie diesen Wert durch Ihre eigenen Daten ersetzen. Wenn Sie zum Beispiel »Geben Sie Ihren Namen ein und drücken Sie Enter« sehen, müssen Sie Ihren Namen durch Ihren eigenen Namen ersetzen.

Bedienelemente, wie Schaltflächen, Registerkarten und Menüs, stehen in KAPITÄLCHEN. Wenn Sie eine Befehlsfolge eingeben sollen, ist diese wie folgt dargestellt: DATEI|NEUE DATEI. In diesem Fall klicken Sie zuerst auf die Registerkarte DATEI und wählen dort NEUE DATEI aus. Als Ergebnis wird eine neue Datei angelegt.

Törichte Annahmen

Sie werden uns vielleicht nicht glauben, dass wir alle möglichen Annahmen über Sie getroffen haben - schließlich sind wir Ihnen noch nie begegnet! Obwohl die meisten Annahmen in der Tat töricht sind, brauchen wir sie, um einen Startpunkt für dieses Buch festzulegen. Es ist wichtig, dass Sie mit Ihrem Betriebssystem vertraut sind, denn dieses Buch bietet in dieser Hinsicht keinerlei Einführung. (Kapitel 3 stellt Installationsanweisungen für Anaconda zur Verfügung.) Um Ihnen ein Maximum an Informationen über Python und dessen Anwendbarkeit auf wissenschaftliche Daten bereitzustellen, werden in diesem Buch keine Betriebssystem-spezifischen Ausgaben diskutiert. Sie müssen wissen, wie Anwendungen installiert und verwendet werden, bevor Sie mit der Arbeit mit diesem Buch beginnen.

Dieses Buch ist kein Mathematiklehrbuch. Natürlich sehen Sie viele Beispiele komplexer Mathematik, aber der Schwerpunkt dieses Buchs liegt auf der Nutzung von Python und Data Science und nicht auf der mathematischen Theorie. Kapitel 1 und 2 vermitteln ein besseres Verständnis genau dessen, was Sie wissen müssen, damit Sie dieses Buch erfolgreich verwenden können.

Dieses Buch nimmt ebenso an, dass Sie auf Artikel im Internet zugreifen können. Es gibt durchgehend zahlreiche Verweise auf Onlinematerial, das Ihren Lernerfolg verbessern wird. Trotzdem sind diese zusätzlichen Quellen nur sinnvoll, wenn Sie sie finden und benutzen.

Im Buch verwendete Symbole

Wenn Sie dieses Buch lesen, werden Sie Symbole am Rand sehen, die auf wichtige Stellen hindeuten (oder möglicherweise auch nicht). Dieser Abschnitt beschreibt kurz jedes Symbol dieses Buches.

Tipps sind wichtig, denn sie helfen Ihnen, Zeit zu sparen oder eine Aufgabe ohne zusätzlichen Arbeitsaufwand zu lösen. Die Tipps in diesem Buch sind zeitsparende Techniken oder weisen auf Material hin, das Sie nutzen sollten, um maximal von Python profitieren zu können oder um mit Data Science verbundene Aufgaben zu bewältigen.

Wir wollen uns nicht wie zornige Eltern oder Verrückte anhören, aber Sie sollten es vermeiden, Dinge zu tun, die mit dem Warnungssymbol markiert sind. Andernfalls finden Sie vielleicht heraus, dass Ihre Anwendung nicht wie erwartet funktioniert, Sie bekommen eine falsche Ausgabe mit scheinbar sicheren Berechnungen oder Sie verlieren (im schlimmsten Fall) Daten.

Wann immer Sie dieses Symbol sehen, deutet dies auf einen Tipp oder eine Technik für Fortgeschrittene hin. Vielleicht finden Sie diese Leckerbissen nützlicher Informationen einfach langweilig, aber bedenken Sie, dass sie entscheidend sein könnten, um Ihr Programm zum Laufen zu bringen. Sie können diesen Teil überspringen, wenn Sie möchten.

Wenn Sie irgendetwas aus einem bestimmten Kapitel oder Abschnitt nicht hinbekommen, erinnern Sie sich an das Material, das mit diesem Symbol gekennzeichnet ist. Dieser Teil beinhaltet für gewöhnlich einen wichtigen Prozess oder Informationen, die Sie für die Arbeit mit Python oder für die erfolgreiche Bewältigung mit Data Science verbundener Aufgaben benötigen.

Über das Buch hinaus

Dieses Buch ist nicht das Ende unserer Arbeit mit Data Science - es ist nur der Anfang. Wir stellen Onlinematerial zur Verfügung, um dieses Buch flexibler zu gestalten und an Ihre Bedürfnisse anzupassen. Wenn wir E-Mails von Ihnen erhalten, können wir auf Fragen eingehen und Ihnen mitteilen, wie Sie entweder Python aktualisieren oder mit verknüpften Add-Ons umgehen, die den Inhalt des Buches beeinflussen. Tatsächlich haben Sie Zugang zu all diesen tollen Ergänzungen:

Onlineartikel: Auf der Seite http://www.dummies.com/extras/pythonfordatascience finden Sie - in englischer Sprache - zusätzliches Onlinematerial. Es handelt sich dabei um Ergänzungen, die nicht mehr ins Buch gepasst haben.

Vielleicht sind auch die Blog-Posts mit Antworten zu Leserfragen sowie die Demonstration nützlicher und für dieses Buch relevanter Techniken auf http://blog.johnmuellerbooks.com/ für Sie interessant.

Begleitdateien: Hey! Wer will schon den gesamten Code des Buches abtippen und die Grafiken manuell rekonstruieren? Die meisten Leser bevorzugen es, ihre Zeit mit der Arbeit mit Python zu verbringen, Aufgaben im...

Dateiformat: ePUB
Kopierschutz: Adobe-DRM (Digital Rights Management)

Systemvoraussetzungen:

Computer (Windows; MacOS X; Linux): Installieren Sie bereits vor dem Download die kostenlose Software Adobe Digital Editions (siehe E-Book Hilfe).

Tablet/Smartphone (Android; iOS): Installieren Sie bereits vor dem Download die kostenlose App Adobe Digital Editions (siehe E-Book Hilfe).

E-Book-Reader: Bookeen, Kobo, Pocketbook, Sony, Tolino u.v.a.m. (nicht Kindle)

Das Dateiformat ePUB ist sehr gut für Romane und Sachbücher geeignet - also für "fließenden" Text ohne komplexes Layout. Bei E-Readern oder Smartphones passt sich der Zeilen- und Seitenumbruch automatisch den kleinen Displays an. Mit Adobe-DRM wird hier ein "harter" Kopierschutz verwendet. Wenn die notwendigen Voraussetzungen nicht vorliegen, können Sie das E-Book leider nicht öffnen. Daher müssen Sie bereits vor dem Download Ihre Lese-Hardware vorbereiten.

Bitte beachten Sie bei der Verwendung der Lese-Software Adobe Digital Editions: wir empfehlen Ihnen unbedingt nach Installation der Lese-Software diese mit Ihrer persönlichen Adobe-ID zu autorisieren!

Weitere Informationen finden Sie in unserer E-Book Hilfe.


Download (sofort verfügbar)

23,99 €
inkl. 7% MwSt.
Download / Einzel-Lizenz
ePUB mit Adobe-DRM
siehe Systemvoraussetzungen
E-Book bestellen