Schweitzer Fachinformationen
Wenn es um professionelles Wissen geht, ist Schweitzer Fachinformationen wegweisend. Kunden aus Recht und Beratung sowie Unternehmen, öffentliche Verwaltungen und Bibliotheken erhalten komplette Lösungen zum Beschaffen, Verwalten und Nutzen von digitalen und gedruckten Medien.
Microsoft unterhält ein Feedback-Forum für Excel auf UserVoice1, in dem jeder die Möglichkeit hat, neue Ideen einzureichen, über die andere abstimmen können. Die meistgenannte Funktionsanforderung, »Python als Excel-Skriptsprache«, hat ungefähr doppelt so viele Stimmen wie die zweithäufigste. Obwohl seit der Aufnahme der Idee im Jahr 2015 nicht wirklich etwas passiert ist, witterten Excel-Benutzer Ende 2020 Morgenluft, als Guido van Rossum, der Schöpfer von Python, twitterte (https://oreil.ly/N1_7N), dass sein »Ruhestand langweilig« sei und er zu Microsoft wechseln werde. Ob sein Wechsel einen Einfluss auf das Zusammenspiel von Excel und Python hat, weiß ich nicht. Aber ich weiß, was diese Kombination so überzeugend macht und wie Sie Excel und Python gemeinsam nutzen können - heute. Und das ist, kurz gesagt, das, worum es in diesem Buch geht.
Die treibende Kraft hinter der Geschichte von Python für Excel ist die Tatsache, dass wir in einer Welt voller Daten leben. Heutzutage sind riesige Datensätze für jeden und über alles verfügbar. Oftmals sind diese Datensätze so groß, dass sie nicht mehr in ein Tabellenblatt passen. Vor einigen Jahren hätte man dies vielleicht noch als Big Data bezeichnet, aber heutzutage ist ein Datensatz mit ein paar Millionen Zeilen wirklich nichts Besonderes mehr. Excel hat sich weiterentwickelt, um mit diesem Trend fertigzuwerden: Eingeführt wurde Power Query, um solche Datensätze zu laden und zu bereinigen, die nicht mehr in ein Tabellenblatt passen, und das Add-in Power Pivot, um Datenanalysen auf diesen Datensätzen durchzuführen und die Ergebnisse zu präsentieren. Power Query basiert auf der Formelsprache Power Query M (kurz M), während Power Pivot Formeln mithilfe von Data Analysis Expressions (DAX) definiert. Und wenn Sie einige Dinge in Ihrer Excel-Datei automatisieren möchten, verwenden Sie VBA (Visual Basic for Applications), die in Excel integrierte Automatisierungssprache. Für etwas ziemlich Einfaches haben Sie es letztlich mit VBA, M und DAX zu tun. Ein Problem dabei ist, dass Ihnen alle diese Sprachen nur in der Microsoft-Welt weiterhelfen - vor allem auf Excel und Power BI trifft dies zu. (Power BI werde ich kurz in Kapitel 1 vorstellen.)
Auf der anderen Seite ist Python eine Allzweckprogrammiersprache, die bei Analysten und Data Scientists zu einer der beliebtesten Sprache avanciert ist. Wenn Sie Python mit Excel verwenden, steht Ihnen eine Programmiersprache zur Verfügung, die für alle Aspekte der Geschichte geeignet ist, sei es, um Excel zu automatisieren, auf Datensätze zuzugreifen und sie vorzubereiten oder um Aufgaben der Datenanalyse und Visualisierung wahrzunehmen. Vor allem aber können Sie Ihre Python-Kenntnisse außerhalb von Excel wiederverwenden: Wenn Sie Ihre Rechenleistung erhöhen müssen, können Sie Ihr quantitatives Modell, Ihre Simulation oder Ihre Anwendung für maschinelles Lernen einfach in die Cloud verlagern, wo praktisch unbegrenzte Rechenressourcen auf Sie warten.
Durch meine Arbeit an xlwings, dem Excel-Automatisierungspaket, das Sie in Teil IV dieses Buchs kennenlernen werden, stehe ich in engem Kontakt mit vielen Anwendern, die Python für Excel einsetzen - sei es über den Issue Tracker (https://oreil.ly/ZJQkB) auf GitHub, aufgrund einer Frage auf StackOverflow (https://stackoverflow.com/) oder bei einer Veranstaltung wie einem Treffen oder einer Konferenz.
Regelmäßig werde ich gebeten, Quellen für die ersten Schritte mit Python zu empfehlen. Obwohl es sicherlich keinen Mangel an Python-Einführungen gibt, sind sie oft entweder zu allgemein (ohne irgendwas über Datenanalyse) oder zu spezifisch (vollständig wissenschaftlich). Excel-Benutzer befinden sich jedoch eher in der Mitte: Sie arbeiten sicherlich mit Daten, aber eine vollständige wissenschaftliche Einführung mag ihnen zu technisch erscheinen. Außerdem haben sie oftmals spezielle Anforderungen und Fragen, die in den vorhandenen Materialien nicht beantwortet werden. Einige dieser Fragen lauten:
Ich habe dieses Buch geschrieben, damit Sie ohne vorherige Python-Kenntnisse in der Lage sind, Ihre Excel-orientierten Aufgaben zu automatisieren und die Python-Tools für Datenanalyse und wissenschaftliche Berechnungen ohne Umwege in Excel zu nutzen.
Wenn Sie als fortgeschrittener Excel-Benutzer die Grenzen von Excel mit einer modernen Programmiersprache überwinden möchten, ist dieses Buch genau das richtige für Sie. Normalerweise bedeutet dies, dass Sie jeden Monat Stunden damit zubringen, große Datenmengen herunterzuladen, zu bereinigen, zu kopieren und in unternehmenskritische Tabellen einzufügen. Es gibt zweifellos verschiedene Möglichkeiten, die Grenzen von Excel zu überwinden, doch dieses Buch konzentriert sich darauf, wie Sie für diese Aufgaben Python verwenden.
Es ist hilfreich, wenn Sie ein grundlegendes Verständnis von Programmierung mitbringen, denn wenn Sie schon einmal eine Funktion oder eine for-Schleife geschrieben haben (egal in welcher Programmiersprache), verfügen Sie schon über eine Vorstellung davon, was eine ganze Zahl oder ein String ist. Von diesem Buch können Sie möglicherweise auch profitieren, wenn Sie es gewohnt sind, komplexe Zellformeln zu schreiben, oder Erfahrung darin besitzen, aufgezeichnete VBA-Makros zu optimieren. Nicht erwartet werden Python-spezifische Kenntnisse, da Sie zu allen Tools, die wir hier verwenden, und zu Python selbst Einführungen bekommen.
Ein erfahrener VBA-Entwickler findet in diesem Buch regelmäßig Vergleiche zwischen Python und VBA, mit denen es möglich ist, die üblichen Probleme zu umschiffen und sofort loszulegen.
Dieses Buch kann auch hilfreich sein, wenn Sie als Python-Entwickler die verschiedenen Möglichkeiten kennenlernen müssen, die Python hat, um mit der Excel-Anwendung und den Excel-Dateien umgehen zu können, damit Sie je nach den Anforderungen Ihrer Geschäftskunden das richtige Paket auswählen können.
In diesem Buch zeige ich Ihnen alle Aspekte der Python-für-Excel-Geschichte, gegliedert in vier Teile:
Teil I: Einführung in Python
Dieser Teil beleuchtet zunächst die Gründe dafür, dass Python ein so angenehmer Begleiter für Excel ist, und stellt dann die Tools vor, die wir in diesem Buch verwenden: die Anaconda-Python-Distribution, Visual Studio Code und Jupyter Notebooks. Außerdem erfahren Sie in diesem Teil genug über Python, um den Rest des Buchs zu meistern.
Teil II: Einführung in pandas
Bei pandas handelt es sich um die Standardbibliothek von Python für die Datenanalyse. In diesem Teil lernen Sie, wie sich Excel-Arbeitsmappen durch eine Kombination aus Jupyter Notebooks und pandas ersetzen lassen. Normalerweise ist pandas-Code sowohl einfacher zu pflegen als auch effizienter als eine Excel-Arbeitsmappe. Und Sie können mit Datensätzen arbeiten, die für ein Excel-Tabellenblatt viel zu groß sind. Im Unterschied zu Excel können Sie mit pandas Ihren Code überall dort ausführen, wo Sie wollen, auch in der Cloud.
Teil III: Excel-Dateien ohne Excel lesen und schreiben
In diesem Teil geht es um die Bearbeitung von Excel-Dateien mit einem der folgenden Python-Pakete: pandas, OpenPyXL, XlsxWriter, pyxlsb, xlrd und xlwt. Diese Pakete sind in der Lage, Excel-Arbeitsmappen direkt vom Datenträger zu lesen und darauf zu schreiben, und ersetzen somit die Excel-Anwendung: Da Sie keine Installation von Excel benötigen, funktionieren sie auf jeder Plattform, die Python unterstützt, einschließlich Windows, macOS und Linux. So wendet man ein Reader-Paket typischerweise an, um Daten aus Excel-Dateien einzulesen, die man jeden Morgen von einem externen Unternehmen oder System erhält, und diese Daten in einer Datenbank zu speichern. Ein Writer-Paket liefert zum Beispiel die Funktionalität hinter der berühmten Schaltfläche Nach Excel exportieren, die man in fast jeder Anwendung findet.
Teil IV: Die Excel-Anwendung mit xlwings programmieren
In diesem Teil erfahren Sie, wie Sie Python mit dem Paket xlwings einsetzen können, um die Excel-Anwendung zu automatisieren, anstatt Excel-Dateien vom Datenträger zu lesen und darauf zu schreiben. Demzufolge ist für diesen Teil eine lokale Installation von Excel erforderlich. Sie lernen, wie Sie Excel-Arbeitsmappen öffnen und sie vor Ihren Augen bearbeiten. Neben dem Lesen und Schreiben von Dateien via Excel erstellen Sie...
Dateiformat: ePUBKopierschutz: Wasserzeichen-DRM (Digital Rights Management)
Systemvoraussetzungen:
Das Dateiformat ePUB ist sehr gut für Romane und Sachbücher geeignet - also für „fließenden” Text ohne komplexes Layout. Bei E-Readern oder Smartphones passt sich der Zeilen- und Seitenumbruch automatisch den kleinen Displays an. Mit Wasserzeichen-DRM wird hier ein „weicher” Kopierschutz verwendet. Daher ist technisch zwar alles möglich – sogar eine unzulässige Weitergabe. Aber an sichtbaren und unsichtbaren Stellen wird der Käufer des E-Books als Wasserzeichen hinterlegt, sodass im Falle eines Missbrauchs die Spur zurückverfolgt werden kann.
Weitere Informationen finden Sie in unserer E-Book Hilfe.