Dieser Artikel wurde im November 2019 von Benedikt Droste veröffentlicht. "[Steigern Sie Ihre Effizienz und verarbeiten Sie Excel-Dateien mit Python](https :: //towardsdatascience.com/boost-your-efficiency-and-process-excel-files-with-python-cae650c85d6c) ”ist eine japanische Übersetzung. Dieser Artikel wurde mit Genehmigung des ursprünglichen Autors veröffentlicht.
Beim Umgang mit Daten kommen Sie unweigerlich mit Excel in Kontakt. Auch wenn Sie es nicht für sich selbst verwenden, werden Ihre Kunden und Kollegen es brauchen. Excel eignet sich gut für tabellarische Berechnungen mit kleinen Datensätzen.
Aber ich beklagte mich immer, wenn ich eine Excel-Tabelle mit Zehntausenden von Zeilen und Hunderten von Spalten sah. Diese Blätter sind schwer und neigen bei Berechnungen zum Absturz.
Deshalb habe ich mich für Python entschieden, um eine so große Excel-Datei zu verarbeiten. Es hat auch den großen Vorteil, wiederverwendbaren Code schreiben und Dokumentation bereitstellen zu können. Lass uns anfangen!
Die Datei, die ich dieses Mal verarbeiten möchte, enthält ungefähr 1 Million Zeilen und 16 Spalten.
Python bietet eine Funktion "read_excel ()" zum Lesen einer Excel-Datei als DataFrame-Objekt.
import pandas as pd
import numpy as np
df = pd.read_excel(...\\Excel-Tutorial.xlsx')
** Die Pandas-Bibliothek ist nicht in Python enthalten und muss mit pip usw. installiert werden. ** ** **
Wie Sie sehen können, sehen die Daten ziemlich gut aus, aber die Spaltenüberschriften scheinen falsch zu sein. Viele Excel-Karten enthalten Überschriften und andere Informationen. Lassen Sie uns diesen Teil überspringen und die Zeile definieren, die die Überschrift sein wird.
df = pd.read_excel('…\\Excel-Tutorial.xlsx', header=[1]).reset_index()
Das Argument header = [1] gibt an, dass die zweite Zeile der Excel-Tabelle als Header verwendet werden soll. Alle vorherigen Zeilen werden ignoriert.
Eine häufige Frage in der Marketingabteilung ist der Jahresumsatz in jedem Land.
Diese Berechnung wurde in 86ms abgeschlossen. Einer der großen Vorteile der Arbeit mit Excel-Dateien in Python besteht darin, dass alle Arten von Berechnungen viel schneller als in Excel selbst verarbeitet werden können. Je komplexer der Prozess ist, desto größer ist der Geschwindigkeitsvorteil.
Möglicherweise benötigen Sie auch nationale Daten, die nach Jahr und Kategorie gruppiert sind, als Anfrage für die Verkaufsabteilung. Die Berechnungsergebnisse müssen in separaten Arbeitsblättern gespeichert werden, um die Marktdaten der Länder auszugeben.
Der nächste Schritt besteht darin, die Datei erneut als Excel-Datei zu speichern und Ihren Vertriebs- und Marketingabteilungen zur Verfügung zu stellen. Erstellen Sie ein pd.ExcelWriter-Objekt und erstellen Sie für jedes ein anderes Arbeitsblatt.
Es ist einfach? Werfen wir einen Blick auf die neu erstellte Arbeitsmappe.
Wie Sie sehen können, wird der DataFrame korrekt im angegebenen Arbeitsblatt gespeichert. Ich habe diese großartige Leistung an beide Abteilungen gesendet und am nächsten Tag eine E-Mail erhalten. Ich wurde um Formatierung und Visualisierung gebeten. Da solche Daten jeden Monat konvertiert werden müssen, habe ich beschlossen, die Aufgabe auch in Python auszuführen.
Sie müssen das Writer-Objekt für die Formatierung und Visualisierung neu erstellen.
Wie Sie sehen können, ist der Anfang des Codes der gleiche wie im ersten Beispiel, in dem ein Writer-Objekt erstellt wird. Sie können "xlsxwriter" verwenden, um auf Excel-Funktionen wie Grafiken und Formate zuzugreifen. Um auf diese Funktionen zugreifen zu können, benötigen Sie ein Arbeitsmappenobjekt mit "workbook = writer.book" und ein Arbeitsblattobjekt mit "worksheet = writer.sheet ['Sales_Sums']". In diesem Beispiel nehmen wir Änderungen am ersten Blatt vor. Fügen Sie ein Diagramm hinzu, geben Sie den Datenbereich an (= Sales_Sums! $ B $ 2: $ B $ 7'
) und fügen Sie ihn der Zelle A9 des Arbeitsblatts hinzu.
Formatieren Sie Ihre Verkaufsdaten auf die gleiche Weise. Fügen Sie dem Bereich "B2: B7" eine 3-Farben-Skala hinzu, um die niedrigen und hohen Werte visuell hervorzuheben. Passen Sie die Breite der Arbeitsblätter in der ersten und zweiten Spalte mit worksheet.set_column (0,1,30)
an. Außerdem wird der Spaltenkopf für Verkaufsdaten formatiert und in "Verkaufsdaten für 2019" umbenannt. Und schließlich speichern Sie die Datei.
Die Ergebnisse sind viel besser und haben erhebliche Vorteile gegenüber Excel. Und im nächsten Monat können Sie mit nur einem Klick genau dasselbe erstellen.
Python kann sehr gut mit Excel-Dateien umgehen. Mit Python können Sie problemlos große Dateien verarbeiten, wiederverwendbaren Code schreiben und Ihren Kollegen sogar Dokumentation zur Verfügung stellen. Wir haben auch bestätigt, dass wir problemlos auf die erweiterten Funktionen von Python zugreifen können. Sie können den Berichtsprozess auch selbst vollständig automatisieren.
Original Author: Benedikt Droste Thank you for letting us share your knowledge!
Dieser Artikel wurde in Zusammenarbeit mit folgenden Personen veröffentlicht. Danke nochmal. Selektor: Yumika Tomita Übersetzer: @ siho1 Auditor: @nyorochan Herausgeber: @aoharu
In Zusammenarbeit mit mehreren hervorragenden Ingenieuren übersetzen wir hochwertige Artikel aus Übersee ins Japanische und veröffentlichen die Artikel. Bitte kontaktieren Sie uns, wenn Sie mit unseren Aktivitäten einverstanden sind oder wenn Sie daran interessiert sind, qualitativ hochwertige Artikel an viele Menschen zu verbreiten. Bitte senden Sie eine Nachricht mit dem Titel "Wunsch zur Teilnahme" in [Mail](mailto: [email protected]) oder senden Sie eine Nachricht in Twitter. Zum Beispiel können wir die Teile vorstellen, die Ihnen nach der Auswahl helfen können.
Wie war dieser Artikel? ・ Ich wünschte, ich hätte das getan, ich möchte, dass du mehr tust, ich denke, es wäre besser ・ Diese Art von Ort war gut Wir suchen offene Meinungen wie. Bitte zögern Sie nicht, Ihre Kommentare im Kommentarbereich zu veröffentlichen, da wir Ihr Feedback verwenden werden, um die Qualität zukünftiger Artikel zu verbessern. Wir freuen uns auch über Ihre Kommentare auf Twitter. Wir freuen uns auf Ihre Nachricht.
Recommended Posts