Verarbeiten Sie große Excel-Dateien mit Python, um die Produktivität zu verbessern

Dieser Artikel wurde im November 2019 von Benedikt Droste veröffentlicht. "[Steigern Sie Ihre Effizienz und verarbeiten Sie Excel-Dateien mit Python](https :: //towardsdatascience.com/boost-your-efficiency-and-process-excel-files-with-python-cae650c85d6c) ”ist eine japanische Übersetzung. Dieser Artikel wurde mit Genehmigung des ursprünglichen Autors veröffentlicht.

Beim Umgang mit Daten kommen Sie unweigerlich mit Excel in Kontakt. Auch wenn Sie es nicht für sich selbst verwenden, werden Ihre Kunden und Kollegen es brauchen. Excel eignet sich gut für tabellarische Berechnungen mit kleinen Datensätzen.

Aber ich beklagte mich immer, wenn ich eine Excel-Tabelle mit Zehntausenden von Zeilen und Hunderten von Spalten sah. Diese Blätter sind schwer und neigen bei Berechnungen zum Absturz.

Deshalb habe ich mich für Python entschieden, um eine so große Excel-Datei zu verarbeiten. Es hat auch den großen Vorteil, wiederverwendbaren Code schreiben und Dokumentation bereitstellen zu können. Lass uns anfangen!

Lesen Sie die Excel-Datei mit Python

Die Datei, die ich dieses Mal verarbeiten möchte, enthält ungefähr 1 Million Zeilen und 16 Spalten.

Python bietet eine Funktion "read_excel ()" zum Lesen einer Excel-Datei als DataFrame-Objekt.

import pandas as pd
import numpy as np
df = pd.read_excel(...\\Excel-Tutorial.xlsx')

** Die Pandas-Bibliothek ist nicht in Python enthalten und muss mit pip usw. installiert werden. ** ** **

Wie Sie sehen können, sehen die Daten ziemlich gut aus, aber die Spaltenüberschriften scheinen falsch zu sein. Viele Excel-Karten enthalten Überschriften und andere Informationen. Lassen Sie uns diesen Teil überspringen und die Zeile definieren, die die Überschrift sein wird.

df = pd.read_excel('…\\Excel-Tutorial.xlsx', header=[1]).reset_index()

Das Argument header = [1] gibt an, dass die zweite Zeile der Excel-Tabelle als Header verwendet werden soll. Alle vorherigen Zeilen werden ignoriert.

Führen Sie Berechnungen mit Pandas durch

Eine häufige Frage in der Marketingabteilung ist der Jahresumsatz in jedem Land.

Diese Berechnung wurde in 86ms abgeschlossen. Einer der großen Vorteile der Arbeit mit Excel-Dateien in Python besteht darin, dass alle Arten von Berechnungen viel schneller als in Excel selbst verarbeitet werden können. Je komplexer der Prozess ist, desto größer ist der Geschwindigkeitsvorteil.

Möglicherweise benötigen Sie auch nationale Daten, die nach Jahr und Kategorie gruppiert sind, als Anfrage für die Verkaufsabteilung. Die Berechnungsergebnisse müssen in separaten Arbeitsblättern gespeichert werden, um die Marktdaten der Länder auszugeben.

Speichern Sie das Ergebnis als Excel

Der nächste Schritt besteht darin, die Datei erneut als Excel-Datei zu speichern und Ihren Vertriebs- und Marketingabteilungen zur Verfügung zu stellen. Erstellen Sie ein pd.ExcelWriter-Objekt und erstellen Sie für jedes ein anderes Arbeitsblatt.

Es ist einfach? Werfen wir einen Blick auf die neu erstellte Arbeitsmappe.

Wie Sie sehen können, wird der DataFrame korrekt im angegebenen Arbeitsblatt gespeichert. Ich habe diese großartige Leistung an beide Abteilungen gesendet und am nächsten Tag eine E-Mail erhalten. Ich wurde um Formatierung und Visualisierung gebeten. Da solche Daten jeden Monat konvertiert werden müssen, habe ich beschlossen, die Aufgabe auch in Python auszuführen.

Formatierung und Visualisierung

Sie müssen das Writer-Objekt für die Formatierung und Visualisierung neu erstellen.

Wie Sie sehen können, ist der Anfang des Codes der gleiche wie im ersten Beispiel, in dem ein Writer-Objekt erstellt wird. Sie können "xlsxwriter" verwenden, um auf Excel-Funktionen wie Grafiken und Formate zuzugreifen. Um auf diese Funktionen zugreifen zu können, benötigen Sie ein Arbeitsmappenobjekt mit "workbook = writer.book" und ein Arbeitsblattobjekt mit "worksheet = writer.sheet ['Sales_Sums']". In diesem Beispiel nehmen wir Änderungen am ersten Blatt vor. Fügen Sie ein Diagramm hinzu, geben Sie den Datenbereich an (= Sales_Sums! $ B $ 2: $ B $ 7') und fügen Sie ihn der Zelle A9 des Arbeitsblatts hinzu.

Formatieren Sie Ihre Verkaufsdaten auf die gleiche Weise. Fügen Sie dem Bereich "B2: B7" eine 3-Farben-Skala hinzu, um die niedrigen und hohen Werte visuell hervorzuheben. Passen Sie die Breite der Arbeitsblätter in der ersten und zweiten Spalte mit worksheet.set_column (0,1,30) an. Außerdem wird der Spaltenkopf für Verkaufsdaten formatiert und in "Verkaufsdaten für 2019" umbenannt. Und schließlich speichern Sie die Datei.

Die Ergebnisse sind viel besser und haben erhebliche Vorteile gegenüber Excel. Und im nächsten Monat können Sie mit nur einem Klick genau dasselbe erstellen.

Zusammenfassung

Python kann sehr gut mit Excel-Dateien umgehen. Mit Python können Sie problemlos große Dateien verarbeiten, wiederverwendbaren Code schreiben und Ihren Kollegen sogar Dokumentation zur Verfügung stellen. Wir haben auch bestätigt, dass wir problemlos auf die erweiterten Funktionen von Python zugreifen können. Sie können den Berichtsprozess auch selbst vollständig automatisieren.

Übersetzungskooperation

Original Author: Benedikt Droste Thank you for letting us share your knowledge!

Dieser Artikel wurde in Zusammenarbeit mit folgenden Personen veröffentlicht. Danke nochmal. Selektor: Yumika Tomita Übersetzer: @ siho1 Auditor: @nyorochan Herausgeber: @aoharu

Möchten Sie mit uns einen Artikel schreiben?

In Zusammenarbeit mit mehreren hervorragenden Ingenieuren übersetzen wir hochwertige Artikel aus Übersee ins Japanische und veröffentlichen die Artikel. Bitte kontaktieren Sie uns, wenn Sie mit unseren Aktivitäten einverstanden sind oder wenn Sie daran interessiert sind, qualitativ hochwertige Artikel an viele Menschen zu verbreiten. Bitte senden Sie eine Nachricht mit dem Titel "Wunsch zur Teilnahme" in [Mail](mailto: [email protected]) oder senden Sie eine Nachricht in Twitter. Zum Beispiel können wir die Teile vorstellen, die Ihnen nach der Auswahl helfen können.

Wir freuen uns auf Ihre Meinungen und Eindrücke.

Wie war dieser Artikel? ・ Ich wünschte, ich hätte das getan, ich möchte, dass du mehr tust, ich denke, es wäre besser ・ Diese Art von Ort war gut Wir suchen offene Meinungen wie. Bitte zögern Sie nicht, Ihre Kommentare im Kommentarbereich zu veröffentlichen, da wir Ihr Feedback verwenden werden, um die Qualität zukünftiger Artikel zu verbessern. Wir freuen uns auch über Ihre Kommentare auf Twitter. Wir freuen uns auf Ihre Nachricht.

Recommended Posts

Verarbeiten Sie große Excel-Dateien mit Python, um die Produktivität zu verbessern
Sortieren Sie große Dateien mit Python
Behandeln Sie Excel-CSV-Dateien mit Python
[Easy Python] Lesen von Excel-Dateien mit openpyxl
[Easy Python] Lesen von Excel-Dateien mit Pandas
Excel mit Python
Kommunikationsverarbeitung durch Python
Behandle Excel mit Python
Bildverarbeitung mit Python
Betreiben Sie Excel mit Python (1)
Betreiben Sie Excel mit Python (2)
Bearbeiten Sie Excel-Dateien aus Python mit xlrd (persönliches Memo)
Lernen Sie die asynchrone Verarbeitung / Collouts von Python im Vergleich zu Node.js
Bildverarbeitung mit Python (Teil 2)
[Python] Google Mail mit Python senden: Senden Sie eins nach dem anderen mit mehreren angehängten Bilddateien
Betreiben Sie Excel mit Python Open Pyxl
100 Sprachverarbeitungsklopfen mit Python 2015
Akustische Signalverarbeitung mit Python (2)
Sortieren von Bilddateien mit Python (2)
Sortieren von Bilddateien mit Python (3)
Bildverarbeitung mit Python (Teil 1)
Bilddateien mit Python sortieren
Integrieren Sie PDF-Dateien in Python
Bildverarbeitung mit Python (3)
TXT-Dateien mit Python lesen
Bildverarbeitung mit Python (Pillow)
[Python] Bildverarbeitung mit Scicit-Image
Visualisieren Sie Ihre Taschengelddateien mit Dash, dem Python-Webframework
Solver> Link> Lösen Sie Excel Solver mit Python
[Python] Einfache Parallelverarbeitung mit Joblib
Extrahieren Sie Zip-Dateien rekursiv mit Python
100 Sprachverarbeitungsklopfen mit Python (Kapitel 1)
Bearbeiten von EAGLE .brd-Dateien mit Python
[Python] POST-WAV-Dateien mit Anforderungen [POST]
Mit OpenSSL mit Python 3 verschlüsselte Dateien entschlüsseln
100 Sprachverarbeitungsklopfen mit Python (Kapitel 3)
Die Bildverarbeitung mit Python 100 klopft an die Binärisierung Nr. 3
Lass uns mit Python mit Python spielen [Anfänger]
Lesen Sie Dateien parallel zu Python
100 Bildverarbeitung mit Python Knock # 2 Graustufen
100 Sprachverarbeitung Knock Kapitel 1 von Python
Sortieren von Dateien nach Namenskonvention mit Python
Grundlagen der binärisierten Bildverarbeitung durch Python
Abrufen von Eigenschaftsinformationen durch Scraping mit Python
Bildverarbeitung mit Python 100 Knock # 10 Medianfilter
[AWS] Verwenden von INI-Dateien mit Lambda [Python]
Socket-Kommunikation und Multithread-Verarbeitung durch Python
Spielen Sie eine Audiodatei von Python mit Interrupt ab
Erstellen Sie mit python3 eine Wortwolke aus Ihrem Tweet
Speichern Sie Videos Frame für Frame mit Python OpenCV
100 Bildverarbeitung mit Python Knock # 8 Max Pooling
Zeichnen Sie Nozomi Sasaki in Excel mit Python
Führen Sie regelmäßig eine beliebige Verarbeitung mit Python Twisted durch
Erstellen Sie schnell eine Excel-Datei mit Python #python
Konvertieren Sie Excel-Daten mit Python in JSON
Lassen Sie Heroku die Hintergrundverarbeitung mit Python durchführen
100 Sprachverarbeitungsklopfen mit Python (Kapitel 2, Teil 2)