[Automatisierung] Lesen Sie Word-Dokumente mit Python

Lesen Sie Word-Dokumente mit Python

Es gibt verschiedene Dokumente im Büro, wie Verträge und Berichte, aber ich denke, der Mainstream ist [Word-Dokumente].

Bei der Automatisierung von Vorgängen gibt es viele Fälle, in denen Sie die Erstellung und das Lesen von Word-Dokumenten automatisieren möchten. Tatsächlich verwende ich Python auch, um die Erstellung von Sendungsverträgen zu automatisieren, die ich alle drei Monate erstelle.

In diesem Artikel werde ich erklären, wie man eine Bibliothek namens python-docx verwendet, um ** Word-Dokumente mit Python zu lesen **. (Beim nächsten Mal werde ich vorstellen, wie Word-Dokumente erstellt und ersetzt werden.)

Word-Dokumente lesen

python-docx ist keine Standardbibliothek. Sogar Anaconda ist standardmäßig nicht enthalten. Installieren wir es also zuerst.

pip install python-docx

Importieren Sie die Bibliothek nach der Installation. Bitte beachten Sie, dass es sich beim Importieren um ** dox ** und nicht um python-docx handelt.

python


import docx

Lesen Sie dann das Word-Dokument und erstellen Sie das Objekt. Hier wird das folgende Dokument mit dem Namen "Test.docx" gelesen. test_docx.png

python


document = docx.Document("Prüfung.docx")

Dieses Dokumentobjekt verfügt über eine Liste mit dem Namen Absätze und eine Liste mit dem Namen Tabellen.

Absätze sind die Absätze im Text, und Tabellen sind die Tabellen. Tabellen haben Zeilen als Liste von Zeilen und Zeilen haben Spalten (Zellen) als Liste namens Zellen. Wenn Sie den Text erhalten möchten, beziehen Sie sich auf das Attribut Text.

Mit anderen Worten, es hat eine solche Struktur. python-docx.png

python


for paragraph in word.paragraphs:
    print(paragraph.text)

Ausführungsergebnis


Dies ist der erste Absatz.

Dies ist der zweite Absatz.

python


for table in document.tables:
    for row in table.rows:
        for cell in row.cells:
            print(cell.text)

Ausführungsergebnis


Hier ist eine Zeile der Tabelle/1 Reihe
Hier ist eine Zeile der Tabelle/2 Reihen
Hier sind zwei Zeilen der Tabelle/1 Reihe
Hier sind zwei Zeilen der Tabelle/2 Reihen

wichtiger Punkt

Leider kann Python-Docx keine ** Fußnoten ** lesen.

Wenn Sie einschließlich Fußnoten arbeiten möchten, müssen Sie anscheinend eine andere Methode in Betracht ziehen.

Recommended Posts

[Automatisierung] Lesen Sie Word-Dokumente mit Python
[Automatisierung] Lesen Sie E-Mails (Nachrichtendatei) mit Python
Lesen einer CSV-Datei mit Python 2/3
Lesen Sie mit Python Zeile für Zeile aus der Datei
Lesen Sie CSV mit Python-Pandas
Machen Sie eine Lotterie mit Python
Erstellen Sie ein Verzeichnis mit Python
Dokumentieren Sie Python-Code mit Doxygen
Lesen von JSON-Daten mit Python
[Python] Was ist eine with-Anweisung?
Löse ABC163 A ~ C mit Python
Bedienen Sie den Belegdrucker mit Python
[Automatisierung] Extrahieren Sie Outlook-Termine mit Python
[Mit Python automatisiert! ] Teil 1: Datei einstellen
Lassen Sie uns eine GUI mit Python erstellen.
Löse ABC166 A ~ D mit Python
[Automatisierung] Senden Sie Outlook-E-Mails mit Python
Erstellen Sie eine virtuelle Umgebung mit Python!
Ich habe mit Python eine Lotterie gemacht.
Erstellen einer virtuellen Umgebung mit Python 3
Löse ABC168 A ~ C mit Python
Erstellen Sie ein Empfehlungssystem mit Python
Löse ABC162 A ~ C mit Python
Lesen Sie Dateien parallel zu Python
Löse ABC167 A ~ C mit Python
Löse ABC158 A ~ C mit Python
Lassen Sie uns ein Diagramm mit Python erstellen! !!
[Mit Python automatisiert! ] Teil 2: Dateivorgang
Laden Sie fbx aus Python mitinema4d
[Python] Erbt eine Klasse mit Klassenvariablen
Ich habe mit Python einen Daemon erstellt
Schreiben Sie ein Batch-Skript mit Python3.5 ~
Ich habe eine Bibliothek erstellt, die Konfigurationsdateien mit Python einfach lesen kann
Programmieren mit Inline-Scripting von Python / JavaScript / VBScript in Automation Anywhere A 2019
[Python] Lesen Sie eine CSV-Datei mit großen Datenmengen mithilfe eines Generators
[Pyenv] Erstellen einer Python-Umgebung mit Ubuntu 16.04
Spiralbuch in Python! Python mit einem Spiralbuch! (Kapitel 14 ~)
Erstellen Sie mit Class einen Python-Funktionsdekorator
[Python] Ein Programm, das Treppen mit # erstellt
Lassen Sie uns mit Python ein Shiritori-Spiel machen
Installieren Sie Python als Framework mit pyenv
[Automatisierung] Bearbeiten Sie Maus und Tastatur mit Python
CSV-Datei mit Python lesen (CSV-Datei herunterladen und analysieren)
Erstellen Sie mit Python + PIL ein Dummy-Image.
Ich habe mit Python einen Zeichenzähler erstellt
[Python] Zeichnen eines Wirbelmusters mit einer Schildkröte
[Python] Erstellen Sie mit Anaconda eine virtuelle Umgebung
Erstellen wir mit Python eine kostenlose Gruppe
Ein Memo mit Python2.7 und Python3 in CentOS
Erstellen einer Python 3.6-Umgebung mit Windows + PowerShell
Kartenmietinformationen auf einer Karte mit Python
Durchsuche das Labyrinth mit dem Python A * -Algorithmus
[C] [Python] Lesen mit AquesTalk unter Linux
HTML-Dokument Python-Programme mit Sphinx
Dämonisieren Sie eine Python-Webanwendung mit Supervisor
Lesen wir die RINEX-Datei mit Python ①
Lassen Sie uns mit Python langsam sprechen