[Automation] Lire des documents Word avec Python

Lire des documents Word avec Python

Il y a divers documents au bureau tels que des contrats et des rapports, mais je pense que le principal est [les documents Word].

Lors de l'automatisation des opérations, il existe de nombreux cas où vous souhaitez automatiser la création et la lecture de documents Word. En fait, j'utilise également Python pour automatiser la création de contrats de consignation que je crée tous les trois mois.

Dans cet article, je vais vous expliquer comment utiliser une bibliothèque appelée python-docx pour ** lire des documents Word avec Python **. (La prochaine fois, je présenterai comment créer et remplacer des documents Word.)

Lire des documents Word

python-docx n'est pas une bibliothèque standard. Même Anaconda n'est pas inclus par défaut, alors installons-le d'abord.

pip install python-docx

Importez la bibliothèque après l'installation. Veuillez noter que lors de l'importation, il s'agit de ** dox **, pas de python-docx.

python


import docx

Ensuite, lisez le document Word et créez l'objet. Ici, le document suivant appelé "Test.docx" est lu. test_docx.png

python


document = docx.Document("tester.docx")

Cet objet de document a une liste appelée paragraphes et une liste appelée tables.

les paragraphes sont les paragraphes du texte et les tableaux sont les tableaux. tables a des lignes sous forme de liste de lignes et les lignes a des colonnes (cellules) sous forme de liste appelée cellules. Si vous souhaitez obtenir le texte, reportez-vous à l'attribut appelé texte.

En d'autres termes, il a une telle structure. python-docx.png

python


for paragraph in word.paragraphs:
    print(paragraph.text)

Résultat d'exécution


Ceci est le premier paragraphe.

Ceci est le deuxième paragraphe.

python


for table in document.tables:
    for row in table.rows:
        for cell in row.cells:
            print(cell.text)

Résultat d'exécution


Voici une ligne du tableau/1 rangée
Voici une ligne du tableau/2 rangées
Voici deux lignes du tableau/1 rangée
Voici deux lignes du tableau/2 rangées

point important

Malheureusement, python-docx ne peut pas lire les ** notes de bas de page **.

Si vous souhaitez utiliser des notes de bas de page, il semble que vous deviez envisager une autre méthode.

Recommended Posts

[Automation] Lire des documents Word avec Python
[Automation] Lire le courrier (fichier msg) avec Python
Comment lire un fichier CSV avec Python 2/3
Lire ligne par ligne à partir d'un fichier avec Python
Lire csv avec des pandas python
Faites une loterie avec Python
Créer un répertoire avec python
Documenter le code Python avec Doxygen
Lire des données json avec python
[Python] Qu'est-ce qu'une instruction with?
Résoudre ABC163 A ~ C avec Python
Faites fonctionner l'imprimante de reçus avec python
[Automation] Extraire les rendez-vous Outlook avec Python
[Automatisé avec python! ] Partie 1: fichier de configuration
Faisons une interface graphique avec python.
Résoudre ABC166 A ~ D avec Python
[Automation] Envoyer des e-mails Outlook avec Python
Créez un environnement virtuel avec Python!
J'ai fait une loterie avec Python.
Créer un environnement virtuel avec Python 3
Résoudre ABC168 A ~ C avec Python
Créer un système de recommandation avec python
Résoudre ABC162 A ~ C avec Python
Lire des fichiers en parallèle avec Python
Résoudre ABC167 A ~ C avec Python
Résoudre ABC158 A ~ C avec Python
Faisons un graphe avec python! !!
[Automatisé avec python! ] Partie 2: Fonctionnement des fichiers
Charger fbx depuis python avec cinema4d
[Python] Hériter d'une classe avec des variables de classe
J'ai créé un démon avec Python
Ecrire un script batch avec Python3.5 ~
J'ai créé une bibliothèque qui lit facilement les fichiers de configuration avec Python
Programmation avec scripts en ligne de Python / JavaScript / VBScript dans Automation Anywhere A 2019
[Python] Lire un fichier csv avec une grande taille de données à l'aide d'un générateur
[Pyenv] Construire un environnement python avec ubuntu 16.04
Livre en spirale en Python! Python avec un livre en spirale! (Chapitre 14 ~)
Créer un décorateur de fonction Python avec Class
[Python] Un programme qui crée des escaliers avec #
Faisons un jeu de shiritori avec Python
Installer Python en tant que Framework avec pyenv
[Automation] Manipulez la souris et le clavier avec Python
Lire le fichier CSV avec python (Télécharger et analyser le fichier CSV)
Créez une image factice avec Python + PIL.
J'ai fait un compteur de caractères avec Python
[Python] Dessiner un motif de tourbillon avec une tortue
[Python] Créez un environnement virtuel avec Anaconda
Créons un groupe gratuit avec Python
Un mémo contenant Python2.7 et Python3 dans CentOS
Création d'un environnement Python 3.6 avec Windows + PowerShell
Carte des informations de location sur une carte avec python
Rechercher le labyrinthe avec l'algorithme python A *
[C] [python] Lire avec AquesTalk sous Linux
Programmes Python de document HTML avec Sphinx
Démonisez une application Web Python avec Supervisor
Lisons le fichier RINEX avec Python ①
Faisons la voix lentement avec Python