Il y a divers documents au bureau tels que des contrats et des rapports, mais je pense que le principal est [les documents Word].
Lors de l'automatisation des opérations, il existe de nombreux cas où vous souhaitez automatiser la création et la lecture de documents Word. En fait, j'utilise également Python pour automatiser la création de contrats de consignation que je crée tous les trois mois.
Dans cet article, je vais vous expliquer comment utiliser une bibliothèque appelée python-docx pour ** lire des documents Word avec Python **. (La prochaine fois, je présenterai comment créer et remplacer des documents Word.)
python-docx n'est pas une bibliothèque standard. Même Anaconda n'est pas inclus par défaut, alors installons-le d'abord.
pip install python-docx
Importez la bibliothèque après l'installation. Veuillez noter que lors de l'importation, il s'agit de ** dox **, pas de python-docx.
python
import docx
Ensuite, lisez le document Word et créez l'objet. Ici, le document suivant appelé "Test.docx" est lu.
python
document = docx.Document("tester.docx")
Cet objet de document a une liste appelée paragraphes et une liste appelée tables.
les paragraphes sont les paragraphes du texte et les tableaux sont les tableaux. tables a des lignes sous forme de liste de lignes et les lignes a des colonnes (cellules) sous forme de liste appelée cellules. Si vous souhaitez obtenir le texte, reportez-vous à l'attribut appelé texte.
En d'autres termes, il a une telle structure.
python
for paragraph in word.paragraphs:
print(paragraph.text)
Résultat d'exécution
Ceci est le premier paragraphe.
Ceci est le deuxième paragraphe.
python
for table in document.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
Résultat d'exécution
Voici une ligne du tableau/1 rangée
Voici une ligne du tableau/2 rangées
Voici deux lignes du tableau/1 rangée
Voici deux lignes du tableau/2 rangées
Malheureusement, python-docx ne peut pas lire les ** notes de bas de page **.
Si vous souhaitez utiliser des notes de bas de page, il semble que vous deviez envisager une autre méthode.
Recommended Posts