Je souhaite convertir une table convertie en PDF en Python en CSV

Je voulais la base de données des tables telle quelle

Le format PDF est un format pratique pour transmettre des données à des personnes et les distribuer avec d'autres matériaux dans des rapports, mais il est gênant en termes de réutilisation des données car il a été corrigé. Il y a beaucoup de. Ce serait bien pour moi de soumettre moi-même un tableau de milliers de lignes au format A4 dans le rapport, mais je l'ai écrit parce qu'il n'y avait pas de données originales lorsque je voulais l'utiliser ultérieurement et que j'ai dû l'extraire du PDF. C'était.

Comment faire

Veuillez écrire le code ci-dessous. Vous devez également installer une bibliothèque Java appelée tabula séparément. Le module de Pyhon n'est que cette trompette.

import tabula
import PyPDF2
import pandas as pd

FILE_PATH = "./test.pdf"

with open(FILE_PATH, mode='rb') as f:
    pages = PyPDF2.PdfFileReader(f).getNumPages()

for i in range(pages+1):
    tmp = tabula.read_pdf(FILE_PATH, pages = i, encoding = "utf-8_sig", spreadsheet=True)
    df = pd.concat([df, tmp], ignore_index=True)

df = tabula.read_pdf(FILE_PATH, lattice=True, pages = '1' )
   
df[0].to_csv("./test.csv", encoding="shift_jis")

Comment utiliser

Exécutez simplement le fichier .py ci-dessus. Ayez une bonne vie PDF.

Recommended Posts

Je souhaite convertir une table convertie en PDF en Python en CSV
Je veux créer une fenêtre avec Python
Je souhaite intégrer une variable dans une chaîne Python
Je veux facilement implémenter le délai d'expiration en python
Je veux écrire en Python! (2) Écrivons un test
Je veux échantillonner au hasard un fichier avec Python
Je veux travailler avec un robot en python.
Convertir Markdown en PDF en Python
Je veux ajouter un joli complément à input () en python
Je veux imprimer dans la notation d'inclusion
Je veux créer un environnement Python
Si vous souhaitez affecter une exportation csv à une variable en python
J'ai créé un plugin pour générer une table Markdown à partir de csv avec Vim
Je veux faire le test de Dunnett en Python
J'ai écrit un code pour convertir quaternion en angle de graissage de type z-y-x avec Python
Je veux faire un jeu avec Python
J'ai créé un outil CLI pour convertir les images de chaque répertoire en PDF
Je veux convertir par lots le résultat de "chaîne de caractères" .split () en Python
Je veux fusionner des dictionnaires imbriqués en Python
Je veux colorer une partie de la chaîne Excel avec Python
J'ai créé un script en python pour convertir des fichiers .md au format Scrapbox
Je veux écrire dans un fichier avec Python
Je veux afficher la progression en Python!
Je veux faire un patch monkey seulement en partie en toute sécurité avec Python
Je souhaite créer une file d'attente prioritaire pouvant être mise à jour avec Python (2.7)
Le programme Python est lent! Je veux accélérer! Dans ce cas ...
Je veux écrire en Python! (1) Vérification du format de code
Comment convertir / restaurer une chaîne avec [] en python
Je veux répéter plusieurs fois un générateur Python
Je veux générer rapidement UUID (memo memo) ~ Edition Python ~
Je veux faire la transition avec un bouton sur le ballon
Même avec JavaScript, je veux voir Python `range ()`!
[Python] Convertir le texte PDF en CSV pour chaque page (2/24 postscript)
Je veux hériter de l'arrière avec la classe de données python
[Python] Je veux faire d'une liste imbriquée un taple
Je veux écrire en Python! (3) Utiliser des simulacres
Comment enregistrer une table récupérée par python en csv
[Python] Création d'une méthode pour convertir la base en 1 seconde
Je veux utiliser le jeu de données R avec python
Je veux faire fonctionner un ordinateur quantique avec Python
Je veux faire quelque chose avec Python à la fin
Je veux manipuler des chaînes dans Kotlin comme Python!
Je souhaite utiliser une source de données python dans Re: Dash pour obtenir les résultats de la requête.
J'ai essayé d'implémenter un automate cellulaire unidimensionnel en Python
Je veux faire quelque chose comme sort uniq en Python
Je veux démarrer beaucoup de processus à partir de python
J'ai fait une commande pour générer un commentaire pour une table dans Django
J'ai essayé "Comment obtenir une méthode décorée en Python"
Je souhaite envoyer un message de Python à LINE Bot
J'ai fait un chronomètre en utilisant tkinter avec python
Je veux pouvoir exécuter Python avec VS Code
Convertir un PDF A4 en A3 toutes les 2 pages
Je veux déboguer avec Python
Je souhaite utiliser un caractère générique que je souhaite décortiquer avec Python remove
J'ai essayé de transformer un fichier Python en un EXE (erreur de récursivité prise en charge)
Convertir des fichiers écrits en python, etc. en pdf avec la coloration syntaxique
Je veux résoudre APG4b avec Python (seulement 4.01 et 4.04 au chapitre 4)
Je souhaite rechercher le texte intégral avec elasticsearch + python
J'ai écrit une fonction pour charger le script d'extension Git en Python