Ich möchte eine in Python in PDF konvertierte Tabelle wieder in CSV konvertieren

Ich wollte die Tabellendatenbank so wie sie ist

Das PDF-Format ist ein praktisches Format, um Daten an Personen weiterzugeben und zusammen mit anderen Materialien in Berichten zu verteilen. Es ist jedoch hinsichtlich der Wiederverwendbarkeit von Daten problematisch, da es behoben wurde. Es gibt viele. Es wäre schön, wenn ich selbst eine Tabelle mit Tausenden von Zeilen im A4-Format im Bericht einreichen würde, aber ich habe dies geschrieben, weil es keine Originaldaten gab, als ich sie zu einem späteren Zeitpunkt verwenden wollte, und ich musste sie aus dem PDF extrahieren. Es war.

Wie man ... macht

Bitte schreiben Sie den Code unten. Sie müssen auch eine Java-Bibliothek namens tabula separat installieren. Pyhons Modul ist genau diese Trompete.

import tabula
import PyPDF2
import pandas as pd

FILE_PATH = "./test.pdf"

with open(FILE_PATH, mode='rb') as f:
    pages = PyPDF2.PdfFileReader(f).getNumPages()

for i in range(pages+1):
    tmp = tabula.read_pdf(FILE_PATH, pages = i, encoding = "utf-8_sig", spreadsheet=True)
    df = pd.concat([df, tmp], ignore_index=True)

df = tabula.read_pdf(FILE_PATH, lattice=True, pages = '1' )
   
df[0].to_csv("./test.csv", encoding="shift_jis")

Wie benutzt man

Führen Sie einfach die oben genannte .py-Datei aus. Haben Sie ein gutes PDF-Leben.

Recommended Posts

Ich möchte eine in Python in PDF konvertierte Tabelle wieder in CSV konvertieren
Ich möchte mit Python ein Fenster erstellen
Ich möchte eine Variable in einen Python-String einbetten
Ich möchte Timeout einfach in Python implementieren
Ich möchte in Python schreiben! (2) Schreiben wir einen Test
Ich möchte eine Datei mit Python zufällig testen
Ich möchte mit einem Roboter in Python arbeiten.
Konvertieren Sie Markdown in Python in PDF
Ich möchte eine schöne Ergänzung zu input () in Python hinzufügen
Ich möchte in der Einschlussnotation drucken
Ich möchte eine Python-Umgebung erstellen
Wenn Sie einer Variablen in Python einen CSV-Export zuweisen möchten
Ich habe ein Plugin erstellt, um mit Vim eine Markdown-Tabelle aus CSV zu generieren
Ich möchte Dunnetts Test in Python machen
Ich habe einen Code geschrieben, um die Quaternion mit Python in einen Ölerwinkel vom Typ z-y-x umzuwandeln
Ich möchte ein Spiel mit Python machen
Ich habe ein CLI-Tool erstellt, um Bilder in jedem Verzeichnis in PDF zu konvertieren
Ich möchte das Ergebnis von "Zeichenfolge" .split () in Python stapelweise konvertieren
Ich möchte verschachtelte Dicts in Python zusammenführen
Ich möchte einen Teil der Excel-Zeichenfolge mit Python einfärben
Ich habe ein Skript in Python erstellt, um MDD-Dateien in das Scrapbox-Format zu konvertieren
Ich möchte mit Python in eine Datei schreiben
Ich möchte den Fortschritt in Python anzeigen!
Ich möchte Affenpatches nur teilweise sicher mit Python machen
Ich möchte eine Prioritätswarteschlange erstellen, die mit Python (2.7) aktualisiert werden kann.
Python-Programm ist langsam! Ich möchte beschleunigen! In einem solchen Fall ...
Ich möchte in Python schreiben! (1) Überprüfung des Codeformats
So konvertieren / wiederherstellen Sie einen String mit [] in Python
Ich möchte einen Python-Generator viele Male iterieren
Ich möchte schnell UUID generieren (Gedenknotiz) ~ Python Edition ~
Ich möchte mit einem Knopf am Kolben übergehen
Auch mit JavaScript möchte ich Python `range ()` sehen!
[Python] Konvertiert PDF-Text für jede Seite in CSV (2/24 Postscript)
Ich möchte mit Python-Datenklasse nach hinten erben
[Python] Ich möchte aus einer verschachtelten Liste einen Taple machen
Ich möchte in Python schreiben! (3) Verwenden Sie Mock
So speichern Sie eine von Python gekratzte Tabelle in CSV
[Python] Erstellt eine Methode zum Konvertieren von Radix in 1 Sekunde
Ich möchte R-Datensatz mit Python verwenden
Ich möchte einen Quantencomputer mit Python betreiben
Ich möchte am Ende etwas mit Python machen
Ich möchte Strings in Kotlin wie Python manipulieren!
Ich möchte eine Python-Datenquelle in Re: Dash verwenden, um Abfrageergebnisse zu erhalten
Ich habe versucht, einen eindimensionalen Zellautomaten in Python zu implementieren
Ich möchte so etwas wie Uniq in Python sortieren
Ich möchte viele Prozesse von Python aus starten
Ich habe einen Befehl zum Generieren eines Kommentars für eine Tabelle in Django eingegeben
Ich habe versucht "Wie man eine Methode in Python dekoriert"
Ich möchte eine Nachricht von Python an LINE Bot senden
Ich habe eine Stoppuhr mit tkinter mit Python gemacht
Ich möchte Python mit VS-Code ausführen können
Konvertieren Sie A4 PDF alle 2 Seiten in A3
Ich möchte mit Python debuggen
Ich möchte einen Platzhalter verwenden, den ich mit Python entfernen möchte
Ich habe versucht, eine Python-Datei in eine EXE-Datei zu verwandeln (Rekursionsfehler unterstützt)
Konvertieren Sie in Python usw. geschriebene Dateien in PDF mit Syntax-Hervorhebung
Ich möchte APG4b mit Python lösen (nur 4.01 und 4.04 in Kapitel 4)
Ich möchte den vollständigen Text mit elasticsearch + python durchsuchen
Ich habe eine Funktion zum Laden des Git-Erweiterungsskripts in Python geschrieben