Um die grundlegende Grammatik von Python zu studieren, habe ich ein Programm geschrieben, das mehrere PDF-Dateien in eine PDF-Datei integriert. PyPDF2 wird zum Kombinieren und Schreiben von PDF-Dateien verwendet.
Installieren Sie PyPDF2 mit pip.
> pip install PyPDF2
Importieren Sie "PdfFileMerger", um PDF-Dateien zu integrieren, und "os", "glob", um PDF-Dateien automatisch zu finden, wenn Sie einen Ordner angeben.
merge.py(1)
from PyPDF2 import PdfFileMerger
import os
import glob
Für die Integration initialisieren.
merge.py(2)
def main():
merger = PdfFileMerger()
merge_files = []
Geben Sie zunächst weiter an, bis "m" eingegeben wird. Wenn "m" eingegeben wird, beenden Sie die Angabe der Datei und fahren Sie mit dem nächsten Vorgang fort. Die Variable i dient zum Zählen der Anzahl der Dateien.
merge.py(3)
i = 1
while True:
print("Merge file or Folder ", i, " (Type 'm' to merge.) -> ", sep='', end='')
in_file = input()
if in_file == 'm':
break
Wenn der eingegebene Pfad der Dateiname und eine PDF-Datei ist, wird er der Liste der zusammenzuführenden Dateien hinzugefügt. Wenn die Erweiterung nicht PDF ist, wird eine Nachricht ausgegeben, um sie zu übermitteln.
merge.py(4)
elif os.path.isfile(in_file):
ext = os.path.splitext(in_file)
if ext == '.pdf':
merge_files.append(in_file)
i += 1
else:
print("Die angegebene Datei ist keine PDF-Datei.")
Hier wird zuerst "os.path.isfile ()" verwendet, um zu identifizieren, ob das Argument eine Datei oder ein Ordner ist. Dann verwenden wir "os.path.splitext ()", um die Erweiterung zu identifizieren. Wenn es sich bei der angegebenen Datei um eine PDF-Datei handelt, wird sie der Liste der Dateien hinzugefügt, die von "append ()" zusammengeführt werden sollen.
Wenn der eingegebene Pfad ein Ordnername ist, werden alle PDF-Dateien in diesem Verzeichnis zur Liste hinzugefügt und der hinzugefügte Dateiname ausgegeben.
merge.py(5)
else:
for file in glob.glob(in_file + '*.pdf'):
merge_files.append(file)
print("Add " + file)
i += 1
Die PDF-Dateien im angegebenen Ordner werden von "glob.glob ()" aufgelistet und der Liste hinzugefügt, um sie der Reihe nach zusammenzuführen.
Geben Sie den Namen der Ausgabe-PDF-Datei an. Wenn die Erweiterung des angegebenen Namens nicht ".pdf" lautet, wird sie durch Hinzufügen von ".pdf" am Ende in das PDF-Format konvertiert.
merge.py(6)
print("Generated file -> ", end='')
out_file = input()
ext = os.path.splitext(out_file)
if ext != '.pdf':
out_file = out_file + '.pdf'
Wieder verwenden wir os.path.splitext ()
, um die Erweiterung nachzuschlagen.
Die zu integrierende Datei wird einmal zur Zusammenführung hinzugefügt und dann in die angegebene Datei geschrieben.
merge.py(7)
for file in merge_files:
merger.append(file)
merger.write(out_file)
merger.close()
print("File merge completed!!")
Fügen Sie es mit "append ()" zur Fusion hinzu und erstellen Sie dann mit "write ()" eine PDF-Datei am angegebenen Ausgabeziel.
Bitte überprüfen Sie den gesamten Code von github → (PDF-Handler) Bitte beachten Sie, dass Python ein Anfänger ist, daher kann es schwierig sein, es zu lesen.
Recommended Posts