[PYTHON] Diviser le PDF en pages arbitraires

En premier lieu

Ouvrez un énorme PDF de pages qui apparaissent régulièrement dans Chrome, et sous la direction de votre patron, 2 pages chacune (2 pages sont un ensemble de données statistiques divisé par jour), et les efforts larmoyants des collègues qui économisent chaque jour Ecoutez, automatisons-le avec Python et allons déjeuner, alors faisons-le avec Python.

PyPDF2 Il semble qu'il existe différents modules pour faire fonctionner PDF, mais cela semble facile, j'ai donc utilisé un module appelé "PyPDF2".

pip install PyPDF2

Entrez ensuite. Si vous lisez ceci et cela, il semble y avoir un moyen de diviser le PDF en pages une par une. Pour découper chaque page ...

  1. Tout démonter une fois et réorganiser en 2 pages chacun
  2. Extrayez les pages 1-2, 3-4, etc.

Cependant, 1 semble être gênant, alors essayez 2. Divisez "test \ .pdf" en deux pages et enregistrez-le sous "<page d'accueil> .pdf".

pdf_separate.py


import PyPDF2

f = 'test.pdf' #PDF que vous souhaitez diviser
page_sep = 2 #Combien de pages souhaitez-vous diviser

#Comprendre le nombre de pages pdf
reader = PyPDF2.PdfFileReader(f)
page_num = reader.getNumPages()

#Extrayez la page et dérivez le numéro utilisé pour le nom de fichier et tournez-le avec pour
for page in range(0, page_num, page_sep):
    merger = PyPDF2.PdfFileMerger()
    start = page
    end = start + page_sep
    merger.append(f, pages=(start,end))
    file_name = str(start) + '.pdf'
    merger.write(file_name)
    merger.close

print('la fin')

au fait

page_sep = 2 #Combien de pages souhaitez-vous diviser

Si vous changez "2" en "3", il sera divisé en 3 pages, mais si le nombre total de pages dans le pdf n'est pas un multiple de 3, "Hé, si vous essayez d'écrire le dernier fichier, il n'y a pas assez de pages. J'obtiens une erreur lors de la génération du dernier fichier.

Dans ce cas, je peux faire quelque chose, mais je n'en ai pas besoin maintenant, alors je vais retourner manger du riz.

Recommended Posts

Diviser le PDF en pages arbitraires
Renuméroter les pages PDF
Traitement PDF (fractionnement, etc.)
Écran divisé en 3 avec keyhac
Convertir un PDF A4 en A3 toutes les 2 pages
[Blender] Scinder le script Blender en plusieurs fichiers
J'ai exécuté GhostScript avec python, divisé le PDF en pages et l'ai converti en image JPEG.
Diviser l'itérateur en morceaux avec python