[PYTHON] Convertir un PDF en image avec ImageMagick

Paramètres de gestion des PDF avec ImageMagick

Lors de la manipulation de PDF avec ImageMagick, GS doit être installé.

http://superuser.com/questions/819277/cant-convert-pdf-into-image-because-of-no-images-defined-error

Si vous utilisez brew sur OSX, vous pouvez utiliser brew install gs.

Réglage de la résolution d'échantillonnage requis

Si vous ne définissez pas le dpi avec l'option densité, l'image sera très granuleuse. Réglez en fonction des paramètres PDF d'origine et de la taille de l'image que vous souhaitez produire.

Site référencé http://icepotato.cocolog-nifty.com/blog/2013/06/imagemagickpdfw.html

Le PDF ne peut pas être lu par Pillow of Python

Avec Pillow of Python, le PDF semble être uniquement écrit et non lu.

Code pour convertir tout le dossier PDF en PNG

La résolution d'échantillonnage est de 300 dpi, les marges sont coupées et l'image PNG est exportée dans le même dossier.

Cela devrait fonctionner si vous installez ImageMagick.

# coding: utf-8

import os
import os.path
import fnmatch
import subprocess


def execute(root_path):
    for dirpath, _, filenames in os.walk(root_path):
        for filename in filenames:
            if fnmatch.fnmatch(filename, u"*.pdf"):
                org_path = os.path.join(dirpath, filename)
                png_path = org_path.replace(".pdf", ".png ")

                print "convert {0} to {1}".format(org_path, png_path)

                if subprocess.call(["convert", "-density", "300", "-trim", org_path, png_path]) != 0:
                    print "failed: {0}".format(org_path)
        
if __name__ == '__main__':
    root_path = raw_input("target folder path> ")
    execute(root_path)

Recommended Posts

Convertir un PDF en image avec ImageMagick
Convertir un PDF en image (JPEG / PNG) avec Python
Convertissez l'image au format .zip en PDF avec Python
Convertir des fichiers PDF en fichiers PNG avec GIMP
Exemple de conversion en ondelettes d'images en Python
Convertir 202003 en 2020-03 avec les pandas
Je veux convertir une image en WebP avec sucette
Convertir .ipynb en .html (avec BatchFile)
Convertir un PDF en documents par OCR
Convertir Markdown en PDF en Python
Workflow pour convertir une formule (image) en python
Conversion par lots de fichiers image téléchargés vers MS Forms / Google Forms vers PDF
Convertir des phrases en vecteurs avec gensim
Convertissez des images numérisées déformées en PDF avec Pillow et PyPDF
Conversion de pdf en txt 2 [pyocr]
Convertir une chaîne en image
Convertir des fichiers écrits en python, etc. en pdf avec la coloration syntaxique
Convertir un mémo à la fois avec Python 2to3
Classification d'image avec Keras - Du prétraitement au test de classification -
Introduction au remplissage d'image Python Remplissage d'image à l'aide d'ImageDataGenerator
Convertir des chaînes de caractères en quantités de caractéristiques avec RoBERTa
Convertir des données Excel en JSON avec python
Convertir Hiragana en Romaji avec Python (bêta)
Convertissez des données FX 1 minute en données 5 minutes avec Python
Convertir un PDF joint en courrier électronique au format texte
Convertir un tableau (struct) en json avec golang
Convertir des nombres chinois en nombres arabes avec Python
Essayez de générer une image avec aliénation
Résumé de la comparaison des bibliothèques pour générer des PDF avec Python
Conversion DICOM en PNG avec ordre croissant et décroissant
Coupez l'image aux coins arrondis avec pythonista
Convertissez les données avec la forme (nombre de données, 1) en (nombre de données,) avec numpy.
Convertissez des PDF en images en masse avec Python
Convertir mp4 en mp3 avec ffmpeg (version miniature intégrée)
Convertir un fichier svg en png / ico avec Python
Comment recadrer une image avec Python + OpenCV
Convertir les valeurs d'époque Windows à ce jour avec python
Convertissez facilement les notebooks Jupyter en blogs avec Fastpages
Convertissez plusieurs fichiers jpg en un seul fichier PDF
Conversion par lots de fichiers PSD du répertoire en PDF
Comment convertir (32,32,3) en tenseur à 4 dimensions (1,32,32,1) avec le type ndarray
[Petite histoire] Un moyen simple de convertir Jupyter en PDF
Convertir une chaîne au format de liste caractère par caractère avec python
Convertissez l'historique d'utilisation de Suica mobile au format PDF au format pandas Data Frame avec tabula-py
Comment convertir des pages Web en PDF, PNG, JPG avec VBA (Excel) (Selenium Basic)
Les images créées avec matplotlib passent de dvi à pdf
Comment convertir / restaurer une chaîne avec [] en python
Les débutants essaient de convertir des fichiers Word en PDF à la fois
Comment récupérer des données d'image de Flickr avec Python
Reconnaissance d'image avec keras
0 Convertir une date non remplie en type datetime avec une expression régulière
Convertir les kanji en kana
Convertir un fichier texte avec des valeurs hexadécimales en fichier binaire
Comment convertir des données détenues horizontalement en données détenues verticalement avec des pandas
Comment convertir un objet de classe en dictionnaire avec SQLAlchemy
Convertir jupyter en py
[Python] Convertir le texte PDF en CSV pour chaque page (2/24 postscript)
Convertir keras-yolo3 en ONNX