[PYTHON] Convertir le PDF de la liste des magasins membres Go To EAT dans la préfecture de Niigata en CSV

Convertir la liste des magasins disponibles (PDF) de la Campagne Go To Eat Préfecture de Niigata en CSV

#Télécharger le PDF
wget https://niigata-gte.com/pdf/shop-list.pdf -O data.pdf

apt install python3-tk ghostscript
pip install camelot-py[cv]

commander

camelot -p all -o data.csv -f csv -strip '\n' -split lattice -scale 40 data.pdf

Python

import camelot
import pandas as pd

tables = camelot.read_pdf(
    "data.pdf", pages="all", split_text=True, strip_text="\n", line_scale=40
)

df = pd.concat(
    [
        table.df.iloc[1:].set_axis(
            ["Code revendeur", "Genre", "Nom du magasin", "adresse de rue", "numéro de téléphone", "Sortir", "livraison"], axis=1
        )
        for table in tables
    ]
)

df.to_csv("niigata.csv", encoding="utf_8_sig")

Recommended Posts

Convertir le PDF de la liste des magasins membres Go To EAT dans la préfecture de Niigata en CSV
Convertir le PDF des magasins membres Go To EAT de la préfecture d'Ishikawa en CSV
Convertir le PDF des magasins disponibles de Go To EAT dans la préfecture de Kagoshima en CSV
Convertir le PDF de la liste des magasins membres Go To EAT dans la préfecture de Kumamoto en CSV
Convertir le PDF de la préfecture de Chiba Aller à la liste des magasins des membres EAT en CSV (commande)
Gratter la liste des magasins membres Go To EAT dans la préfecture de Niigata et la convertir en CSV
Gratter la liste des magasins membres Go To EAT dans la préfecture de Fukuoka et la convertir en CSV
Convertir le PDF de la liste des concessionnaires de la campagne Go To Eat Hokkaido en CSV
Scraping Go To EAT membres magasins dans la préfecture d'Osaka et conversion au format CSV
Convertir le PDF d'un nouveau cas d'épidémie corona dans la préfecture d'Aichi en CSV
Convertir le PDF de la liste de produits contenant des surfactants efficaces pour le nouveau virus corona en CSV
Convertir Markdown en PDF en Python
L'histoire de la recherche d'un magasin BOT (AI LINE BOT) pour Go To EAT dans la préfecture de Chiba (1)
Comment convertir csv en tsv dans la CLI
Convertir de PDF en CSV avec pdfplumber
Je souhaite convertir une table convertie en PDF en Python en CSV
Comment réaliser quelque chose comme une liste de void * (ou de type de variante) dans Go?
Convertir des fichiers CSV UTF-8 pour les lire dans Excel
PDF de la liste des magasins du buffet du petit-déjeuner COCO converti en CSV
Conversion par lots de fichiers PSD du répertoire en PDF
Convertir un objet de tranche en liste de numéros d'index
[Python] Convertir le texte PDF en CSV pour chaque page (2/24 postscript)
Convertissez l'image au format .zip en PDF avec Python
Trébucher lors de la conversion d'une liste bidirectionnelle en JSON dans Go
Conversion par lots de tous les fichiers xlsx du dossier en fichiers CSV
Comment obtenir une liste d'exceptions intégrées pour python
Django a changé pour enregistrer beaucoup de données à la fois
Une commande pour lister tous les fichiers par ordre de nom de fichier