[PYTHON] Convertir le PDF de la liste des magasins membres Go To EAT dans la préfecture de Kumamoto en CSV

Convertir le PDF de la liste des magasins membres de GoToEat Campaign Kumamoto en CSV

commander

wget https://gotoeat-kumamoto.jp/pdf/shoplist.pdf -O data.pdf

apt install python3-tk ghostscript
pip install camelot-py[cv]

camelot -p all -o data.csv -f csv -split lattice -scale 40 data.pdf

Python

import camelot
import pandas as pd

tables = camelot.read_pdf("data.pdf", pages="all", split_text=True, strip_text=" \n", line_scale=40)

dfs = [table.df for table in tables]

df_tmp = pd.concat(dfs)

df = df_tmp.iloc[1:].set_axis(df_tmp.iloc[0].to_list(), axis=1).reset_index(drop=True)
df.sort_values(by=["Code postal", "Quartier de la ville, adresse"], inplace=True)

df.to_csv("kumamoto.csv", encoding="utf_8_sig")

Recommended Posts

Convertir le PDF de la liste des magasins membres Go To EAT dans la préfecture de Kumamoto en CSV
Convertir le PDF de la préfecture de Chiba Aller à la liste des magasins des membres EAT en CSV (commande)
Convertir le PDF de la liste des magasins membres Go To EAT dans la préfecture de Niigata en CSV
Convertir le PDF des magasins membres Go To EAT de la préfecture d'Ishikawa en CSV
Convertir le PDF de la liste des concessionnaires de la campagne Go To Eat Hokkaido en CSV
Convertir le PDF des magasins disponibles de Go To EAT dans la préfecture de Kagoshima en CSV
Gratter la liste des magasins membres Go To EAT dans la préfecture de Fukuoka et la convertir en CSV
Gratter la liste des magasins membres Go To EAT dans la préfecture de Niigata et la convertir en CSV
Scraping Go To EAT membres magasins dans la préfecture d'Osaka et conversion au format CSV
Convertir le PDF d'un nouveau cas d'épidémie corona dans la préfecture d'Aichi en CSV
Convertir de PDF en CSV avec pdfplumber
Histoire de faire une recherche de magasin BOT (AI LINE BOT) pour Go To EAT dans la préfecture de Chiba (2) [Présentation]
PDF de la liste des magasins du buffet du petit-déjeuner COCO converti en CSV
Convertir un objet de tranche en liste de numéros d'index
[Python] Convertir le texte PDF en CSV pour chaque page (2/24 postscript)
[Python] Convertir la liste en Pandas [Pandas]
Convertissez rapidement SDF en CSV
Convertissez un grand nombre de fichiers PDF en fichiers texte à l'aide de pdfminer