Cette fois, j'ai essayé de créer du scraping avec python. Je voulais l'écrire proprement en csv, mais en raison du manque de technologie, je l'ai juste écrit pour le moment, donc je veux le rendre plus facile à voir comme indiqué dans le tableau. Je l'ai créé dans un état maladroit, donc cela fonctionne, mais j'apprécierais que vous puissiez dire s'il y a quelque chose qui devrait être changé.
windows 10 python 3.8.0 Bibliothèque urllib.request # Requis pour accéder à l'URL. csv #csv Requis lorsque vous travaillez avec des fichiers. BeautifulSoup # Module spécifique au scraping nécessaire pour analyser les documents HTML et XML. datetime # Requis pour obtenir la date.
scraping.py
import urllib.request
import csv
from bs4 import BeautifulSoup
import datetime
#URL du site
url = "URL du site que vous souhaitez supprimer"
#Ouvrir le lien
html = urllib.request.urlopen("URL du site que vous souhaitez supprimer")
#Ouvrir avec une belle soupe
soup = BeautifulSoup(html, 'html.parser')
#Extraction d'éléments
site_title = soup.find_all("Les éléments que vous souhaitez extraire")
print(site_title)
#Inclure la date lors de la création du fichier csv
csv_date = datetime.datetime.today().strftime("%Y%m%d")
#nom de fichier
csv_file_name = "liberté" + csv_date + ".csv"
#ouvrir csv
csv_file = open(csv_file_name, "w")
#Écrire dans csv
write_csv = csv.writer(csv_file, lineterminator='\n')
write_csv.writerows(site_title)
#fermer csv
f.close()
Recommended Posts