Dieses Mal habe ich versucht, Scraping mit Python zu erstellen. Ich wollte es ordentlich in csv schreiben, aber aufgrund mangelnder Technologie habe ich es vorerst nur geschrieben, damit ich es einfacher sehen kann, wie in der Tabelle gezeigt. Ich habe es in einem fummeligen Zustand erstellt, damit es funktioniert, aber ich würde es begrüßen, wenn Sie kommentieren könnten, ob es etwas gibt, das geändert werden sollte.
windows 10 python 3.8.0 Bibliothek urllib.request # Erforderlich, um auf die URL zuzugreifen. csv #csv Erforderlich beim Arbeiten mit Dateien. BeautifulSoup # Ein Scraping-spezifisches Modul, das zum Parsen von HTML- und XML-Dokumenten benötigt wird. datetime # Erforderlich, um das Datum abzurufen.
scraping.py
import urllib.request
import csv
from bs4 import BeautifulSoup
import datetime
#Seiten-URL
url = "URL der Site, die Sie kratzen möchten"
#Öffne URL
html = urllib.request.urlopen("URL der Site, die Sie kratzen möchten")
#Öffnen Sie mit schöner Suppe
soup = BeautifulSoup(html, 'html.parser')
#Extraktion von Elementen
site_title = soup.find_all("Elemente, die Sie extrahieren möchten")
print(site_title)
#Geben Sie das Datum beim Erstellen der CSV-Datei an
csv_date = datetime.datetime.today().strftime("%Y%m%d")
#Dateiname
csv_file_name = "Freiheit" + csv_date + ".csv"
#csv öffnen
csv_file = open(csv_file_name, "w")
#Schreiben Sie an csv
write_csv = csv.writer(csv_file, lineterminator='\n')
write_csv.writerows(site_title)
#csv schließen
f.close()
Recommended Posts