So erhalten Sie Daten von einer Webseite Hier
Verwenden Sie das Modul re der Standardbibliothek. Offizielles Dokument
import re
from html import unescape
from urllib.parse import urljoin
#Holen Sie sich HTML-Daten von der Webseite
for partial_html in re.findall(Reguläre Ausdrücke):
#Erhalten Sie spezifische Informationen mit regulären Ausdrücken aus den erfassten Informationen
#Im regulären Ausdruck re.search()machen
Python Pine für libxml2 und libxslt, bekannte Bibliotheken für die XML-Verarbeitung in C-Sprache. Offizielles Dokument
import lxml.html
a =HTML-Datei lesen
html = a.getroot()
#Konvertieren Sie alle Elemente in href-Attribute in absolute URLs basierend auf der Argument-URL
html.make_link_absolute(URL)
for b in html.cssselect(Geben Sie das Element mit dem CSS-Selektor an):
#Element abrufen
Recommended Posts