Ich möchte ein Python-Modul namens "Gazpacho" vorstellen, das ich kürzlich gelernt habe.
gazpacho ist eine "einfache, schnelle und moderne Bibliothek für Web Scraping".
gazpacho is a simple, fast, and modern web scraping library. The library is stable, actively maintained, and installed with zero dependencies. (https://pypi.org/project/gazpacho/)
Die Anzahl der Sterne ist mit 400 immer noch gering, daher denke ich, dass es am besten ist, sie für den persönlichen Gebrauch aufzubewahren.
BeautifulSoup
usw. verwenden, müssen Sie zuerst den HTML-Code mit Anfragen usw. abrufen.Installieren Sie zuerst das Modul.
pip install gazpacho
Ich werde den Titel des Buches von der folgenden Seite im Tutorial kratzen und ausgeben.
https://scrape.world/books
from gazpacho import get, Soup
#Holen Sie sich HTML basierend auf der angegebenen URL
html = get('https://scrape.world/books')
#Erstellen Sie eine Instanz für die Analyse
soup = Soup(html)
#Holen Sie sich die Elemente, die Sie brauchen. Liste, wenn mehr als eine gefunden wird[Soup]Rückgabe (Suppe für Singular)
#Das erste Argument ist ein HTML-Tag
#Das zweite Argument ist die Angabe von ID und Klasse
#Gibt an, ob die dritte Spezifikation eine teilweise Übereinstimmung zulässt
#Im Beispiel ist die Klasse"book-"Denn es ist"book-early"Usw. übereinstimmen
books = soup.find('div', {'class': 'book-'}, partial=True)
for book in books:
name_header = book.find('h4')
#Das Textfeld enthält den Inhalt des Tags
name = name_header.text
print(name)
Persönlich benutze ich es richtig wie unten gezeigt.
Das Modul selbst von Gazpacho ist einfach, daher denke ich darüber nach, Zeit zum Lesen zu finden.
Ich hoffe, dass mehr Leute diesen Artikel lesen und verwenden werden!