[PYTHON] Kratzmodul "Gaspacho", das einfacher zu verwenden ist als Beautiful Soup

Ich möchte ein Python-Modul namens "Gazpacho" vorstellen, das ich kürzlich gelernt habe.

Was ist Gazpacho?

gazpacho ist eine "einfache, schnelle und moderne Bibliothek für Web Scraping".

gazpacho is a simple, fast, and modern web scraping library. The library is stable, actively maintained, and installed with zero dependencies. (https://pypi.org/project/gazpacho/)

Die Anzahl der Sterne ist mit 400 immer noch gering, daher denke ich, dass es am besten ist, sie für den persönlichen Gebrauch aufzubewahren.

verdienen

Wie benutzt man

Installieren Sie zuerst das Modul.

pip install gazpacho

Ich werde den Titel des Buches von der folgenden Seite im Tutorial kratzen und ausgeben.

https://scrape.world/books

from gazpacho import get, Soup


#Holen Sie sich HTML basierend auf der angegebenen URL
html = get('https://scrape.world/books')

#Erstellen Sie eine Instanz für die Analyse
soup = Soup(html)

#Holen Sie sich die Elemente, die Sie brauchen. Liste, wenn mehr als eine gefunden wird[Soup]Rückgabe (Suppe für Singular)
#Das erste Argument ist ein HTML-Tag
#Das zweite Argument ist die Angabe von ID und Klasse
#Gibt an, ob die dritte Spezifikation eine teilweise Übereinstimmung zulässt
#Im Beispiel ist die Klasse"book-"Denn es ist"book-early"Usw. übereinstimmen
books = soup.find('div', {'class': 'book-'}, partial=True)

for book in books:
    name_header = book.find('h4')
    #Das Textfeld enthält den Inhalt des Tags
    name = name_header.text
    print(name)

Zusammenfassung

Persönlich benutze ich es richtig wie unten gezeigt.

  1. Einfaches Schaben -> Gazpacho verwenden
  2. Schwierig mit Gazpacho (*) -> Selen (Chromedriver-Bibliothek) Machen Sie etwas mit schöner Suppe

Das Modul selbst von Gazpacho ist einfach, daher denke ich darüber nach, Zeit zum Lesen zu finden.

Ich hoffe, dass mehr Leute diesen Artikel lesen und verwenden werden!

Recommended Posts

Kratzmodul "Gaspacho", das einfacher zu verwenden ist als Beautiful Soup
Ich habe ein Modul erstellt, das leicht fehlerhaft sein kann, aber ich kann das Argument nicht von entry_points übergeben
Ein Timer (Ticker), der im Feld verwendet werden kann (kann überall verwendet werden)
Python-Standardmodul, das in der Befehlszeile verwendet werden kann
Akustisches Signalverarbeitungsmodul, das mit Python-Sounddevice ASIO [Anwendung] verwendet werden kann
Wie man einen Janken-Bot macht, der leicht bewegt werden kann (Kommentar)
Erstellen Sie eine Web-App, die mit Plotly Dash einfach visualisiert werden kann
Python-Sound Gerät ASIO akustisches Signalverarbeitungsmodul [Basic]
[Python] Eine Tabelle mit Beautiful Soup kratzen
Persönliche Notizen zu Pandas-bezogenen Vorgängen, die in der Praxis verwendet werden können
So installieren Sie die Python-Bibliothek, die von Pharmaunternehmen verwendet werden kann
Dateitypen, die mit Go verwendet werden können
Funktionen, die in der for-Anweisung verwendet werden können
Konvertieren Sie Bilder aus dem FlyCapture SDK in ein Formular, das mit openCV verwendet werden kann
Hinweise zu Python-Kenntnissen, die mit AtCoder verwendet werden können
ANTs Bildregistrierung, die in 5 Minuten verwendet werden kann
[Django] Über Benutzer, die für Vorlagen verwendet werden können
Ich habe ein grobes Ansible-Modul geschrieben, mit dem Sie Virtualenv verwenden können, indem Sie Pythonz installieren.
[Atcoder] [C ++] Ich habe ein Testautomatisierungstool erstellt, das während des Wettbewerbs verwendet werden kann
Kratzen mit schöner Suppe
Goroutine (parallele Steuerung), die im Feld eingesetzt werden kann
Goroutine, die im Feld verwendet werden kann (errgroup.Group Edition)
Skripte, die bei der Verwendung von Bottle in Python verwendet werden können
Implementieren Sie einen Thread, der durch Ausnutzen von Yield angehalten werden kann
Lassen Sie uns ein Diagramm erstellen, auf das mit IPython geklickt werden kann
Verstehen Sie die Wahrscheinlichkeiten und Statistiken, die für das Fortschrittsmanagement mit einem Python-Programm verwendet werden können
Über die Sache, dass Fackelzusammenfassung wirklich verwendet werden kann, wenn ein Modell mit Pytorch erstellt wird