Versuchen Sie HTML-Scraping mit der Python-Bibliothek

Beautiful Soup

Was ist schöne Suppe?

Eine Scraping-Bibliothek mit einer einfachen API, die leicht zu merken ist.

Offiziell

from urllib.parse import urljoin
from bs4 import BeautifulSoup

#HTML-Datei lesen
with open('HTML-Datei') as f:
   soup = BeautifulSoup(f, 'html.parser')

#Rufen Sie die Liste der Elemente ab, die Sie mit select erhalten möchten
for a in soup.select(Element)
#Ziehen Sie das gewünschte Element heraus

pyquery

Was ist Pyquery?

pyquery ist eine Bibliothek, die auf die gleiche Weise wie jQuery aus HTML entfernt werden kann. Es verwendet lxml intern und kann mit hoher Geschwindigkeit verarbeitet werden.

Offiziell

from pyquery import PyQuery as pq

#Lesen Sie die HTML-Datei und holen Sie sich das PyQuery-Objekt
d = pq(filename='HTML-Datei')

#Holen Sie sich die Liste der Elemente, die Sie erhalten möchten
for a in d(Element):
#Ziehen Sie das gewünschte Element heraus

Recommended Posts

Versuchen Sie HTML-Scraping mit der Python-Bibliothek
Scraping mit Python
Scraping mit Python
Versuchen Sie, eine Karte mit Python + Cartopy 0.18.0 zu zeichnen
[Für Anfänger] Versuchen Sie Web Scraping mit Python
Scraping in Python (Vorbereitung)
Scraping mit Python + PhantomJS
Schaben mit Selen [Python]
Scraping mit Python + PyQuery
Scraping von RSS mit Python
Versuchen Sie, mit Python eine Lebenskurve zu zeichnen
Versuchen Sie, in Python einen "Entschlüsselungs" -Code zu erstellen
Versuchen Sie, mit Python eine Diedergruppe zu bilden
Ich habe versucht, mit Python zu kratzen
Web Scraping mit Python + JupyterLab
Schaben mit Selen in Python
Schaben mit Selen + Python Teil 1
Schaben mit Chromedriver in Python
Festliches Scraping mit Python, Scrapy
Versuchen Sie, mit einer Shell zu programmieren!
Probieren Sie die Python-Ausgabe mit Haxe 3.2 aus
Versuchen Sie, Python mit pybind11 in ein C ++ - Programm einzubetten
Scraping mit Selen in Python
Scraping mit Tor in Python
Machen Sie eine Lotterie mit Python
WEB Scraping mit Python und versuchen, aus Bewertungen eine Wortwolke zu machen
Kratzwettervorhersage mit Python
Versuchen Sie, Python mit Try Jupyter auszuführen
Schaben mit Selen + Python Teil 2
Versuchen Sie die Gesichtserkennung mit Python
Ich habe versucht, mit Python zu kratzen
Web Scraping Anfänger mit Python
Erstellen Sie ein Verzeichnis mit Python
Versuchen Sie, Python in der mit pipenv erstellten Django-Umgebung auszuführen
Versuchen Sie, COVID-19 Tokyo-Daten mit Python zu kratzen
[AWS] Versuchen Sie, die Python-Bibliothek mit SAM + Lambda (Python) zur Ebene hinzuzufügen.
Versuchen Sie, ein Unterfenster mit PyQt5 und Python zu öffnen
Ein Beispiel zum Zeichnen von Punkten mit PIL (Python Imaging Library).
Versuchen Sie, ein neuronales Netzwerk in Python aufzubauen, ohne eine Bibliothek zu verwenden
Versuchen Sie Juniper JUNOS PyEz (Python-Bibliothek) Memo 3 ~ Ändern Sie die Einstellungen mit PyEz ~
Bibliothek zur Angabe eines Nameservers in Python und Dig
Probieren Sie Juniper JUNOS PyEz (Python-Bibliothek) aus. Hinweis 2 ~ Informationen mit PyEz ~ abrufen ~
[Python] Was ist eine with-Anweisung?
Verwenden Sie Pymol als Python-Bibliothek
Löse ABC163 A ~ C mit Python
Python-Grafikhandbuch mit Matplotlib.
Scraping mit Node, Ruby und Python
Scraping mit Selen in Python (Basic)
Lassen Sie uns eine GUI mit Python erstellen.
Scraping mit Python, Selen und Chromedriver
Versuchen Sie, Facebook mit Python zu betreiben
Versuchen Sie die Singularwertzerlegung mit Python
Web Scraping mit Python Erster Schritt
Ich habe versucht, WebScraping mit Python.
Kratzen mit Python und schöner Suppe
Erstellen Sie eine virtuelle Umgebung mit Python!
Ich habe mit Python eine Lotterie gemacht.
Erstellen einer virtuellen Umgebung mit Python 3
Löse ABC168 A ~ C mit Python
Erstellen Sie ein Empfehlungssystem mit Python