Am zweiten Tag, nachdem ich selbst angefangen hatte, Python zu lernen, versuchte ich es mit einfachem WEB-Scraping. Ich habe es mit Bezug auf einige Websites gemacht. Poste es für persönliche Notizen. Diesmal ** · Titel ** ** ・ h2 ** Extrahieren Sie zwei Elemente.
-Installieren Sie das Anforderungsmodul
Befehl
pip install requests
-Installieren Sie das Modul Schöne Suppe
Befehl
pip install beautifulsoup4
Code
import requests
from bs4 import BeautifulSoup
#URL, die Sie erhalten möchten
url = "*********"
#Holen Sie sich HTML, indem Sie eine HTTP-Anfrage mit der URL als Argument senden
response = requests.get(url)
#Der Zeichencode wird automatisch codiert
response.encoding = response.apparent_encoding
#HTML-Analyse
bs = BeautifulSoup(response.text, 'html.parser')
#Titel extrahieren
title_tag = bs.find('title')
print(title_tag.text)
#H2-Element extrahieren
h2_tags = bs.select('h2')
for h2_tag in h2_tags:
print(h2_tag.text)
Recommended Posts