Ich habe auf den folgenden Artikel verwiesen.
Einführung in die Python-Web-Scraping-Praxis BeautifulSoup4-Spickzettel (Selektor usw.)
Die Zieldaten sind diesmal der Trend auf der obersten Seite von Qiita.
auf diese Weise
Wir benutzen eine Bibliothek namens "Schöne Suppe".
python
import urllib.request
from bs4 import BeautifulSoup
import json
QIITA_TOP_URL = 'https://qiita.com/'
def get_trend_items():
req = urllib.request.Request(QIITA_TOP_URL)
with urllib.request.urlopen(req) as res:
body = res.read()
soup = BeautifulSoup(body, "html.parser")
target_div = soup.select('div[data-hyperapp-app="Trend"]')[0]
trend_items = json.loads(target_div.get('data-hyperapp-props'))
return trend_items
Recommended Posts