Ich beschloss, aus irgendeinem Grund in meiner Arbeit zu kratzen, also versuchte ich es hastig.
sc.py
import urllib.request
import bs4
url = 'http://www.XXXXXX.jp'
html = urllib.request.urlopen(url)
soup = bs4.BeautifulSoup(html, 'html.parser')
title = soup.select('.lxl-inCateList ul li a dl dt')
price = soup.find_all("dd", class_="l-price")
for i in title:
a = (i.string)
print (a)
for i in price:
b = (i.string)
print (b)
Es ist eine Quelle, die nicht schön aussieht,
a = (i.string)
Auf diese Weise könnten unnötige HTML-Tags gelöscht werden.
soup.find_all("dd", class_="l-price")
Es ist sehr praktisch, Klassen besuchen zu können. Ich wünschte ich wüsste es früher ... Mit einem plötzlichen Bedarf wird die Aufgabe, "dies und das von der Site in einem Dokument zu sammeln", sofort einfacher.
Recommended Posts