Dies ist der erste Beitrag. Vielen Dank.
Ich versuche meine eigene Seite zu kratzen. Daten abgerufen
<div class="st-kaiwa-hukidashi">Zielzeichenfolge</div>
<div class="st-kaiwa-hukidashi2">Zielzeichenfolge</div>
Ich möchte nur die "Zielzeichenfolge" von behalten.
Deshalb,
for num in ["", "2"]:
kaiwa = "div.st-kaiwa-hukidashi{}" .format(num)
talk = soup.select(kaiwa)
for s in talk :
trash = "<div class={}>".format(kaiwa)
t = s.text.replace("trash" , '')
print(t)
Bei der Ausführung konnte ich nur die "Zielzeichenfolge" sauber extrahieren.
In diesem Code
<div class="st-kaiwa-hukidashi">
<div class="st-kaiwa-hukidashi2">
Ich hatte vor, nur zu entfernen
</div>
Es sieht so aus, als ob es ersetzt wurde.
Die einleitende Frage tut mir leid, aber ich möchte, dass Sie mir beibringen, warum __ Warum wird sie durch '' bis </ div> __ ersetzt.
Vielen Dank.
Recommended Posts