Kratzen mit schöner Suppe auf jupyter Notizbuch.
In [1] Schöne Suppe importieren
In[1]
from bs4 import BeautifulSoup
Speichern Sie in [2] das HTML des Artikels, den Sie kratzen möchten, in der Variablen kiji
In[2]
kiji = """<html>
<head>
<title>Ich habe es auf Qiita gepostet</title>
</head>
<body>
<p class="title">
<b>Fordern Sie Qiita zur Ausgabe heraus.</b>
</p>
<p class="article">
<b>Ich werde mein Bestes geben, um einen Artikel zu schreiben.</b>
</p>
</body>
</html>"""
Schreiben Sie den HTML-Code, den Sie zwischen "" und "" speichern möchten.
In [3] Laden Sie das in der Variablen kiji gespeicherte HTML in BeautifulSoup.
In[3]
soup = BeautifulSoup(kiji,"html.parser")
Schreiben Sie BeautifulSoup (Variable mit gespeichertem HTML, "Parser (Analysator), den Sie verwenden möchten"). Diesmal ist es (kiji, "html.parser"). Vergessen Sie nicht, den Parser in "" einzuschließen oder zu schreiben. Wie htmlparser.
Verwenden Sie In [4] Suppe mit Prettify, um die Sichtbarkeit zu verbessern.
In[4]
print(soup.prettify())
Durch die Verwendung von prettify () wird es geschichtet und ist leicht zu sehen.
In [4] Ausgabeergebnis
In[4]
<html>
<head>
<title>
Ich habe es auf Qiita gepostet
</title>
</head>
<body>
<p class="title">
<b>
Fordern Sie Qiita zur Ausgabe heraus.
</b>
</p>
<p class="article">
<b>
Ich werde mein Bestes geben, um einen Artikel zu schreiben.
</b>
</p>
</body>
</html>
In [5] Titel anzeigen
In[5]
print(soup.html.head.title)
In[5]Ausgabeergebnis
<title>Ich habe es auf Qiita gepostet</title>
Recommended Posts