[PYTHON] [Memo] Verwendung von BeautifulSoup4 (1) HTML anzeigen

Kratzen mit schöner Suppe auf jupyter Notizbuch.

In [1] Schöne Suppe importieren

In[1]


from bs4 import BeautifulSoup

Speichern Sie in [2] das HTML des Artikels, den Sie kratzen möchten, in der Variablen kiji

In[2]


kiji = """<html>
        <head>
           <title>Ich habe es auf Qiita gepostet</title>
        </head>
        <body>
           <p class="title">
              <b>Fordern Sie Qiita zur Ausgabe heraus.</b>
           </p>
        <p class="article">
              <b>Ich werde mein Bestes geben, um einen Artikel zu schreiben.</b>
           </p>
        </body>
   </html>"""

Schreiben Sie den HTML-Code, den Sie zwischen "" und "" speichern möchten.

In [3] Laden Sie das in der Variablen kiji gespeicherte HTML in BeautifulSoup.

In[3]


soup = BeautifulSoup(kiji,"html.parser")

Schreiben Sie BeautifulSoup (Variable mit gespeichertem HTML, "Parser (Analysator), den Sie verwenden möchten"). Diesmal ist es (kiji, "html.parser"). Vergessen Sie nicht, den Parser in "" einzuschließen oder zu schreiben. Wie htmlparser.

Verwenden Sie In [4] Suppe mit Prettify, um die Sichtbarkeit zu verbessern.

In[4]


print(soup.prettify())

Durch die Verwendung von prettify () wird es geschichtet und ist leicht zu sehen.

In [4] Ausgabeergebnis

In[4]


<html>
 <head>
  <title>
Ich habe es auf Qiita gepostet
  </title>
 </head>
 <body>
  <p class="title">
   <b>
Fordern Sie Qiita zur Ausgabe heraus.
   </b>
  </p>
  <p class="article">
   <b>
Ich werde mein Bestes geben, um einen Artikel zu schreiben.
   </b>
  </p>
 </body>
</html>

In [5] Titel anzeigen

In[5]


print(soup.html.head.title)

In[5]Ausgabeergebnis


<title>Ich habe es auf Qiita gepostet</title>

Recommended Posts

[Memo] Verwendung von BeautifulSoup4 (1) HTML anzeigen
[Memo] Verwendung von Beautiful Soup4 (2) Zeigen Sie die Artikelüberschrift mit Anfragen an
[Memo] Verwendung von BeautifulSoup4 (3) Zeigen Sie die Artikelüberschrift mit class_ an
Verwendung von cron (persönliches Memo)
[Memo] Verwendung von Google MµG
Wie benutzt man Python-Shell
Hinweise zur Verwendung von tf.data
Verwendung von virtualenv
Wie benutzt man Seaboan?
Wie man Shogun benutzt
Verwendung von Pandas 2
Verwendung von Virtualenv
Verwendung von numpy.vectorize
Verwendung von pytest_report_header
Wie man teilweise verwendet
Wie man Bio.Phylo benutzt
Verwendung von SymPy
Wie man x-means benutzt
Verwendung von WikiExtractor.py
Verwendung von IPython
Verwendung von virtualenv
Wie benutzt man Matplotlib?
Verwendung von iptables
Wie benutzt man numpy?
Verwendung von TokyoTechFes2015
Wie benutzt man venv
Verwendung des Wörterbuchs {}
Wie benutzt man Pyenv?
Verwendung der Liste []
Wie man Python-Kabusapi benutzt
Verwendung von OptParse
Verwendung von return
Wie man Imutils benutzt
Verwendung von Qt Designer
Verwendung der Suche sortiert
[gensim] Verwendung von Doc2Vec
python3: Verwendung der Flasche (2)
Hinweise zur Verwendung von AIST Spacon ABCI
Verstehen Sie, wie man Django-Filter verwendet
Verwendung des Generators
Hinweise zur Verwendung beim Kombinieren von pandas.DataFrame
[Python] Verwendung von Liste 1
Verwendung von FastAPI ③ OpenAPI
Wie benutzt man Python Argparse?
Verwendung von IPython Notebook
Wie man Pandas Rolling benutzt
[Hinweis] Verwendung von virtualenv
Verwendung von Redispy-Wörterbüchern
Python: Wie man pydub benutzt
[Python] Verwendung von checkio
[Go] Verwendung von "... (3 Perioden)"
So bedienen Sie GeoIp2 von Django
[Python] Verwendung von input ()
Wie benutzt man den Dekorateur?
[Einführung] Verwendung von open3d
Wie benutzt man Python Lambda?
So verwenden Sie Jupyter Notebook