[PYTHON] Mémo BeautifulSoup4

# list.html
<html>
  <head><title></title></head>
  <body>
    <a href="http://www.example.com/index.html" title="link title a">Example A</a>
    <a href="http://wwww.example.org/" title="link title b" target="_blank">Example B</a>
    <a href="http://www.example.net/" title="link title c">Example C</a>
  </body>
</html>
from bs4 import BeautifulSoup

soup = BeautifulSoup(open("list.html"))

link = soup.find("a")
print(link["title"])
# link title a
print(link["href"])
# http://www.example.com/index.html
print(link.string)
# Example A

link = soup.find("a", target="_blank")
print(link.string)
# Example B
print(link["title"])
# link title b
print(link["href"])
# http://wwww.example.org/

i = [ {"title": x["title"], "url": x["href"], "content": x.string } for x in soup.find_all("a")]
print(i)
# [{'content': 'Example A', 'url': 'http://www.example.com/index.html', 'title': 'link title a'}, {'content': 'Example B', 'url': 'http://wwww.example.org/', 'title': 'link title b'}, {'content': 'Example C', 'url': 'http://www.example.net/', 'title': 'link title c'}]

Recommended Posts

Mémo BeautifulSoup4
Mémo Raspberry-pi
Mémo Pandas
Mémo HackerRank
mémo python
mémo graphène
Mémo du flacon
Mémo Matplotlib
mémo pytest
mémo sed
Mémo Python
Installer Memo
mémo networkx
mémo python
mémo Tomcat
mémo de commande
Mémo du générateur.
mémo psycopg2
Mémo Python
Mémo SSH
Mémo: rtl8812
mémo pandas
Mémo Shell
Mémo Python
Mémo Pycharm
[Mémo] Comment utiliser BeautifulSoup4 (1) Afficher html
Sélénium, Phantomjs et BeautifulSoup4
Mémo de dévotion AtCoder (11/12)
[OpenCV] Mémo personnel
[Python] Mémo sur le dictionnaire
Mémo push PyPI
Note d'étude LPIC201
Mémo Jupyter Notebook
Mémo de virtualisation LPIC304
Mémo d'exécution ALDA
mémo débutant python (9.2-10)
youtube télécharger un mémo
Inu x Memo
Mémo d'apprentissage Django
Note d'étude LPIC101
mémo débutant python (9.1)
mémo Linux (ubuntu)
mémo de commande scp
Mémo Primer Flask
mémo céleri / kombu
qui commande mémo
mémo du didacticiel django
Mémo de base Flask
Mémo de commande Linux # 1
★ Mémo ★ Python Iroha
Mémo de reconnaissance du genre
Mémo de lecture d'image
[MEMO] [TERMINAL] Alacritty
Mémo de rotation 3D (1)
[Python] Mémo EDA
Mémo opérateur Python 3
Mémo d'introduction H2O.ai
mémo d'expression lambda
[Mémo] [terminal] xfce-terminal