[PYTHON] Belle note de soupe

document http://www.crummy.com/software/BeautifulSoup/bs4/doc/

BeautifulSoup


from bs4 import BeautifulSoup

soup = BeautifulSoup(raw) #raw correspond aux données de chargement de la page Web

#findAll:Récupère l'objet de la balise correspondante dans la liste
#Ci-dessous l'image de la classe-Obtenez tous les ul d'articles
ul_items = soup.findAll('ul',class_='image-items')

#find:Obtenez 1 objet avec la balise correspondante
a = item.find('a')
#Cela ressemble à ceci lorsque l'identifiant est spécifié
sample = soup.find(id='template-embed-sample')

#Obtenir la valeur d'attribut
#Obtenir la destination du lien de la balise a
link = a.attrs['href']

Objet BeautifulSoup obtenu par la méthode find? Parce qu'il contient les informations de l'enfant contenu Vous pouvez également obtenir ce qui suit

<div><span>hogehoge</span><div>

avoir hogehoge

div = soup.find('div')
span = div.find('span')#Trouvez le span dans le div
print(span.text)

Recommended Posts

Belle note de soupe
Belle soupe
Belles éclaboussures de soupe
Ma belle soupe (Python)
Gratter avec une belle soupe
Grattage de table avec belle soupe
Pratique de l'exploration avec Beautiful Soup
Essayez de gratter avec Python + Beautiful Soup
Un mémorandum lors de l'utilisation d'une belle soupe
Racler plusieurs pages avec Beautiful Soup
[Python] Un mémorandum de belle soupe4
Grattage avec Python et belle soupe
Gratter avec une belle soupe en 10 minutes
Grattage de site Web avec Beautiful Soup en Python
Mémo Raspberry-pi
Mémo Pandas
Mémo HackerRank
mémo python
mémo graphène
Mémo du flacon
mémo pyenv
Mémo Matplotlib
mémo pytest
mémo sed
Mémo Python
Installer Memo
Mémo BeautifulSoup4
mémo networkx
mémo python
mémo Tomcat
mémo de commande
Mémo du générateur.
mémo psycopg2
Mémo Python
Mémo SSH
[Python] Gratter une table avec Beautiful Soup
Mémo: rtl8812
mémo pandas
Mémo Shell
Mémo Python
Supprimez les balises HTML indésirables avec Beautiful Soup
Mémo Pycharm
Méthodes fréquemment utilisées de sélénium et de belle soupe
Comment rechercher des données HTML à l'aide de Beautiful Soup