requêtes python beautifulsoup glob find_all

Exemple de code 1 (spécifier l'URL)

python


import requests
from bs4 import BeautifulSoup

url = 'https://xxx'
r = requests.get(url)

soup = BeautifulSoup(r.text, 'html.parser')

#Afficher le texte de la balise p
tag_p = soup.find_all('p') 
for p in tag_p:
  print(p.text)

#---Ce qui suit est trouver_exemple de toute méthode(Idem pour la méthode find) ---
#Spécification d'attribut
ids = soup.find_all(id='sample')

#Spécification d'attribut(class)
clss = soup.find_all(class_='sample')

#Spécifiez le nom et les attributs de la balise
divs = soup.find_all('div', class_='sample')

#Balises multiples
tags = soup.find_all(['a', 'b', 'c'])

Exemple de code 2 (spécifiez un fichier)


from glob import glob
from bs4 import BeautifulSoup

#Lorsque vous ciblez des fichiers html dans le même répertoire
files = glob('*.htm')

for file in files:
  ff = open( file, 'r' ,encoding='utf-8' ).read() 
  soup = BeautifulSoup( ff ,'html.parser')

  #Afficher le texte de la balise p
  tag_p = soup.find_all('p')
  for p in tag_p:
    print(p.text)

Recommended Posts

requêtes python beautifulsoup glob find_all
Réessayer avec des requêtes python
Code d'état des requêtes Python
python sélénium chromedriver beautifulsoup
Viser les requêtes du maître de bibliothèque python (18)
Comment utiliser les requêtes (bibliothèque Python)
[Python] Fichiers wav POST avec requêtes [POST]
Obtenez la météo avec les requêtes Python
Obtenez la météo avec les requêtes Python 2
[Lambda] Activer les demandes d'importation [python]
Envoyer des données multipart / form avec des requêtes python