python beautifulsoup fordert glob find_all an

Beispielcode 1 (URL angeben)

python


import requests
from bs4 import BeautifulSoup

url = 'https://xxx'
r = requests.get(url)

soup = BeautifulSoup(r.text, 'html.parser')

#Zeigen Sie den Text des p-Tags an
tag_p = soup.find_all('p') 
for p in tag_p:
  print(p.text)

#---Folgendes ist find_Beispiel aller Methoden(Gleiches gilt für die Suchmethode) ---
#Attributspezifikation
ids = soup.find_all(id='sample')

#Attributspezifikation(class)
clss = soup.find_all(class_='sample')

#Geben Sie den Tag-Namen und die Attribute an
divs = soup.find_all('div', class_='sample')

#Mehrere Tags
tags = soup.find_all(['a', 'b', 'c'])

Beispielcode 2 (Datei angeben)


from glob import glob
from bs4 import BeautifulSoup

#Beim Targeting von HTML-Dateien im selben Verzeichnis
files = glob('*.htm')

for file in files:
  ff = open( file, 'r' ,encoding='utf-8' ).read() 
  soup = BeautifulSoup( ff ,'html.parser')

  #Zeigen Sie den Text des p-Tags an
  tag_p = soup.find_all('p')
  for p in tag_p:
    print(p.text)

Recommended Posts

python beautifulsoup fordert glob find_all an
Wiederholen Sie den Vorgang mit Python-Anforderungen
Python Fordert den Statuscode an
Python Selen Chromedriver schöne Suppe
Richten Sie die Anforderungen des Python Library Master (18) aus
Verwendung von Anfragen (Python Library)
[Python] POST-WAV-Dateien mit Anforderungen [POST]
Holen Sie sich das Wetter mit Python-Anfragen
Holen Sie sich das Wetter mit Python-Anfragen 2
[Lambda] Importanforderungen aktivieren [Python]
Senden Sie mehrteilige / Formulardaten mit Python-Anforderungen