Es ist ein Memorandum zum Zeitpunkt des Web-Scribing mit Python.
from bs4 import BeautifulSoup
import reuest
import os
"""Proxy-Unterstützung"""
os.environ["https_proxy"] = "http://xxx.xx.xx.xx:8080"
url = "https://www.python.org/"
html = requests.get(url)
soup = BeautifulSoup(html.text, "lxml")
print(soup)
print("----------------------------------------------")
# python.Wenn Sie nur die Zeichenfolge in org erhalten möchten
name = soup.find_all("div", class_="introduction")
# name = soup.find_all("div", {"class": "introduction"}Kann beschrieben werden als.
name = name[0].text
print(name)
title = soup.find_all("title")
title = title[0].text
print(title)
Ergebnis
Python is a programming language that lets you work quickly and integrate systems more effectively. Learn More
Welcome to Python.org
Recommended Posts