https://yokonoji.work/python-scraping-6 https://qiita.com/akabei/items/0eac37cb852ad476c6b9
requests BeautifulSoup oauth2client gspread
Der Dienstkontoschlüssel für den Zugriff auf die Google-Tabelle ist wie auf der Referenzwebsite angegeben. Schreiben Sie ihn daher grob. m (_ _) m
↓ Auf der Baustelle https://console.developers.google.com/cloud-resource-manager
↓ ausführen --Erstelle ein Projekt
sample.py
import requests
import gspread
from bs4 import BeautifulSoup
from oauth2client.service_account import ServiceAccountCredentials
url = "<URL der Website zu erhalten>"
r = requests.get(url)
soup = BeautifulSoup(r.text, 'lxml')
elements = soup.select('<Tags, die Sie erhalten möchten>')#select()Da es eine Methode verwendet, kann es mit "CSS Selector" geschrieben werden.
scope = ['https://spreadsheets.google.com/feeds',
'https://www.googleapis.com/auth/drive']
credentials = ServiceAccountCredentials.from_json_keyfile_name('<Heruntergeladener JSON-Dateiname>', scope)
gc = gspread.authorize(credentials)
wks = gc.open('<Name der Tabelle>').sheet1
for index, e in enumerate(elements):
num = index + 1 #Da die Tabellenkalkulationsnummer keine "0" enthält, fügen Sie zuerst 1 hinzu
wks.update_acell('A'+str(num) , e.get_text())
Recommended Posts