[PYTHON] Mehrere Seiten mit Beautiful Soup verschrotten

In Eile gab es eine Anfrage zum Speichern von Daten, die mehrere Seiten in einer Datenbank umfassen, und so schrieb ich sie in Eile. CSS-Selektoren sind tödlich nützlich, nicht wahr?

Die aktuelle Situation

scl.py


import requests, os, re, csv, bs4
import sqlite3
import lxml.html

a = 0
i = 0

url = 'https://www.〜'

while a < 55:
    a += 1
    
    res = requests.get(url)
    res.raise_for_status()
    soup = bs4.BeautifulSoup(res.text, 'lxml')


    for u in soup.select('.plan-module > .plan-link.plan-image-container'):
        urls = 'https://www.〜' + u.attrs['href']

        #print (urls)

        con = sqlite3.connect('url.db')
        c = con.cursor()
        c.execute('''CREATE TABLE IF NOT EXISTS urldata(urls unique)''')
        c.execute('INSERT INTO urldata VALUES (?)',[urls])
        con.commit()
        con.close()

    i += 1
    url = 'https://www.〜?=' + str(i)


print ('success')

Es stellte sich jedoch heraus, dass die Paginierung ein dynamisches Element ist und ohne Verwendung von Selen nutzlos ist.

Recommended Posts

Mehrere Seiten mit Beautiful Soup verschrotten
Kratzen mit schöner Suppe
Tischkratzen mit schöner Suppe
Versuchen Sie es mit Python + Beautiful Soup
Kratzen mit Python und schöner Suppe
Kratzen mit schöner Suppe in 10 Minuten
Website-Scraping mit Beautiful Soup in Python
Sortieren Sie Anime-Gesichter, indem Sie Anime-Charakterseiten mit Beautiful Soup und Selenium abkratzen
Krabbeltraining mit schöner Suppe
Schöne Suppe
[Python] Eine Tabelle mit Beautiful Soup kratzen
Entfernen Sie unerwünschte HTML-Tags mit Beautiful Soup
Schaben mit Selen
Scraping mit Python
Scraping mit Python
Schöne Suppe Memo
Schöne Suppe verschüttet
Schaben mit Selen
Schreiben Sie einen einfachen kopflosen Web-Scraping-Bot in Python mit Beautiful Soup 4
Erfolgreiches Schaben mit Selen
Mehrfachauswahl mit Jupyter
Scraping in Python (Vorbereitung)
Versuchen Sie es mit Python.
Scraping mit Python + PhantomJS
Meine schöne Suppe (Python)
Schaben mit kratzender Schale
Ich habe mit Python verschiedene Dinge ausprobiert: Schaben (Beautiful Soup + Selenium + PhantomJS) und morphologische Analyse
Schaben mit Selen [Python]
Beachten Sie, dass ich mich mit HTML in Beautiful Soup befasst habe
Scraping mit Python + PyQuery
[Python] Löschen Sie, indem Sie ein Tag mit Beautiful Soup angeben
Scraping von RSS mit Python
Scraping von Google News-Suchergebnissen in Python (2) Verwenden Sie Beautiful Soup
Ich habe versucht, mit Python zu kratzen
Laden Sie Bilder automatisch mit Scraping herunter
Web Scraping mit Python + JupyterLab
Schaben mit Selen in Python
Schaben mit Selen + Python Teil 1
Schaben mit Chromedriver in Python
Multiple Regressionsanalyse mit Keras
Festliches Scraping mit Python, Scrapy
Speichern Sie Bilder mit Web Scraping
Scraping mit Selen in Python
Einfaches Web-Scraping mit Scrapy
Scraping mit Tor in Python
Kratzwettervorhersage mit Python
Schaben Nikkei Durchschnitt mit Dramatiker-Python
Schaben mit Selen + Python Teil 2
Rufen Sie die URL des Linkziels ab, indem Sie den Textsatz mit Python Scraping (Beautiful Soup) + XPath angeben
Ich habe versucht, mit Python zu kratzen
Web Scraping Anfänger mit Python
Animieren Sie mehrere Diagramme mit matplotlib
Steuern Sie mehrere Roboter mit jupyter-lab
I-Town-Seite mit Selen abkratzen