[PYTHON] Erfolgreiches Schaben mit Selen

Schaben mit Selen

Ich habe es geschrieben, um die Anforderung zu erfüllen, dass alle 55 Seiten und 24 Produktbilder pro Seite erfasst werden müssen. Selen ist sehr praktisch. Wenn Sie den Produktnamen, die Produkt-URL und das Produktbild SRC auf Textbasis kennen, ist dies vorerst in Ordnung und daher sehr präzise.

seleniumer.py


import os, re
import time
from selenium import webdriver

DRIVER_PATH = os.path.join(os.path.dirname(__file__), 'chromedriver')
browser = webdriver.Chrome(DRIVER_PATH)
url = 'https://www.XXXXXXXX'
browser.get(url)

for i in range(56):
    try:
        img_list = []
        urls_list = []
        name_list = []

        for i in browser.find_elements_by_xpath('//*[@id="find-results"]/div/div/div/a[1]/img[1]'):
            imgs = i.get_attribute('src')
            img_list.append(imgs)

        for a in browser.find_elements_by_xpath('//*[@id="find-results"]/div/div/div/a[1]'):
            urls = a.get_attribute('href')
            urls_list.append(urls)

        for t in browser.find_elements_by_xpath('//*[@id="find-results"]/div/div/div/a/div/span[1]/span'):
            name = t.text
            name_list.append(name)

        for img_src, urls_href, name_title in zip(img_list, urls_list, name_list):
            print (name_title, urls_href, img_src, "\n+++++++++++++++++++++++++++++++++++++++++++++++++++")

        link_elem = browser.find_element_by_class_name('control-page-next-button')
        link_elem.click()

        time.sleep(3)
    except:
        print ('not found!')

browser.close()

Wenn Sie den in browser.find_elements_by_xpath verwendeten xpath herausfinden möchten, können Sie ihn aus COPY in Chrome einfügen. Ich war beeindruckt, dass es eine enorm nützliche Funktion hat.

Es scheint, dass die find_elements () -Methode umgedreht werden muss.

Recommended Posts

Erfolgreiches Schaben mit Selen
Schaben mit Selen
Schaben mit Selen ~ 2 ~
Schaben mit Selen
Schaben mit Selen [Python]
Schaben mit Selen in Python
Schaben mit Selen + Python Teil 1
Scraping mit Selen in Python
Schaben mit Selen + Python Teil 2
I-Town-Seite mit Selen abkratzen
Scraping mit Selen in Python (Basic)
Scraping mit Python, Selen und Chromedriver
Scraping mit Python
Scraping mit Python
Beginnend mit Selen
Üben des Web-Scrapings mit Python und Selen
Scraping in Python (Vorbereitung)
Versuchen Sie es mit Python.
Scraping mit Python + PhantomJS
Schaben mit kratzender Schale
Screenshot mit Selen (Python Edition)
Scraping mit Python + PyQuery
Kratzen mit schöner Suppe
Scraping von RSS mit Python
Ich war süchtig danach, 2020 mit Selen (+ Python) zu kratzen
Ich habe versucht, mit Python zu kratzen
Laden Sie Bilder automatisch mit Scraping herunter
Web Scraping mit Python + JupyterLab
Schaben mit Chromedriver in Python
Festliches Scraping mit Python, Scrapy
Speichern Sie Bilder mit Web Scraping
Python: Arbeiten mit Firefox mit Selen
Einfaches Web-Scraping mit Scrapy
Scraping mit Tor in Python
Web Scraping mit Selenium (Python)
Kratzwettervorhersage mit Python
Erinnerungen an den Kampf mit Selen
Schaben Nikkei Durchschnitt mit Dramatiker-Python
Probieren Sie Selenium Grid mit Docker aus
[Python + Selen] Tipps zum Scraping
Ich habe versucht, mit Python zu kratzen
Web Scraping Anfänger mit Python
Erfolgreiches update_with_media mit Twitter API
Tischkratzen mit schöner Suppe
[Python, Selenium, PhantomJS] Eine Geschichte beim Scrapen einer Website mit fauler Last
Versuchen Sie es mit Python + Beautiful Soup
Mehrere Seiten mit Beautiful Soup verschrotten
Scraping mit Node, Ruby und Python
Scraping von Alexas Web Rank mit pyQuery
Zusammenfassung der Kratzbeziehung (Selen, Pyautogui)
Web Scraping mit Python Erster Schritt
Ich habe versucht, WebScraping mit Python.
Kratzen mit Python und schöner Suppe
Selen
Kratzen mit schöner Suppe in 10 Minuten
Vertrauteres Testen mit Selen