Ich habe Selen beim Scraping mit Python zusammengefasst. Schaben macht ziemlich viel Spaß. Ich habe es für eine Vielzahl anderer Zwecke verwendet, z. B. zum Automatisieren des Einkaufens und zum Sammeln von Daten.
Windows10 Python Selenium Spezieller Browsertreiber, den Sie verwenden möchten (z. B. Chrome-Treiber)
Wenn Sie noch keine Python-Umgebung erstellt haben, klicken Sie auf hier. Wie man eine Umgebung für Python erstellt, wird veröffentlicht. (Windows-Version)
Wenn Sie bereits eine Python-Umgebung erstellt haben, installieren Sie bitte Selenium.
pip install selenium
Sie benötigen einen Treiber, der dem von Ihnen verwendeten Browser entspricht. (Beispiel: Chrome-Treiber)
Öffnen Sie Ihren Browser mit Selenium.
from selenium import webdriver
driver = webdriver.Chrome() #()Fahrer in_Pfad beschreiben
driver.get(URL)
driver.close()
driver.quit()
Öffnen Sie zunächst den Browser in der ersten Zeile Geben Sie in der zweiten Zeile die URL an, die Sie öffnen möchten Die dritte Zeile schließt die Seite Zeile 4 verlässt den Browser
driver_path ist ohne Beschreibung in Ordnung, wenn sich der Treiber im selben Verzeichnis befindet.
Als nächstes werden die Elemente erfasst, die zum Bedienen der Seite erforderlich sind. Ich benutze diese beiden oft.
id
get_id = driver.find_element_by_id (" ID in diese schreiben ")
Es wird empfohlen, da die ID sicher erhalten wird.
xpath
get_xpath = driver.find_element_by_xpath (" schreibe xpath in this ")
Da es sich oft ändert, wenn sich der Bildschirm ändert, schreibe ich den xpath jedes Mal neu.
Und wenn Sie es nicht bekommen können, weil es nicht in HTML ist, aber Sie diesen Wert wollen, wird empfohlen, es von js zu bekommen.
price = driver.execute_script (" beschreibe js Verarbeitung ")
Wenn Sie wie oben schreiben, erhalten Sie den Wert, der nicht auf dem Bildschirm angezeigt wird, sondern auf der js-Seite verarbeitet wird.
Es gibt Zeiten, in denen js es auch nicht hat, also habe ich keine andere Wahl, als zu diesem Zeitpunkt aufzugeben: Schweiß:
Wenn Sie auf eine Schaltfläche in einem Formular klicken möchten, können Sie mit "click ()" darauf klicken.
driver.find_elemnt_by_id ('ID in diese schreiben'). Klicken Sie auf ()
Sie können im obigen Vorgang auf das Schaltflächenelement klicken.
Oft kann ein Element nicht entfernt werden und es tritt ein Fehler auf. Verwenden Sie in diesem Fall "sleep ()" und warten Sie, bis der Bildschirm angezeigt wird.
Es gibt viele andere Möglichkeiten, Selen zu verwenden, aber ich habe diesen Artikel geschrieben, um Sie wissen zu lassen, was Sie tun können. Wenn Sie mehr Details erfahren möchten, lesen Sie bitte Artikel, die von anderen Personen verfasst wurden, und erweitern Sie Ihr Wissen. Und lassen Sie uns alles automatisieren!
https://kurozumi.github.io/selenium-python/installation.html https://qiita.com/nadechin/items/0a34e2182132cc1a821b
Recommended Posts