Schaben mit Chromedriver in Python

Umgebung

Was du machen willst

Zum Schaben von Webartikeln, die gegen Schaben sind Ich möchte mit dem Chrome-Treiber ohne Kopf mit Python kratzen

Vorausgesetztes Wissen

  1. Über den Browsertreiber Kurz gesagt, es scheint ein notwendiges Werkzeug zu sein, um den Browser mit CUI anstelle von GUI zu handhaben.

  2. Beziehung zwischen DNS-Server und lokalen Hosts Wenn wir über einen Browser vom Domänennamen aus zugreifen, werden die DNS-Server nach diesen Informationen gefragt, als IP-Adresse zurückgegeben und der PC verwendet sie, um auf die Website zuzugreifen, und die Website wird mit dem Browser angezeigt. Wenn Sie jedoch die Domäne und die IP-Adresse in die Hosts-Datei des Mac einfügen, können Sie die IP-Adresse abrufen, ohne eine Verbindung zum DNS-Server herzustellen.

Referenzartikel [Selenium- und Google-Tabellen (4) "Bis Sie Chrome Driver verwenden" (https://bitwave.showcase-tv.com/selenium%E3%81%A8google-spreadsheets4-%E3%80%8Cchrome-driver%E3 % 82% 92% E4% BD% BF% E3% 81% 84% E3% 81% AF% E3% 81% 98% E3% 82% 81% E3% 82% 8B% E3% 81% BE% E3% 81 % A7% E7% B7% A8% E3% 80% 8D /) Dieser Artikel über DNS-Server, [Abbildung] Was ist ein DNS-Server? Einstellen / Ändern und Überprüfen Dieser Artikel wird für Hosts-Dateien empfohlen. So schreiben / bearbeiten Sie Hosts-Dateien auf dem Mac neu! Was soll ich tun, wenn es nicht reflektiert wird?

Vorbereitung

Überprüfen Sie den Inhalt der Hosts-Datei

Öffne die Datei.

$sudo vi /etc/hosts

Überprüfen Sie als Nächstes, ob der Inhalt der Hosts-Datei folgendermaßen aussieht.

##
# Host Database
#
# localhost is used to configure the loopback interface
# when the system is booting.  Do not change this entry.
##
127.0.0.1       localhost
255.255.255.255 broadcasthost
::1             localhost

Installieren Sie außerdem dieselbe Treiberversion wie die in der Anwendung enthaltene Chrome-Version von der Selenium-Site. (In meinem Fall war es 78.0.3904.97.) ChromeDriver - WebDriver for Chrome

Quellcode

# -*- coding:utf-8 -*-
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
if __name__ == '__main__':
    base = "Scraped Site URL"
    options = Options()
    #kopflose Bezeichnung
    options.add_argument('--headless')
    driver = webdriver.Chrome(executable_path='Absoluter Pfad zu dem Verzeichnis, in dem sich der Chrome-Treiber befindet', chrome_options=options)
    driver.get(url)
    #Kodieren
    html = driver.page_source.encode('utf-8')
    #Instanziierung
    soup = BeautifulSoup(html, 'html.parser')

Normalerweise benutze ich urllib.request Es kann möglich sein, es zu lösen, indem dieses Selen für Stellen verwendet wird, die gegen Schaben sind !

Recommended Posts

Schaben mit Chromedriver in Python
Schaben mit Selen in Python
Scraping mit Selen in Python
Scraping mit Tor in Python
Scraping mit Python
Scraping mit Python
Scraping mit Selen in Python (Basic)
Scraping mit Python, Selen und Chromedriver
Scraping in Python (Vorbereitung)
Versuchen Sie es mit Python.
Scraping mit Python + PhantomJS
Schaben mit Selen [Python]
Scraping mit Python + PyQuery
Scraping von RSS mit Python
Erreichen Sie das Scraping mit Python & CSS Selector in 1 Minute
Ich habe versucht, mit Python zu kratzen
Web Scraping mit Python + JupyterLab
Schaben mit Selen + Python Teil 1
Betreiben Sie LibreOffice mit Python
Festliches Scraping mit Python, Scrapy
Debuggen mit pdb in Python
Umgang mit Sounds in Python
Tweet mit Bild in Python
Kombiniert mit Ordnungszahl in Python
Kratzwettervorhersage mit Python
Schaben mit Selen + Python Teil 2
Ich habe versucht, mit Python zu kratzen
Web Scraping Anfänger mit Python
Ich war süchtig danach, 2020 mit Selen (+ Python) zu kratzen
[Scraping] Python-Scraping
Zahlenerkennung in Bildern mit Python
Versuchen Sie es mit Python + Beautiful Soup
Testen mit Zufallszahlen in Python
Scraping mit Node, Ruby und Python
GOTO in Python mit erhabenem Text 3
Arbeiten mit LibreOffice in Python: Importieren
CSS-Analyse mit cssutils in Python
Web Scraping mit Python Erster Schritt
Ich habe versucht, WebScraping mit Python.
Kratzen mit Python und schöner Suppe
Numer0n mit Elementen, die mit Python erstellt wurden
Öffnen Sie UTF-8 mit Stückliste in Python
Kratzen mit schöner Suppe in 10 Minuten
Verwenden Sie rospy mit virtualenv in Python3
Lassen Sie uns mit Python Image Scraping durchführen
Verwenden Sie Python in pyenv mit NeoVim
Heatmap mit Dendrogramm in Python + Matplotlib
Holen Sie sich Qiita-Trends mit Python-Scraping
Lesen Sie Dateien parallel zu Python
Passwort für Lehrbuch mit Python generieren
Verwenden Sie OpenCV mit Python 3 in Window
Bis zum Umgang mit Python in Atom
"Scraping & maschinelles Lernen mit Python" Lernnotiz
Beginnen Sie mit Python mit Blender
Holen Sie sich Wetterinformationen mit Python & Scraping
Arbeiten mit DICOM-Bildern in Python
Versuchen Sie, COVID-19 Tokyo-Daten mit Python zu kratzen
Holen Sie sich mit Python zusätzliche Daten zu LDAP