[PYTHON] Grattage au sélénium

Grattage de sites écrits dynamiquement avec du sélénium

S'il s'agit d'un site écrit en JS etc., vous ne pourrez peut-être pas le gratter avec Beautiful Soup. Le sélénium peut être utilisé dans de tels cas.

Obtenez le pilote Chrome

Vérifiez d'abord la version Chrome.

(Pour Mac)

  1. Chrome ouvert, cliquez sur "chrome" en haut à gauche de l'écran
  2. Cliquez sur "À propos de Google Chrome"
  3. Une page intitulée «Paramètres - À propos de Chrome» s'ouvrira et y sera affichée. Version: 8? Vérifiez la partie qui dit. ~ ~ ~ ~.

Obtenez le pilote Chrome sur la page de téléchargement.

Sur la page de téléchargement (https://chromedriver.chromium.org/downloads),

Dans la partie suivante, téléchargez le pilote chrome qui correspond à la version examinée ci-dessus. (Sélectionnez le système d'exploitation à la destination du lien de page.) スクリーンショット 2020-09-22 17.43.04.png

Comment utiliser

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import time

url="~~~~~~"#URL que vous souhaitez ouvrir ici
options = Options()
options.add_argument('--headless') #Activer le mode sans tête
Driver_path="~~~~~~" #Spécifiez l'emplacement où le pilote Chrome téléchargé est placé
driver = webdriver.Chrome(Driver_path,options=options)
driver.get(url)
time.sleep(2)
html = driver.page_source.encode('utf-8')
soup = BeautifulSoup(html, 'lxml')
#Après cela, vous pouvez l'utiliser normalement selon la grammaire de Beautiful Soup.

En ajoutant une option, la page ne peut pas être ouverte à chaque fois que driver.get est exécuté. (Cela accélérera un peu le processus.)

référence

Trois paramètres pour assurer un fonctionnement stable de Selenium (prend également en charge le mode sans tête)

Recommended Posts

Grattage au sélénium
Grattage au sélénium ~ 2 ~
Grattage avec du sélénium
Grattage réussi avec Selenium
Grattage avec du sélénium [Python]
Grattage au sélénium en Python
Grattage avec Selenium + Python Partie 1
Grattage avec du sélénium en Python
Grattage avec Selenium + Python Partie 2
Gratter la page i-town avec du sélénium
Grattage avec Python
Grattage avec Python
Scraping avec Selenium en Python (Basic)
Grattage avec Python, Selenium et Chromedriver
Commençant par Selenium
Pratiquer le web scraping avec Python et Selenium
Grattage en Python (préparation)
Essayez de gratter avec Python.
Grattage avec Python + PhantomJS
Grattage avec coquille tremblante
ScreenShot avec Selenium (édition Python)
Scraping avec Python + PyQuery
Gratter avec une belle soupe
Scraping RSS avec Python
Web scraping avec python + JupyterLab
Grattage avec chromedriver en python
Grattage festif avec Python, scrapy
Enregistrez des images avec le web scraping
Python: travailler avec Firefox avec du sélénium
sélénium
J'étais accro au grattage avec Selenium (+ Python) en 2020
Grattage Web facile avec Scrapy
Grattage avec Tor en Python
Web scraping avec Selenium (Python)
Scraping prévisions météorologiques avec python
Souvenirs de combats avec Selenium
Gratter la moyenne du Nikkei avec le dramaturge-python
Essayez Selenium Grid avec Docker
[Python + Selenium] Conseils pour le grattage
J'ai essayé de gratter avec du python
Web scraping débutant avec python
Grattage 1
Grattage de table avec belle soupe
Essayez de gratter avec Python + Beautiful Soup
Racler plusieurs pages avec Beautiful Soup
Scraping avec Node, Ruby et Python
Grattage WEB avec BeautifulSoup4 (page en couches)
Gratter le classement Web d'Alexa avec pyQuery
Résumé de la relation de grattage (sélénium, pyautogui)
Web scraping avec Python Première étape
J'ai essayé webScraping avec python.
Grattage avec Python et belle soupe
Gratter avec une belle soupe en 10 minutes
Des tests plus familiers avec Selenium
Faisons du scraping d'images avec Python
Obtenez les tendances Qiita avec le scraping Python
Mémo d'apprentissage "Scraping & Machine Learning avec Python"