Das Scraping wird mit Selen in Python durchgeführt.
MacOSX10.11.1
Xvfb und mehr benötigt Referenz: Erstellung einer CentOS6.4 + Selenium-Umgebung
$ sudo pip install selenium
Die Bibliothek muss separat installiert werden.
$ sudo pip install pyvirtualdisplay
http://stackoverflow.com/questions/26070834/how-to-fix-selenium-webdriverexception-the-browser-appears-to-have-exited-befor
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
#Bei Verwendung von pyvirtualdisplay
from pyvirtualdisplay import Display
display = Display(visible=0, size=(1024, 768))
display.start()
driver = webdriver.Firefox()
Später, wenn das Skript unter Linux (CentOS) ausgeführt wird FireFox ist bequemer (einfacher), daher verwende ich FireFox.
url = "http://google.com"
driver.get(url)
driver.close()
#Bei Verwendung von pyvirtualdisplay
display.stop()
Recommended Posts