Es ist mühsam, Bilder aus der Bildsuche zu speichern und Bilder einzeln zu sammeln. Daher habe ich einen Treiber gefunden, nach dem ich suchen sollte, damit ich ihn mit meiner eigenen Zufriedenheit zusammenfassen kann.
Installieren Sie google_images_dwonload Seite ⇒
$pip install google_images_download
$pip install os
$pip install glob
$pip install chromedriver
Wird benötigt, also installieren Sie es. Wenn im Chromedriver keine Anwendung "chromedriver" vorhanden ist, https://chromedriver.chromium.org/downloads Laden Sie mehr herunter und speichern Sie sie in der chromedriver-Datei.
Das ist alles dazu
・ Pycharm ・ Python 3.7.4 ・ Windows10
Importanweisung
from google_images_download import google_images_download
import glob
import os
Inhalt Dieses Mal lautet das Suchwort "ONE OK ROCK". Setzen Sie limit = 100 und setzen Sie die Anzahl der Bilder auf 100.
config = {
"Records": [
{
"keywords": "ONE OK ROCK LIVE",
"no_numbering": True,
"limit": 100,
"output_directory": "images",
"image_directory": "ONE OK ROCK",
"chromedriver": "C\\[path to chromedirver]\chromedriver\chromedriver.exe",
}
]
}
Schreiben Sie den Pfad zum Chrome-Treiber fest.
response = google_images_download.googleimagesdownload()
for rc in config["Records"]:
response.download(rc)
Lassen Sie das GIF-Bild vorerst weg. (Weil es nervt)
gifImgs = glob.glob("images" + os.sep + "*" + os.sep + "*.gif")
print(f"removing gif files: {len(gifImgs)} files")
_ = [os.remove(f) for f in gifImgs]
Sie können es erhalten, indem Sie die oben genannten Schritte in der richtigen Reihenfolge ausführen.
Dieses Scraping ist gut zum Sammeln von Informationen und sehr praktisch. Es ist ganz anders, als ein Bild von einer Seite zu bekommen, deshalb werde ich darüber in einem separaten Artikel schreiben. Es ist nur kurz geschrieben, schauen Sie sich also die Details an.
Recommended Posts