[PYTHON] Enregistrement des actions à entreprendre lorsque google_image_download ne peut pas être utilisé
Contenu de cet article
--google_image_download n'a pas fonctionné, donc un mémo expliquant comment y faire face moi-même
-J'ai essayé de télécharger l'image des données de l'enseignant en me référant à cet article, mais google_image_download n'a pas fonctionné.
―― Après tout, il y avait une version modifiée sur Github, alors je lui ai dit que cela fonctionnait lorsque je l'ai téléchargé.
C'est presque une traduction japonaise de ce qui est écrit sur la page où se trouve la version modifiée ci-dessus.
environnement
- Python3.7
- Win10 64bit
- Firefox ver72.0.2
――Je ne sais pas quoi écrire d'autre
solution de contournement
- Si vous n'avez pas de pilote Firefox et gecko, installez
--Geckodriver peut accéder à la page de distribution depuis ici.
--Geckodriver met le chemin de la variable utilisateur.
- Si vous ne savez pas, reportez-vous à Ici.
- (Pour référence) Dans la variable d'environnement système, décrivez le chemin d'accès au dossier geckodriver qui a été déplacé vers le dossier d'installation de Firefox après la décompression.
- DL et décompressez GoogleImagesDownloader
-Vous pouvez le télécharger depuis ici.
- Utilisez le programme que vous souhaitez utiliser à partir du dossier de décompression.
--Je lance download_with_selenium.py
- Vous pouvez collecter des images avec vos mots préférés en réécrivant les mots-clés par 190 lignes du programme.
--Si vous obtenez une erreur user_agent, installez le module avec pip et cela fonctionnera.
- [Ce] module (https://pypi.org/project/user_agent/).
--J'ai installé le module avec le code suivant.
-
pip install user_agent
- Si tout va bien, Firefox démarrera dès que le programme sera exécuté et un dossier avec le nom du mot recherché sera créé dans le répertoire courant et téléchargé.
――Il semble que vous obteniez d'abord les URL en vrac, puis que vous téléchargiez les images.
――Ainsi, même si vous regardez le dossier, vous craindrez qu'il n'y ait pas d'images au début.
――Si vous attendez, l'image sera téléchargée.