[PYTHON] A étudié le problème que plus de 101 images ne pouvaient pas être acquises avec le téléchargement de Google Images
J'ai pu obtenir de nombreux exemples d'images en me référant à ce qui suit
Le téléchargement de l'image Google n'a pas fonctionné, il correspond donc
Je vais créer des données sur les enseignants oncle, je ne sais pas si c'est 100, donc je veux environ 1000 images
Donc je débogue ~~
Pas bien
J'ai essayé de le déboguer correctement pour le moment, mais ce problème est une combinaison de plusieurs problèmes
- Erreur due à un statut d'encodage html différent qui peut être obtenu entre la lecture normale et son obtention avec chromedriver
- Si le nombre est de 100 ou moins, le problème est résolu en divisant le comportement entre 101 ou plus.
- Lors du contrôle automatique du chrome avec chromedriver, je fais défiler l'écran et lis les nouvelles images les unes après les autres, mais le bouton "Afficher plus de résultats" apparaît sur la troisième charge paresseuse. Il y a un code pour appuyer sur ce bouton, mais cela n'a pas fonctionné en raison d'un changement de spécification du côté google
- Résolu en spécifiant correctement l'élément DOM
- Le HTML de la recherche d'image stocke diverses informations du résultat de la recherche sous la forme d'un tableau javascript, et google images download json le décode, mais les spécifications côté google (je ne sais pas si elles sont modifiées), L'URL de l'image d'origine lors du chargement différé est gérée sur js et seules les vignettes sont dessinées en HTML, donc même si le chargement différé est effectué au maximum, seuls les 100 premiers cas sont analysés même si seule la source HTML est analysée. Je ne peux pas prendre l'image d'origine
- Je sens que je peux le faire, mais cela semble assez difficile
Donc, je suis arrivé à la conclusion que cela semble impossible, donc je vais le mettre en attente une fois.Si vous voulez 101 ou plus, il semble préférable de frapper l'autre.
Disons simplement que vous connaissez les détails