Comment gérez-vous la limite de temps de Colab? Je pense que de nombreux pionniers se sont automatiquement connectés à colab et ont lutté pour éviter les règles des 90 minutes et des 12 heures. La solution la plus réaliste est peut-être celle de l'article ci-dessous. [Connexion entièrement automatique] Résolution du problème de 90 minutes / 12 heures avec uniquement le fichier Colaboratory [Utilisation de Selenium] Je pense qu'il existe différentes méthodes, mais je pense que le premier goulot d'étranglement est la connexion à Google. Cet article l'ignore en demandant au sélénium de charger un profil utilisateur connecté. J'ai également essayé de me référer à cet article, mais je suis resté coincé dans la création d'un profil utilisateur pour Ubuntu chrome. L'article ci-dessus semble avoir fonctionné sur Mac OS, mais il semble que ce n'était pas possible avec UserProfile de Mac, j'ai donc démarré Ubuntu sur Docker et créé UserProfile qui s'est connecté à Chrome (Pour plus de détails, voir Voir l'article ci-dessus). Cet article s'adresse donc aux personnes suivantes. ・ Il n'y a qu'un environnement Windows en premier lieu ・ Je ne suis pas sûr de Docker
Le bloc-notes Colab créé cette fois sera ici. Si vous exécutez la cellule par le haut, vous pouvez (devriez) accéder à la connexion Google.
Cette fois, je n'arrivais parfois pas à me connecter en raison des problèmes suivants. J'ai créé un autre compte et j'ai pu me connecter, mais veuillez me faire savoir s'il existe une solution.
Les deux articles suivants ont été mentionnés cette fois. [1] [Connexion entièrement automatique] Résolution du problème de 90 minutes / 12 heures avec uniquement le fichier Colaboratory [Utilisation de Selenium] [2] Poème sur le sélénium sur les techniques de collaboration et d'évitement des limites de temps [1] est l'article ci-dessus, mais [2] a du mal à passer la certification de Google au sein de colab. En sélénium, c'est une option au démarrage
"--user-data-dir=dir_path"
Si vous spécifiez, UserProfile sera créé dans ce répertoire. Cette fois, j'ai réussi à me connecter à Google dans Colab par la méthode de [2] et à enregistrer le profil utilisateur.
En regardant le code source de la personne qui a écrit l'article dans [2], La commande était "Entrez l'adresse e-mail-> Entrez le mot de passe-> Entrez l'exemple de chaîne de caractères squishy", mais à partir du 9 mai 2020, vous deviez authentifier la chaîne de caractères squishy immédiatement après avoir entré l'adresse e-mail. De plus, lorsque je l'ai essayé moi-même cette fois, on m'a également demandé une authentification SMS pour le téléphone. Probablement, le processus de connexion continuera d'être différent en raison des changements dans les spécifications du système d'authentification de Google.
La fonction de sélénium la plus utilisée pour créer ce code est ・ Webdriver.save_screenshot () ・ Webdriver.page_source (Webdriver est une instance). La première est une fonction qui enregistre une capture d'écran de la page actuellement affichée. Il peut également être utilisé en mode sans tête, ce qui est utile pour vérifier ce qui est affiché à ce moment-là. La seconde est d'obtenir la source html de la page. En vérifiant la capture d'écran et en voyant s'il s'agit de la page cible, je pense que ce sera d'une manière ou d'une autre si vous recherchez le formulaire de saisie et le bouton en jetant un coup d'œil sur html.
Ayons une bonne vie de corab! !!
Recommended Posts