Télécharger des images à partir de la liste d'URL en Python

Télécharger des fichiers à partir de la liste d'URL en Python

Dans l'article suivant, j'explore un site Web spécifique et j'ai une liste d'URL, j'ai donc écrit le code pour le télécharger.

Grattage WEB avec BeautifulSoup4 (page du numéro de série)

Grattage WEB (page en couches) avec BeautifulSoup4

La source

simple_downloader.py


# -*- coding: utf-8 -*-

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import requests, os

headers = { 'User-Agent' : 'Mozilla/5.0' }
cwd = os.getcwd()
result_dir = cwd + '/download/'
list_file = cwd + '/list.txt'
done_file = 'done.txt'
fail_file = 'fail.txt'

def fetchImage(url):
    path_relative = url.replace('http://', '').replace('https://', '')
    try:
        res = requests.get(url, headers = headers)
        image = res.content
        paths = os.path.split(path_relative)[0].split('/')
        path_current = result_dir
        for path in paths:
            path_current += path + '/'
            if not os.path.exists(path_current):
                os.mkdir(path_current)
        with open('{result_dir}{path_relative}'.format(result_dir = result_dir, path_relative = path_relative), 'wb') as f:
            f.write(image)
    except:
        return False
    return True

def getUrl():
    result = ''
    with open(list_file, 'r') as f:
        url_list = f.read().split('\n')
    result = url_list.pop(0)
    with open(list_file, 'w') as f:
        f.write('\n'.join(url_list))
    return result

def saveUrl(file_name, url):
    with open(file_name, 'a') as f:
        f.write(url + '\n')

def download():
    url = getUrl()
    while url != '':
        if fetchImage(url):
            saveUrl(done_file, url)
            print('done ' + url)
        else:
            saveUrl(fail_file, url)
            print('fail ' + url)
        url = getUrl()

download()

Site référencé

Téléchargement par lots d'images à partir d'une URL spécifique avec la version modifiée de python [Python] Manipulation de fichiers / répertoires

Recommended Posts

Télécharger des images à partir de la liste d'URL en Python
Extraire du texte d'images avec Python
Téléchargement par lots d'images à partir d'une URL spécifique avec la version modifiée de python
Liste triée en Python
Liste de filtres en Python
Téléchargement parallèle avec Python
La chose semblable à une recherche de liste en Python
[Python] Téléchargez l'image d'origine à partir de la recherche d'images Google
Charger des images à partir d'une URL à l'aide de Pillow dans Python 3
Télécharger en masse des images à partir d'une URL spécifique avec python
Sélectionnez au hasard des éléments dans la liste (tableau) en python
Télécharger en masse des images à partir d'une URL de site spécifique avec python
Encodage base64 des images en Python 3
OCR à partir de PDF en Python
Comment télécharger des fichiers depuis Selenium of Python dans Chrome
Obtenir des éléments de liste en Python
Traitement des URL relatives en python
Extraire plusieurs doublons de liste en Python
Manipulation des pixels d'image en Python
Différence entre list () et [] en Python
Sortie de la liste du vendredi Premium 2017 en Python
Télécharger des images de «Irasutoya» à l'aide de Scrapy
Obtenir des données de Quandl en Python
Comment collecter des images en Python
Téléchargez des fichiers Google Drive en Python
python / Créer un dict à partir d'une liste.
Publier une image de Python sur Tumblr
Python3> Générer une liste à partir de itérable> liste (plage (5))
Supprimer plusieurs éléments dans la liste python
Travailler avec des images DICOM en Python
Extraire des chaînes de fichiers avec Python
Télécharger Python
[Python] liste
Obtenez des taux de change à partir des taux de change ouverts en Python
Appliquer diverses formes de mosaïques aux images (Python, OpenCV)
Afficher une liste d'alphabets en Python 3
Relancé de "pas d'accès Internet" en Python
Empêcher le double lancement de cron en Python
Prenez la somme logique de List en Python (fonction zip)
Vérifiez si l'URL existe en Python
Différence entre append et + = dans la liste Python
Obtenez le niveau de la batterie de SwitchBot avec Python
Résumé des méthodes intégrées, etc. de la liste Python
Générer une classe à partir d'une chaîne en Python
Générer un langage C à partir d'une expression S avec Python
Obtenir la liste de codes EDINET en Python
Convertir de Markdown en HTML en Python
Obtenez la probabilité de précipitation de XML avec Python
Téléchargez des fichiers dans n'importe quel format en utilisant Python
Débarrassez-vous des images DICOM en Python
Lire des caractères dans des images avec Python OCR
[Python] Comprendre le fonctionnement des tranches de liste en quelques secondes
Obtenir l'historique des métriques de MLflow en Python
[Python] (Line) Extraire les valeurs des images graphiques
Extraire tous les n éléments d'un tableau (liste) en Python et Ruby
Détectez les caractères japonais à partir d'images à l'aide de l'API Cloud Vision de Google avec Python
Obtenez des données de séries chronologiques de k-db.com avec Python
Quadtree en Python --2
Python en optimisation
CURL en Python