Télécharger des images à partir de la liste d'URL en Python

Télécharger des fichiers à partir de la liste d'URL en Python

Dans l'article suivant, j'explore un site Web spécifique et j'ai une liste d'URL, j'ai donc écrit le code pour le télécharger.

Grattage WEB avec BeautifulSoup4 (page du numéro de série)

Grattage WEB (page en couches) avec BeautifulSoup4

La source

`simple_downloader.py`


# -*- coding: utf-8 -*-

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import requests, os

headers = { 'User-Agent' : 'Mozilla/5.0' }
cwd = os.getcwd()
result_dir = cwd + '/download/'
list_file = cwd + '/list.txt'
done_file = 'done.txt'
fail_file = 'fail.txt'

def fetchImage(url):
    path_relative = url.replace('http://', '').replace('https://', '')
    try:
        res = requests.get(url, headers = headers)
        image = res.content
        paths = os.path.split(path_relative)[0].split('/')
        path_current = result_dir
        for path in paths:
            path_current += path + '/'
            if not os.path.exists(path_current):
                os.mkdir(path_current)
        with open('{result_dir}{path_relative}'.format(result_dir = result_dir, path_relative = path_relative), 'wb') as f:
            f.write(image)
    except:
        return False
    return True

def getUrl():
    result = ''
    with open(list_file, 'r') as f:
        url_list = f.read().split('\n')
    result = url_list.pop(0)
    with open(list_file, 'w') as f:
        f.write('\n'.join(url_list))
    return result

def saveUrl(file_name, url):
    with open(file_name, 'a') as f:
        f.write(url + '\n')

def download():
    url = getUrl()
    while url != '':
        if fetchImage(url):
            saveUrl(done_file, url)
            print('done ' + url)
        else:
            saveUrl(fail_file, url)
            print('fail ' + url)
        url = getUrl()

download()

Site référencé

Téléchargement par lots d'images à partir d'une URL spécifique avec la version modifiée de python [Python] Manipulation de fichiers / répertoires

Recommended Posts

Télécharger des images à partir de la liste d'URL en Python

Extraire du texte d'images avec Python

Téléchargement par lots d'images à partir d'une URL spécifique avec la version modifiée de python

Liste triée en Python

Liste de filtres en Python

Téléchargement parallèle avec Python

La chose semblable à une recherche de liste en Python

[Python] Téléchargez l'image d'origine à partir de la recherche d'images Google

Charger des images à partir d'une URL à l'aide de Pillow dans Python 3

Télécharger en masse des images à partir d'une URL spécifique avec python

Sélectionnez au hasard des éléments dans la liste (tableau) en python

Télécharger en masse des images à partir d'une URL de site spécifique avec python

Encodage base64 des images en Python 3

OCR à partir de PDF en Python

Comment télécharger des fichiers depuis Selenium of Python dans Chrome

Obtenir des éléments de liste en Python

Traitement des URL relatives en python

Extraire plusieurs doublons de liste en Python

Manipulation des pixels d'image en Python

Différence entre list () et [] en Python

Sortie de la liste du vendredi Premium 2017 en Python

Télécharger des images de «Irasutoya» à l'aide de Scrapy

Obtenir des données de Quandl en Python

Comment collecter des images en Python

Téléchargez des fichiers Google Drive en Python

python / Créer un dict à partir d'une liste.

Publier une image de Python sur Tumblr

Python3> Générer une liste à partir de itérable> liste (plage (5))

Supprimer plusieurs éléments dans la liste python

Travailler avec des images DICOM en Python

Extraire des chaînes de fichiers avec Python

Télécharger Python

[Python] liste

Obtenez des taux de change à partir des taux de change ouverts en Python

Appliquer diverses formes de mosaïques aux images (Python, OpenCV)

Afficher une liste d'alphabets en Python 3

Relancé de "pas d'accès Internet" en Python

Empêcher le double lancement de cron en Python

Prenez la somme logique de List en Python (fonction zip)

Vérifiez si l'URL existe en Python

Différence entre append et + = dans la liste Python

Obtenez le niveau de la batterie de SwitchBot avec Python

Résumé des méthodes intégrées, etc. de la liste Python

Générer une classe à partir d'une chaîne en Python

Générer un langage C à partir d'une expression S avec Python

Obtenir la liste de codes EDINET en Python

Convertir de Markdown en HTML en Python

Obtenez la probabilité de précipitation de XML avec Python

Téléchargez des fichiers dans n'importe quel format en utilisant Python

Débarrassez-vous des images DICOM en Python

Lire des caractères dans des images avec Python OCR

[Python] Comprendre le fonctionnement des tranches de liste en quelques secondes

Obtenir l'historique des métriques de MLflow en Python

[Python] (Line) Extraire les valeurs des images graphiques

Extraire tous les n éléments d'un tableau (liste) en Python et Ruby

Détectez les caractères japonais à partir d'images à l'aide de l'API Cloud Vision de Google avec Python

Obtenez des données de séries chronologiques de k-db.com avec Python

Quadtree en Python --2

Python en optimisation

CURL en Python