Laden Sie Bilder von der URL-Liste in Python herunter

Laden Sie Dateien von der URL-Liste in Python herunter

Im folgenden Artikel crawle ich eine bestimmte Website und habe eine Liste von URLs. Deshalb habe ich den Code zum Herunterladen geschrieben.

WEB-Scraping mit BeautifulSoup4 (Seriennummernseite)

WEB-Scraping (geschichtete Seite) mit BeautifulSoup4

Quelle

`simple_downloader.py`


# -*- coding: utf-8 -*-

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import requests, os

headers = { 'User-Agent' : 'Mozilla/5.0' }
cwd = os.getcwd()
result_dir = cwd + '/download/'
list_file = cwd + '/list.txt'
done_file = 'done.txt'
fail_file = 'fail.txt'

def fetchImage(url):
    path_relative = url.replace('http://', '').replace('https://', '')
    try:
        res = requests.get(url, headers = headers)
        image = res.content
        paths = os.path.split(path_relative)[0].split('/')
        path_current = result_dir
        for path in paths:
            path_current += path + '/'
            if not os.path.exists(path_current):
                os.mkdir(path_current)
        with open('{result_dir}{path_relative}'.format(result_dir = result_dir, path_relative = path_relative), 'wb') as f:
            f.write(image)
    except:
        return False
    return True

def getUrl():
    result = ''
    with open(list_file, 'r') as f:
        url_list = f.read().split('\n')
    result = url_list.pop(0)
    with open(list_file, 'w') as f:
        f.write('\n'.join(url_list))
    return result

def saveUrl(file_name, url):
    with open(file_name, 'a') as f:
        f.write(url + '\n')

def download():
    url = getUrl()
    while url != '':
        if fetchImage(url):
            saveUrl(done_file, url)
            print('done ' + url)
        else:
            saveUrl(fail_file, url)
            print('fail ' + url)
        url = getUrl()

download()

Referenzierte Site

Batch-Download von Bildern von einer bestimmten URL mit Python Modified Version [Python] Datei- / Verzeichnismanipulation

Recommended Posts

Laden Sie Bilder von der URL-Liste in Python herunter

Extrahieren Sie mit Python Text aus Bildern

Batch-Download-Bilder von einer bestimmten URL mit Python Modified-Version

Sortierte Liste in Python

Filterliste in Python

Paralleler Download mit Python

Die findähnliche Sache der Liste in Python

[Python] Laden Sie das Originalbild von der Google Bildsuche herunter

Laden Sie Bilder von der URL mit Pillow in Python 3

Massen-Download-Bilder von einer bestimmten URL mit Python

Wählen Sie zufällig Elemente aus der Liste (Array) in Python aus

Massen-Download-Bilder von einer bestimmten Site-URL mit Python

Base64-Codierung von Bildern in Python 3

OCR aus PDF in Python

So laden Sie Dateien von Selenium of Python in Chrome herunter

Abrufen von Listenelementen in Python

Relative URL-Verarbeitung in Python

Extrahieren Sie mehrere Listenduplikate in Python

Bildpixel-Manipulation in Python

Unterschied zwischen list () und [] in Python

Ausgabe 2017 Premium Friday List in Python

Laden Sie Bilder von "Irasutoya" mit Scrapy herunter

So sammeln Sie Bilder in Python

Laden Sie Google Drive-Dateien in Python herunter

Python / Machen Sie ein Diktat aus einer Liste.

Poste ein Bild von Python auf Tumblr

Python3> Liste aus iterierbarer> Liste erstellen (Bereich (5))

Löschen Sie mehrere Elemente in der Python-Liste

Arbeiten mit DICOM-Bildern in Python

Extrahieren Sie mit Python Zeichenfolgen aus Dateien

Laden Sie Python herunter

[Python] -Liste

Erhalten Sie Wechselkurse von offenen Wechselkursen in Python

Wenden Sie verschiedene Formen von Mosaiken auf Bilder an (Python, OpenCV).

Zeigen Sie eine Liste der Alphabete in Python 3 an

Wiederbelebt von "kein Internetzugang" in Python

Verhindern Sie den doppelten Start von cron in Python

Nehmen Sie die logische Summe von List in Python (Zip-Funktion)

Überprüfen Sie, ob die URL in Python vorhanden ist

Unterschied zwischen Anhängen und + = in der Python-Liste

Holen Sie sich den Batteriestand von SwitchBot mit Python

Zusammenfassung der integrierten Methoden usw. der Python-Liste

Generieren Sie eine Klasse aus einer Zeichenfolge in Python

Generieren Sie mit Python eine C-Sprache aus dem S-Ausdruck

Ruft die EDINET-Codeliste in Python ab

In Python von Markdown in HTML konvertieren

Holen Sie sich mit Python die Niederschlagswahrscheinlichkeit aus XML

Laden Sie Dateien in jedem Format mit Python herunter

Entfernen Sie DICOM-Bilder in Python

Lesen von Zeichen in Bildern mit Python OCR

[Python] Verstehen Sie die Slice-Operation der Liste in Sekunden

Abrufen des Metrikverlaufs von MLflow in Python

[Python] (Linie) Extrahieren Sie Werte aus Diagrammbildern

Extrahieren Sie alle n Elemente aus einem Array (einer Liste) in Python und Ruby

Erkennen Sie japanische Zeichen anhand von Bildern mithilfe der Cloud Vision-API von Google mit Python

Holen Sie sich mit Python Zeitreihendaten von k-db.com

Quadtree in Python --2

Python in der Optimierung

CURL in Python