Laden Sie Bilder von der URL-Liste in Python herunter

Laden Sie Dateien von der URL-Liste in Python herunter

Im folgenden Artikel crawle ich eine bestimmte Website und habe eine Liste von URLs. Deshalb habe ich den Code zum Herunterladen geschrieben.

WEB-Scraping mit BeautifulSoup4 (Seriennummernseite)

WEB-Scraping (geschichtete Seite) mit BeautifulSoup4

Quelle

simple_downloader.py


# -*- coding: utf-8 -*-

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import requests, os

headers = { 'User-Agent' : 'Mozilla/5.0' }
cwd = os.getcwd()
result_dir = cwd + '/download/'
list_file = cwd + '/list.txt'
done_file = 'done.txt'
fail_file = 'fail.txt'

def fetchImage(url):
    path_relative = url.replace('http://', '').replace('https://', '')
    try:
        res = requests.get(url, headers = headers)
        image = res.content
        paths = os.path.split(path_relative)[0].split('/')
        path_current = result_dir
        for path in paths:
            path_current += path + '/'
            if not os.path.exists(path_current):
                os.mkdir(path_current)
        with open('{result_dir}{path_relative}'.format(result_dir = result_dir, path_relative = path_relative), 'wb') as f:
            f.write(image)
    except:
        return False
    return True

def getUrl():
    result = ''
    with open(list_file, 'r') as f:
        url_list = f.read().split('\n')
    result = url_list.pop(0)
    with open(list_file, 'w') as f:
        f.write('\n'.join(url_list))
    return result

def saveUrl(file_name, url):
    with open(file_name, 'a') as f:
        f.write(url + '\n')

def download():
    url = getUrl()
    while url != '':
        if fetchImage(url):
            saveUrl(done_file, url)
            print('done ' + url)
        else:
            saveUrl(fail_file, url)
            print('fail ' + url)
        url = getUrl()

download()

Referenzierte Site

Batch-Download von Bildern von einer bestimmten URL mit Python Modified Version [Python] Datei- / Verzeichnismanipulation

Recommended Posts

Laden Sie Bilder von der URL-Liste in Python herunter
Extrahieren Sie mit Python Text aus Bildern
Batch-Download-Bilder von einer bestimmten URL mit Python Modified-Version
Sortierte Liste in Python
Filterliste in Python
Paralleler Download mit Python
Die findähnliche Sache der Liste in Python
[Python] Laden Sie das Originalbild von der Google Bildsuche herunter
Laden Sie Bilder von der URL mit Pillow in Python 3
Massen-Download-Bilder von einer bestimmten URL mit Python
Wählen Sie zufällig Elemente aus der Liste (Array) in Python aus
Massen-Download-Bilder von einer bestimmten Site-URL mit Python
Base64-Codierung von Bildern in Python 3
OCR aus PDF in Python
So laden Sie Dateien von Selenium of Python in Chrome herunter
Abrufen von Listenelementen in Python
Relative URL-Verarbeitung in Python
Extrahieren Sie mehrere Listenduplikate in Python
Bildpixel-Manipulation in Python
Unterschied zwischen list () und [] in Python
Ausgabe 2017 Premium Friday List in Python
Laden Sie Bilder von "Irasutoya" mit Scrapy herunter
So sammeln Sie Bilder in Python
Laden Sie Google Drive-Dateien in Python herunter
Python / Machen Sie ein Diktat aus einer Liste.
Poste ein Bild von Python auf Tumblr
Python3> Liste aus iterierbarer> Liste erstellen (Bereich (5))
Löschen Sie mehrere Elemente in der Python-Liste
Arbeiten mit DICOM-Bildern in Python
Extrahieren Sie mit Python Zeichenfolgen aus Dateien
Laden Sie Python herunter
[Python] -Liste
Erhalten Sie Wechselkurse von offenen Wechselkursen in Python
Wenden Sie verschiedene Formen von Mosaiken auf Bilder an (Python, OpenCV).
Zeigen Sie eine Liste der Alphabete in Python 3 an
Wiederbelebt von "kein Internetzugang" in Python
Verhindern Sie den doppelten Start von cron in Python
Nehmen Sie die logische Summe von List in Python (Zip-Funktion)
Überprüfen Sie, ob die URL in Python vorhanden ist
Unterschied zwischen Anhängen und + = in der Python-Liste
Holen Sie sich den Batteriestand von SwitchBot mit Python
Zusammenfassung der integrierten Methoden usw. der Python-Liste
Generieren Sie eine Klasse aus einer Zeichenfolge in Python
Generieren Sie mit Python eine C-Sprache aus dem S-Ausdruck
Ruft die EDINET-Codeliste in Python ab
In Python von Markdown in HTML konvertieren
Holen Sie sich mit Python die Niederschlagswahrscheinlichkeit aus XML
Laden Sie Dateien in jedem Format mit Python herunter
Entfernen Sie DICOM-Bilder in Python
Lesen von Zeichen in Bildern mit Python OCR
[Python] Verstehen Sie die Slice-Operation der Liste in Sekunden
Abrufen des Metrikverlaufs von MLflow in Python
[Python] (Linie) Extrahieren Sie Werte aus Diagrammbildern
Extrahieren Sie alle n Elemente aus einem Array (einer Liste) in Python und Ruby
Erkennen Sie japanische Zeichen anhand von Bildern mithilfe der Cloud Vision-API von Google mit Python
Holen Sie sich mit Python Zeitreihendaten von k-db.com
Quadtree in Python --2
Python in der Optimierung
CURL in Python