Wenn Sie beurteilen, ob es sich bei der erfassten URL um einen relativen Bus oder einen absoluten Pfad handelt und ob es sich um einen relativen Pfad handelt, müssen Sie diesmal nicht die Aufgabe haben, sie zu einem absoluten Pfad zu machen Beachten Sie, dass der img-Pfad ein Programm ist, das unter der Bedingung erstellt wurde, dass nur der absolute Pfad auf der Site verwendet wird, die Sie erfassen möchten. Wenn Sie also versuchen, ein Bild von einer Site zu erfassen, die einen relativen Pfad verwendet, tritt ein FEHLER auf. ~~ Ich werde die ausführliche Erklärung (?) Des Codes in dem unten verlinkten Blog aufschreiben. ~~ (Der Blog wurde veröffentlicht) (Geplant ab 11. August 2014)
downloadImg.py
# -*- coding: utf-8 -*-
import urllib
import urllib2
import os.path
import sys
from HTMLParser import HTMLParser
def download(url):
img = urllib.urlopen(url)
localfile = open(os.path.basename(url),'wb')
localfile.write(img.read())
img.close()
localfile.close()
class imgParser(HTMLParser):
def __init__(self):
HTMLParser.__init__(self)
def handle_starttag(self,tagname,attribute):
if tagname.lower() == "img":
for i in attribute:
if i[0].lower() == "src":
img_url=i[1]
#Erstellen einer Datei, in der die URLs der erfassten Fotos erfasst werden
f = open("collection_url.txt","a")
f.write("%s\t"%img_url)
f.close()
if __name__ == "__main__":
print('Geben Sie die URL der Site ein, auf der Sie das Foto erhalten möchten.')
input_url = raw_input('>>> ')
serch_url = input_url
htmldata = urllib2.urlopen(serch_url)
print('Derzeit werden Bilddateien abgerufen...')
parser = imgParser()
parser.feed(htmldata.read())
parser.close()
htmldata.close()
#Lesen Sie die generierte Datei
f = open("collection_url.txt","r")
for row in f:
row_url = row.split('\t')
len_url = len(row_url)
f.close()
number_url = []
for i in range(0,(len_url-1)):
number_url.append(row_url[i])
for j in range(0,(len_url-1)):
url = number_url[j]
download(url)
print('Der Bilddownload ist abgeschlossen.')
#Datei löschen
os.remove("collection_url.txt")
Twitter :@fantmsite ~~ Blog: Fantm Site-BLOG ~~
Recommended Posts