Der Blog, den ich vor langer Zeit geschrieben habe, hatte keine Exportfunktion. Ich habe die URL-Liste des Bildes mit curl oder grep erstellt, aber da die URL in einem Format wie / Img? Hogehoge vorliegt, wird sie zu Img0.1 oder Img0.2, auch wenn ich sie mit wget -i speichere.
Wenn Sie sorgfältig suchen, gibt es möglicherweise eine Option, um mit Curl oder Wget etwas Gutes zu tun, aber die Suche ist schwierig, deshalb habe ich ein Skript geschrieben.
Der Dateiname übernimmt das Aktualisierungsdatum von Last-Modified und die Erweiterung von context-type. Da es eine Datei mit demselben Aktualisierungsdatum gab, habe ich auch eine Seriennummer hinzugefügt.
cat url_list.txt | python get-contents.py
get-contents.py
# -*- coding: utf-8 -*-
import sys
import requests
import datetime
import struct
cnt = 0
for line in sys.stdin.readlines():
r = requests.get(line.strip())
# print(r.headers)
ext = (r.headers['Content-Type'].split('/'))[1]
lm = datetime.datetime.strptime(
r.headers['Last-Modified'], '%a, %d %b %Y %H:%M:%S GMT')
fname = lm.strftime('%Y%m%d-%H%M%S') + ('-%03d.' % cnt) + ext
print(fname)
with open(fname, "wb") as fout:
for x in r.content:
fout.write(struct.pack("B", x))
cnt = cnt + 1