Ich habe ein nützliches Programm in Python geschrieben, als ich es automatisch herunterladen wollte. Mit urllib ist dies sehr einfach.
download.py
#!/usr/bin/env python
#-*- coding:utf-8 -*-
import urllib.request
import sys
def download():
url = sys.argv[1]
title = sys.argv[2]
urllib.request.urlretrieve(url,"{0}".format(title))
if __name__ == "__main__":
download()
Ausführungsmethode
python download.py [url] [Dateititel]
Bei der Ausführung wird eine Datei im selben Verzeichnis wie die Datei download.py erstellt. (Wenn Sie den absoluten Pfad in den Dateititel eingeben, wird dieser auf diesem Pfad erstellt.)
sys.argv kann durch Importieren des Moduls sys verwendet werden. Der Dateiname des Programms wird in sys.argv [0] eingegeben, und die Argumente, die bei der Ausführung im Terminal eingegeben werden, werden in der Reihenfolge von sys.argv [1] zugewiesen. Wenn Sie mehrere Dateien automatisch herunterladen möchten, ermitteln Sie die Regelmäßigkeit der URL oder kratzen Sie mit einem Modul wie Beautifulsoup, um die URL zu extrahieren und die for-Anweisung zu verwenden. Sie können dies tun, indem Sie download () mehrmals ausführen.
Regelmäßigkeit bedeutet, dass bei einer Bild-URL wie "https: //hogehoge/service/10-1.png " 3 von 3-1.png eine Kategorie und 1 eine Seriennummer ist. Es kann vorkommen. Wenn Sie sich mehrere Beispiele ansehen und Regelmäßigkeit feststellen, können Sie sie alle gleichzeitig herunterladen. (Da dies die Serverseite belastet, ist es besser, beispielsweise time.sleep (0.1) in das Skript einzufügen.)
Recommended Posts