Da ich die Datei bis zum letzten Mal mit Selen heruntergeladen habe, Beschreibt den Vorgang des Erfassens und Verarbeitens sowie des erneuten Speicherns als CSV-Datei.
Holen Sie sich alle Dateien mit einem bestimmten Muster in einen bestimmten Ordner! In diesem Fall ist glob praktisch.
#Rufen Sie die Dateiliste des regulären Ausdrucks ab(glob)
file_list = glob.glob(dl_dir+'/*')
Es scheint mehrere Bibliotheken für Excel-Operationen mit Python zu geben, aber es scheint nützlich, sich an eine zu erinnern. Ich benutze xlrd.
#Arbeiten mit Excel-Dateien
wb = xlrd.open_workbook(file_name) #Öffnen Sie xls
sheet_names = wb.sheet_names() #Holen Sie sich eine Liste der Blattnamen
sheet = wb.sheet_by_name(sheet_names[1])
values2 = sheet.col_values(2)
values5 = sheet.col_values(5)
values2.pop(0) #Um die erste Zeile zu beseitigen ... Ich frage mich, ob es einen besseren Weg gibt
values5.pop(0)
for i in range(len(channels)):
obj = [
word,
someFunction2(values2[i]),
someFunction5(values5[i])
]
result.append(obj)
with open(up_dir + '/result-{}.csv'.format(file_name), 'w') as f:
writer = csv.writer(f)
writer.writerows(result)
Bisher
--Wenn es ausgeführt wird, kratzt es die Site und lädt die Datei herunter.
Das konnte ich machen. Als nächstes schreibe ich über "Senden des verarbeiteten Produkts an S3" und "Erhalten des ursprünglichen EINGANGS (Wörter) von S3".
Recommended Posts