Depuis que j'ai téléchargé le fichier en utilisant du sélénium jusqu'à la dernière fois, Décrit le processus d'acquisition, de traitement et de réenregistrement en tant que fichier csv.
Obtenez tous les fichiers avec un modèle spécifique dans un dossier spécifique! Dans ce cas, glob est pratique.
#Récupère la liste des fichiers de l'expression régulière(glob)
file_list = glob.glob(dl_dir+'/*')
Il semble y avoir plusieurs bibliothèques pour les opérations Excel utilisant python, mais il semble utile de s'en souvenir. J'utilise xlrd.
#Travailler avec des fichiers Excel
wb = xlrd.open_workbook(file_name) #Ouvrir xls
sheet_names = wb.sheet_names() #Obtenir une liste de noms de feuilles
sheet = wb.sheet_by_name(sheet_names[1])
values2 = sheet.col_values(2)
values5 = sheet.col_values(5)
values2.pop(0) #Pour éliminer la première ligne ... Je me demande s'il y a une meilleure façon
values5.pop(0)
for i in range(len(channels)):
obj = [
word,
someFunction2(values2[i]),
someFunction5(values5[i])
]
result.append(obj)
with open(up_dir + '/result-{}.csv'.format(file_name), 'w') as f:
writer = csv.writer(f)
writer.writerows(result)
Jusque là
J'ai pu le faire. Ensuite, j'écrirai sur "l'envoi du produit transformé à S3" et "l'obtention de l'ENTREE (mots) d'origine de S3".
Recommended Posts