Cet article est le troisième jour de Furukawa Lab Advent_calendar. Cet article a été rédigé par un étudiant du Furukawa Lab dans le cadre de leur apprentissage. Le contenu peut être ambigu ou l'expression peut être légèrement différente.
Dans cet article, je vais résumer les commandes qui m'ont été utiles lorsque j'ai utilisé des pandas pour le formatage des données. Il sera envoyé par les débutants du programme, il serait donc utile que vous puissiez le voir avec des yeux chauds ^^
python
import pandas as pd
df=pd.read_csv('Chemin du fichier')
En gros, lisez csv avec ceci En fait, il devrait y avoir des situations où vous devez lire plusieurs fichiers, donc la méthode utilisée dans de tels cas est indiquée ci-dessous.
python
import glob
#Même hiérarchie
file_pass = glob.glob('*.csv')
#Vous pouvez également spécifier la hiérarchie
file_pass = glob.glob('○○/○○/*.csv')
Cela prendra le chemin du fichier .csv dans la hiérarchie spécifiée. Dans un répertoire appelé ○○ / ○○ data_1.csv , data_1.txt , data_2.csv , data_2.txt Si existe
python
[○○/○○/data_1.csv,○○/○○/data_2.csv]
Est retourné. Le reste est une déclaration pour
python
counter = -1
for i in file_pass
df = pd.read_csv(i)
counter = counter + 1
#Ajouter une opération
#Si vous souhaitez enregistrer à nouveau et enregistrer sans index, indexez=Ajoutez simplement Faux
df.to_csv('new_name_{0}.csv'.format(counter))
Vous pouvez formater les données à la fois (to_csv, compteur, etc.)
os Ceci est pratique pour nommer
python
import os
# ()Apportez le chemin à l'intérieur"../"Et référez-vous à l'endroit où ce code est écrit
path = os.path.abspath(filepath)
#Sortez le nom du fichier du chemin
#C'était pratique à utiliser avec glob
name = os.path.basename(filepath)
#Parfois, je n'ai même pas besoin d'une extension.Diviser et diviser avec
name = name.split(".")
name = name[0]
On a dit qu'il était facile de lire le fichier csv à la fois et d'ajouter la même opération lors de l'utilisation de glob et os. Je pensais quand je le faisais moi-même, mais le fonctionnement des pandas lui-même sort si je le recherche sur Google comme "pandas ○○", mais je ne peux pas juger s'il s'agit d'une fonction pandas ou d'une bibliothèque python et cela fonctionne bien Il y avait de nombreuses situations où je ne pouvais pas chercher. Je veux savoir ce que je peux faire et développer la capacité de Google correctement ╭ (・ ㅂ ・) و
Recommended Posts