[PYTHON] Résumé des choses qui étaient pratiques lors de l'utilisation de pandas

Cet article est le troisième jour de Furukawa Lab Advent_calendar. Cet article a été rédigé par un étudiant du Furukawa Lab dans le cadre de leur apprentissage. Le contenu peut être ambigu ou l'expression peut être légèrement différente.

introduction

Dans cet article, je vais résumer les commandes qui m'ont été utiles lorsque j'ai utilisé des pandas pour le formatage des données. Il sera envoyé par les débutants du programme, il serait donc utile que vous puissiez le voir avec des yeux chauds ^^

Texte

python


import pandas as pd

df=pd.read_csv('Chemin du fichier')

En gros, lisez csv avec ceci En fait, il devrait y avoir des situations où vous devez lire plusieurs fichiers, donc la méthode utilisée dans de tels cas est indiquée ci-dessous.

Lorsque vous souhaitez lire plusieurs fichiers à la fois

python


import glob

#Même hiérarchie
file_pass = glob.glob('*.csv')

#Vous pouvez également spécifier la hiérarchie
file_pass = glob.glob('○○/○○/*.csv')

Cela prendra le chemin du fichier .csv dans la hiérarchie spécifiée. Dans un répertoire appelé ○○ / ○○ data_1.csv , data_1.txt , data_2.csv , data_2.txt Si existe

python


[○○/○○/data_1.csv,○○/○○/data_2.csv]

Est retourné. Le reste est une déclaration pour

python


counter = -1
for i in file_pass
    df = pd.read_csv(i)
    counter = counter + 1
    #Ajouter une opération
    #Si vous souhaitez enregistrer à nouveau et enregistrer sans index, indexez=Ajoutez simplement Faux
    df.to_csv('new_name_{0}.csv'.format(counter))

Vous pouvez formater les données à la fois (to_csv, compteur, etc.)

os Ceci est pratique pour nommer

python


import os

# ()Apportez le chemin à l'intérieur"../"Et référez-vous à l'endroit où ce code est écrit
path = os.path.abspath(filepath)

#Sortez le nom du fichier du chemin
#C'était pratique à utiliser avec glob
name = os.path.basename(filepath)

#Parfois, je n'ai même pas besoin d'une extension.Diviser et diviser avec
name = name.split(".")
name = name[0]

Résumé

On a dit qu'il était facile de lire le fichier csv à la fois et d'ajouter la même opération lors de l'utilisation de glob et os. Je pensais quand je le faisais moi-même, mais le fonctionnement des pandas lui-même sort si je le recherche sur Google comme "pandas ○○", mais je ne peux pas juger s'il s'agit d'une fonction pandas ou d'une bibliothèque python et cela fonctionne bien Il y avait de nombreuses situations où je ne pouvais pas chercher. Je veux savoir ce que je peux faire et développer la capacité de Google correctement ╭ (・ ㅂ ・) و

Recommended Posts

Résumé des choses qui étaient pratiques lors de l'utilisation de pandas
Résumé lors de l'utilisation de Fabric
Récapitulatif des méthodes Pandas utilisées lors de l'extraction de données [Python]
[Python] Résumé de la méthode de création de table utilisant DataFrame (pandas)
Résumé d'utilisation pratique de Flask
Résumé de l'utilisation de base de Pandas
Résumé des éléments à installer pour exécuter tf-pose-estimation
Précautions lors de l'utilisation de codecs et de pandas
Voici un résumé des choses qui pourraient être utiles pour traiter des nombres complexes en Python
Choses à prendre en compte lors de la création d'un système de recommandation avec Item2Vec
[Python] Résumé de l'utilisation des pandas
Résumé des méthodes fréquemment utilisées chez les pandas
Précautions lors de l'utilisation de l'instruction for dans les pandas
Résumé de l'extrait de code lors du développement avec Go
Parlez des fonctionnalités dont les pandas et moi étions en charge dans le projet
Résumé des sources de données scikit-learn pouvant être utilisées lors de la rédaction d'articles d'analyse
Résumé des techniques de commande Linux que je connaissais quand j'étais un ingénieur débutant
Résumé des exemples qui ne peuvent pas être pyTorch à l'envers
Résumé de ce qui a été utilisé dans 100 coups de Pandas (# 1 ~ # 32)
[Pandas] Principes de base du traitement des données de date à l'aide de dt
Encodage de caractères lors de l'utilisation du module csv de python 2.7.3
100 Language Processing Knock-32 (utilisant des pandas): Prototype de verbe
Résumé du document lors de l'utilisation de Cloud Firestore à partir de Java
Résumé des méthodes de gestion des erreurs lors de l'installation de TensorFlow (2)
Résumé des opérations Excel utilisant OpenPyXL en Python
Résumé des méthodes d'analyse de données statistiques utilisant Python qui peuvent être utilisées en entreprise