[PYTHON] Résumé des méthodes fréquemment utilisées chez les pandas

Ceci est une collection de méthodes pandas que j'utilise souvent. Je cherche à chaque fois que ce n'est pas facile à utiliser, mais c'est aussi gênant, c'est donc un article comme mémo pour moi-même. (Prévu pour être mis à jour à tout moment)

Paramètre d'affichage du bloc de données (set_option)

python


#Supprimer l'affichage du type flottant à 3 chiffres après le point décimal
pd.set_option('display.float_format', lambda x: '{:.3f}'.format(x))

#Même si les colonnes sont omises par défaut, toutes les colonnes seront affichées avec ce paramètre.
pd.set_option('display.max_columns', None)

Création d'un bloc de données (DataFrame)

python


#importation de pandas
import pandas as pd

#Définir les données, le nom de l'index, le nom de la colonne
val=[[1,2,3], [21,22,23], [31,32,33]]
index = ["row1", "row2", "row3"]
columns =["col1", "col2", "col3"]

#Créer un bloc de données en spécifiant l'index et le nom de la colonne
df = pd.DataFrame(data=val, index=index, columns=columns)

Créer un bloc de données à partir de la lecture d'un fichier CSV (read_csv)

python


#fichier csv(df.csv)La première ligne est lue comme en-tête et devient automatiquement le nom de la colonne.
df = pd.read_csv("df.csv")

Créer un bloc de données à partir de la lecture d'un fichier CSV (ver sans nom de colonne)

python


#fichier csv(df.csv)Lire, les noms de colonnes sont automatiquement sérialisés
df = pd.read_csv("df.csv",header=None)

Modifier le type de données (astype)

python


#Colonne.astype(Moule)でstrMouleに変更
df["A"] = df["A"].astype(str)

Appliquer la fonction

python


#Colonne.apply(une fonction)で指定した列の全てのデータにune fonctionを適用する
#Ici, appliquez la fonction round
df["A"] = df["A"].apply(round)

#Colonne.apply(Fonction anonyme)Appliquer la fonction à toutes les données de la colonne spécifiée dans
#Ici, la fonction de fractionnement supprime les chaînes de caractères après la virgule dans toutes les données de la colonne A.
df["A"] = df["A"].apply(lambda x: x.split(",")[0])

Trames de données Concat

python


#Combinez les trames de données d1 et d2 verticalement
df3 = pd.concat([df1,df2]).reset_index(drop=True)
#Combinez les trames de données d1 et d2 horizontalement
df3 = pd.concat([df1,df2],axis=1).reset_index(drop=True)

Transformer les données regroupées par d'autres colonnes

python


#Colonne.transform(une fonction)で指定した列の全てのデータにune fonctionを適用する
#Pour chaque groupe de la colonne A, remplissez les valeurs manquantes de la colonne B avec la valeur médiane de A dans le groupe
df["B"] = df.groupby("A")["B"].transform(lambda x: x.fillna(x.median()))

Liste la colonne manquante du bloc de données (isnull)

python


#Stocker le nom de la colonne contenant des données nulles dans la liste
null_col = df.isnull().sum()[df.isnull().sum()>0].index.tolist()

Lister les types de données des colonnes dans le bloc de données (dtypes)

python


#type d'objet nom de colonne ob_Stocker sous forme de liste dans col
ob_col = df.dtypes[df.dtypes=="object"].index.tolist()

pandas a beaucoup de méthodes utiles et j'ai trop à écrire, mais je vais le mettre à jour petit à petit.

Recommended Posts

Résumé des méthodes fréquemment utilisées chez les pandas
Résumé de la grammaire fréquemment utilisée dans les pandas
Résumé de ce qui a été utilisé dans 100 coups de Pandas (# 1 ~ # 32)
Récapitulatif des méthodes Pandas utilisées lors de l'extraction de données [Python]
Résumé des commandes fréquemment utilisées dans matplotlib
Résumé des méthodes intégrées, etc. de la liste Python
Traitement des mémos souvent utilisés dans les pandas (débutants)
Divulgation complète des méthodes utilisées dans l'apprentissage automatique
Résumé des outils utilisés dans la ligne de commande vol.8
Résumé des outils utilisés dans la ligne de commande vol.5
Résumé des fonctions d'évaluation utilisées dans l'apprentissage automatique
Selenium Webdriver Résumé des méthodes de fonctionnement fréquemment utilisées
Résumé des processus souvent effectués par Pandas 1 (CSV, opérations liées aux fichiers Excel)
Collection de conseils Numpy, Pandas souvent utilisés sur le terrain
Une collection de code souvent utilisée dans Python personnel
Paramètres souvent utilisés dans Jupyter
Résumé de l'utilisation de base de Pandas
Résumé des méthodes d'analyse de données statistiques utilisant Python qui peuvent être utilisées en entreprise
Résumé des processus souvent effectués par Pandas 2 (référence des données, opération d'édition)
J'ai essayé de résumer le code souvent utilisé dans Pandas
Résumé de l'écriture des fichiers .proto utilisés dans gRPC
Une collection de méthodes utilisées lors de l'agrégation de données avec des pandas
Caractéristiques de pd.NA dans Pandas 1.0.0 (RC0)
Résumé des différentes opérations dans Tensorflow
[Anaconda3] Résumé des commandes fréquemment utilisées
Résumé de l'installation souvent utilisé pour les projets d'IA
[Python] Résumé de l'utilisation des pandas
Résumé des commandes fréquemment utilisées de django (débutant)
Résumé des méthodes pour déterminer automatiquement les seuils
Commandes liées au disque souvent utilisées dans Ubuntu (Notes)
[Linux] Liste des commandes Linux utilisées dans la pratique
Résumé de diverses instructions for en Python
Résumé des pierres d'achoppement lors de l'installation de CaboCha
Résumé des modules et des classes dans Python-TensorFlow2-
Résumé des opérations souvent effectuées avec asyncpg
Résumé des distributions de probabilité qui apparaissent souvent dans les statistiques et l'analyse des données
Python scikit-learn Une collection de conseils de modèles prédictifs souvent utilisés sur le terrain
Résumé de la façon d'importer des fichiers dans Python 3
Liste des fonctions et méthodes intégrées fréquemment utilisées
Techniques souvent utilisées dans le codage court en python (Bloc-notes)
Notes personnelles des opérations liées aux pandas qui peuvent être utilisées dans la pratique
Utilisation des fonctions récursives utilisées chez les pros de la compétition
Résumé de l'utilisation de MNIST avec Python
L'en-tête est mal aligné avec read_csv () et read_table () de Pandas
Correction des arguments de la fonction utilisée dans map
Méthodes fréquemment utilisées de sélénium et de belle soupe
Résumé des tableaux Python fréquemment utilisés (pour moi-même)
Code souvent utilisé dans les applications Python / Django [préfectures]
Résumé des commandes fréquemment utilisées (avec petit commentaire)
Python scikit-learn Une collection de conseils de modèles prédictifs souvent utilisés sur le terrain
Un mémorandum de méthode souvent utilisé lors de l'analyse de données avec des pandas (pour les débutants)
Un mémorandum de méthode souvent utilisé dans l'apprentissage automatique utilisant scikit-learn (pour les débutants)
Résumé des méthodes de gestion des erreurs lors de l'installation de TensorFlow (2)
Résumé des opérations Excel utilisant OpenPyXL en Python
[Introduction à Python] Résumé des fonctions et méthodes qui apparaissent fréquemment en Python [Format du problème]
[Python] Introduction au scraping WEB | Résumé des méthodes pouvant être utilisées avec webdriver
Utilisé depuis l'introduction de Node.js dans l'environnement WSL
Résumé des outils nécessaires pour analyser les données en Python