[PYTHON] Principes de base de Pandas pour les débutants ⑧ Traitement des chiffres

Qu'est-ce que les pandas

Une bibliothèque pour gérer des données structurées (données de type table) en Python. Il s'agit d'une bibliothèque qui peut facilement effectuer la lecture de fichiers et le traitement / extraction ultérieur (cela peut être effectué comme SQL), et est indispensable pour le prétraitement des données tel que l'apprentissage automatique. Le tableau pour les autres éléments est ici.

introduction

Dans cet article, il s'agit de la méthode de traitement du nombre de chiffres. La première chose à comprendre est de savoir comment ajuster le nombre de chiffres dans les pandas lui-même et comment ajuster le nombre de chiffres dans les trames de données et les variables individuelles. Notez également que l'arrondissement des pandas n'est pas un arrondi, mais un arrondi à des nombres pairs. Si vous ne connaissez pas l'arrondi à égal, vérifiez-le.

Préparation

Tout d'abord, importez la bibliothèque. Nommez pandas pd et importez-le.

python


import pandas as pd

J'essaierai l'exemple avec les données du Titanic. Si vous ne connaissez pas Titanic, veuillez cocher "kaggle Titanic".

python


dataframe = pd.read_csv('train.csv')

Ajuster le nombre de chiffres dans les pandas

Divers paramètres des pandas sont gérés par ʻoption. (Il existe diverses autres options, veuillez donc vérifier si vous êtes intéressé.) Le nombre total de chiffres est géré par display.float_format, et le nombre de chiffres après la virgule décimale est géré par display.precision`. Vérifions-le réellement.

In


print(pd.options.display.float_format)
print(pd.options.display.precision)

Out


None
6

Il n'y a pas de limite au nombre total de chiffres et 6 chiffres sont affichés après la virgule décimale. En regardant les données réelles, par exemple, le tarif est affiché jusqu'à 4 chiffres après la virgule décimale. Ceci est affiché comme ceci parce que les données CSV originales n'ont que 4 chiffres, mais si le nombre de chiffres est grand, il sera affiché jusqu'à 6 chiffres. image.png

Modifiez ensuite cette valeur pour afficher deux chiffres après la virgule décimale. (L'affichage du tarif sera de 2 chiffres)

python


pd.options.display.precision = 2

image.png Utilisez reset_option si vous voulez initialiser.

python


pd.reset_option('display.precision')

Comment régler individuellement

Utilisez round () pour les réglages individuels. Si vous souhaitez utiliser 2 chiffres après la virgule décimale, ce sera comme suit. (L'affichage du tarif sera de 2 chiffres)

python


dataframe.round(2)

image.png

Si vous souhaitez le définir pour chaque colonne, ce sera comme suit. (Exemple: l'âge est de 1 chiffre et le tarif est de 3 chiffres.)

python


dataframe.round({'Age':1, 'Fare':3})

image.png

finalement

Comme un débutant peut le comprendre, nous avons résumé les connaissances nécessaires lors de la mise en œuvre de l'apprentissage automatique avec Python dans un simple article. La table des matières est ici, donc j'espère que vous pourrez également vous référer à d'autres articles.

Recommended Posts

Principes de base de Pandas pour les débutants ⑧ Traitement des chiffres
Principes de base de Pandas pour les débutants ① Lecture et traitement
Lien récapitulatif des bases de Pandas pour les débutants
Les bases de Pandas pour les débutants ③ Créez un histogramme avec matplotlib
Principes de base de Pandas pour les débutants ② Présentation des données de saisie
Les bases de Seaborn pour les débutants ④ Pairplot
Pandas 100 coups pour les débutants en Python
Bases de Seaborn pour les débutants ② histogramme (distplot)
Notions de base sur les pandas
[À voir pour les débutants] Bases de Linux
Notions de base sur les pandas
Principes de base de Pandas pour les débutants ④ Gestion des éléments de date et d'heure
Traitement des mémos souvent utilisés dans les pandas (débutants)
Python Pandas ne convient pas au traitement par lots
[Pandas] Principes de base du traitement des données de date à l'aide de dt
[Pour enregistrement] Mémorandum Pandas
[Français] Tutoriel officiel NumPy "NumPy: les bases absolues pour les débutants"
Paramètres Spacemacs (pour les débutants)
Bases de Python ② pour déclaration
Traitement des ensembles de données avec des pandas (1)
Traitement des ensembles de données avec des pandas (2)
Résumé des méthodes de prétraitement pour les débutants en Python (trame de données Pandas)
Principes de base de MongoDB: traitement des transactions
Manuel python pour les débutants
100 Language Processing Knock: Chapitre 2 Principes de base des commandes UNIX (à l'aide de pandas)
[Linux] Principes de base de la configuration des autorisations par chmod pour les débutants
Algorithme Dikstra pour les débutants
OpenCV pour les débutants en Python
Bases de Seaborn pour les débutants ③ Diagramme de dispersion (jointplot) * Avec histogramme
[Pour les débutants] Les bases de Python expliquées par Java Gold Part 2
[Explication pour les débutants] Introduction au traitement du pliage (expliqué dans TensorFlow)
[Explication pour les débutants] Introduction au traitement du pool (expliqué dans TensorFlow)
[Pour les débutants] Les bases de Python expliquées par Java Gold Part 1
Flux d'apprentissage pour les débutants en Python
[Pour les débutants] kaggle exercice (merucari)
Distribution Linux recommandée pour les débutants
CNN (1) pour la classification des images (pour les débutants)
Construction de l'environnement Python3 (pour les débutants)
Vue d'ensemble de Docker (pour les débutants)
Python #function 2 pour les super débutants
Grammaire de base Python pour les débutants
Python #function 1 pour les super débutants
#List Python pour les super débutants
~ Conseils pour les débutants de Python présentés avec amour par Pythonista ③ ~
[Pour les débutants de Kaggle] Titanic (LightGBM)
Mémorandum de commande Linux [pour les débutants]
Conseils de traitement des données avec Pandas
Raccourci Linux pratique (pour les débutants)
[Python] Traitement itératif (for, while)
[Pandas] J'ai essayé d'analyser les données de ventes avec Python [Pour les débutants]
Bases de Seaborn pour les débutants ① Graphique agrégé du nombre de données (Countplot)