[PYTHON] Pandas de valeur manquante

Cette fois, j'écrirai un article sur les valeurs manquantes.

Contenu

・ Qu'est-ce qu'une valeur manquante? ・ Comment vérifier les valeurs manquantes ・ Comment gérer les valeurs manquantes

Qu'est-ce qu'une valeur manquante?

Une valeur manquante signifie que la valeur des données n'est pas saisie. Par exemple, les données de la table ne contiennent aucun nombre spécifique tel que des blancs ou NULL. S'il y a des valeurs manquantes, les données ne peuvent pas être obtenues correctement, donc même si elles sont visualisées dans un graphique, elles seront biaisées.

Comment vérifier les valeurs manquantes

Alors, quelles sont les façons de trouver les valeurs manquantes? Il est facile à trouver en utilisant les pandas de python. Ici, nous utiliserons les données csv.

fonction isnull

Dans les pandas, il existe une fonction qui permet de savoir facilement où il n'y a pas de données. C'est " isnull () </ b>". Il s'agit d'une fonction qui affiche False et True dans chaque colonne où il n'y a pas de données. S'il n'y a pas de valeur, True s'affiche et s'il y en a, False s'affiche.

toute fonction

Ensuite, vous n'avez pas à vérifier chaque donnée une par une. Si vous voulez vérifier s'il y a des valeurs manquantes, ajoutez la fonction " any () </ b>" après isnull (). Il vérifiera s'il y a des valeurs manquantes dans la colonne. Le résultat de la sortie s'affiche sous la forme True, False pour chaque colonne. S'il manque une valeur, elle sera affichée comme True, et si ce n'est pas le cas, elle sera affichée comme False.

fonction somme

Il est utilisé lorsque vous souhaitez connaître le nombre de valeurs manquantes. Comme pour la fonction any, le nombre de valeurs nulles peut être affiché en l'ajoutant après la fonction isnull.

fonction value_counts

Une fonction qui vérifie le nombre de nombres dans une colonne spécifiée. Par exemple, vous pouvez obtenir un résultat de sortie tel qu'il y a 10 nombres 0.

Comment gérer les valeurs manquantes

Il ne sert à rien de simplement vérifier les valeurs manquantes. Vous devez lui substituer une valeur numérique concrète. C'est ce qu'on appelle l'interpolation.

fonction fillna

Interpolons maintenant les nombres à zéro dans le tableau. La fonction " fllna </ b>" est utilisée à ce moment. Cette fonction changera tout dans le tableau où les valeurs nulles sont affichées en nombres. Vous pouvez spécifier la valeur de votre choix et la sauvegarder en spécifiant une valeur numérique dans l'argument. Si vous utilisez fillna (0), toutes les valeurs nulles seront interpolées à 0.

fonction dropna

Si vous souhaitez supprimer une ligne avec null au lieu de la remplacer par un nombre concret, utilisez la fonction " dropna </ b>". À proprement parler, si une colonne est nulle, la ligne correspondante est supprimée. Si vous souhaitez utiliser une colonne spécifique, spécifiez "subset =" ["nom de colonne"] "dans l'argument.