Pour vous rappeler comment utiliser Pandas La méthode de fonctionnement de base est résumée.
import pandas as pd
pd.DataFrame()
df = pd.DataFrame({
'Country': ['JPN', 'USA', 'CHI', 'GER', 'AUS'],
'Greeting':['Bonjour', 'Hello', 'Ni Hao', 'Guten Tag', 'GDay'],
'Capial':['Tokyo','Washington', 'Beijing', 'Berlin', 'Canberra']},
index=['a','b','c','d','e']
)
df
"""
La sortie est la suivante
Country Greeting Capial
un JPN Hello Tokyo
b USA Hello Washington
c CHI Ni Hao Beijing
d GER Guten Tag Berlin
e AUS GDay Canberra
"""
--Prenez un tableau (['hage', 'hige', 'énorme' ...]) comme argument et renvoyez la présence ou l'absence de cette valeur sous forme de valeur booléenne.
df.isin(['JPN', 'Berlin'])
"""
Country Greeting Capial
a True False False
b False False False
c False False False
d False False True
e False False False
"""
df.loc[]
--Spécifier les lignes et les colonnes par étiquette (nom)
--Il est nécessaire de spécifier chaque ligne et colonne pour l'indice ([]).
: `` signifie toutes les parties
df.loc[:,['Country', 'Greeting']]
#Volonté:'Country'Colonne,'Greeting'Obtenez la colonne. Toutes les lignes
df.loc[['a','c'],['Country']] # ->
#Volonté:'Country'Obtenez la colonne. Seulement les lignes a et c
df.iloc[] --Spécifiez la ligne / colonne par l'emplacement de l'entier
df.iloc[:,1:3]
#Volonté:1ère à 3ème rangée(Autrement dit, la première ligne et la deuxième colonne)Sortie, toutes les lignes
df.iloc[2:5,1:3]
#Volonté:1ère à 3ème rangée(même)Sortez les lignes de la 2ème ligne à la 5ème ligne(C'est 2,3,4ème ligne)
"""
Greeting Capial
c Ni Hao Beijing
d Guten Tag Berlin
e GDay Canberra
"""
df.ix[]
--Comment supprimer les colonnes et l'utilisation de type requête seront bientôt ajoutés. ――Parce que c'est l'une des bibliothèques les plus basiques avec Numpy et Matplotlib, j'ai pensé que c'était une bibliothèque qui nécessite une révision afin que vous ne tombiez pas sur la méthode d'opération. J'espère que cela aide des personnes similaires.