[PYTHON] Zusammenfassung der grundlegenden Verwendung von Pandas
Als Erinnerung an die Verwendung von Pandas
Die grundlegende Betriebsmethode ist zusammengefasst.
0. Prämisse
import pandas as pd
1. Definieren Sie die Daten
pd.DataFrame()
- Methoden, die Datenrahmen definieren können
- Sie können das Indexargument angeben. Wenn nicht angegeben, wird es automatisch von 0 zugewiesen
df = pd.DataFrame({
'Country': ['JPN', 'USA', 'CHI', 'GER', 'AUS'],
'Greeting':['Hallo', 'Hello', 'Ni Hao', 'Guten Tag', 'GDay'],
'Capial':['Tokyo','Washington', 'Beijing', 'Berlin', 'Canberra']},
index=['a','b','c','d','e']
)
df
"""
Die Ausgabe ist wie folgt
Country Greeting Capial
ein JPN Hallo Tokio
b USA Hello Washington
c CHI Ni Hao Beijing
d GER Guten Tag Berlin
e AUS GDay Canberra
"""
2. Bedienung des Datenrahmens
Bestätigung der Datenexistenz
df.isin () Methode
- Nehmen Sie ein Array (['hage', 'hige', 'riesig' ...]) als Argument und geben Sie das Vorhandensein oder Fehlen dieses Werts als booleschen Wert zurück.
df.isin(['JPN', 'Berlin'])
"""
Country Greeting Capial
a True False False
b False False False
c False False False
d False False True
e False False False
"""
df.isnull () Methode
- Überprüft auf fehlende Werte (NaN) und gibt einen booleschen Wert zurück (True bedeutet NaN).
b. Daten aufrufen
df.loc[]
- Geben Sie Zeilen und Spalten nach Bezeichnung (Name) an
- Es ist erforderlich, jede Zeile und Spalte für den Index ([]) anzugeben.
`:`
bedeutet alle Teile
df.loc[:,['Country', 'Greeting']]
#Wille:'Country'Säule,'Greeting'Holen Sie sich die Spalte. Alle Zeilen
df.loc[['a','c'],['Country']] # ->
#Wille:'Country'Holen Sie sich die Spalte. Nur die Zeilen a und c
df.iloc[]
- Geben Sie die Zeile / Spalte durch die Ganzzahlposition an
- Übrigens ist i weder Index noch Index noch Iterator, sondern *** i *** von *** i *** nteger *** Ort *** ('Integer Position') [^ 1].
df.iloc[:,1:3]
#Wille:1. bis 3. Reihe(Das heißt, die erste Zeile und die zweite Spalte)Ausgabe, alle Zeilen
df.iloc[2:5,1:3]
#Wille:1. bis 3. Reihe(gleich)Geben Sie die Zeilen von der 2. bis zur 5. Zeile aus(Das ist 2,3,4. Zeile)
"""
Greeting Capial
c Ni Hao Beijing
d Guten Tag Berlin
e GDay Canberra
"""
df.ix[]
- Es funktioniert unabhängig davon, ob Sie die Bezeichnung (loc) oder die Ganzzahl (iloc) aufrufen. Entzogen von Pandas Version 0.20.0 [^ 2].
――Ich denke, es reicht zu wissen, dass es so etwas gab.
Anmerkung der Redaktion
- So löschen Sie Spalten und die abfrageähnliche Verwendung wird in Kürze hinzugefügt.
――Weil es neben Numpy und Matplotlib eine der grundlegendsten Bibliotheken ist, dachte ich, dass es sich um eine Bibliothek handelt, die überprüft werden muss, damit Sie nicht über die Operationsmethode stolpern. Ich hoffe es hilft ähnlichen Menschen.
Artikel, die ich als Referenz verwendet habe