Ich musste die unordentlichen Daten mit Bytes formatieren, daher ist dies zu dieser Zeit ein Memo Das Kritzeln von dem, was ich in R über Januar gemacht habe, ist hier. import Import eines vertrauten Datenanalysetools
Da wir jedoch häufig Daten verarbeiten, die viele Dateien umfassen, Glob wird auch importiert !! pandas
data = pd.read_csv("Dateiname.csv")
--pd.read_ file format () unterstützt verschiedene Dateiformate
datas = glob.glob('*')
Wenn Sie eine große Anzahl von Dateien haben, erhalten Sie alle Dateien im Verzeichnis.
Bei Pandas ist die aufgerufene Datei kein Numpy-Array, sondern ein DataFrame-Typ.
Es ist ein Abziehen des störenden Teils.
data.drop([1,2])
#Linie löschen
data.drop([1,2],axis=1)
#Spalten löschen
Auf diese Weise können Sie die Zeile und die Spalte löschen.
pd.concat([data[1],data[0]])
#Linien verbinden
pd.concat([data[1],data[0]],axis=1)
#Spalten verbinden
Dies ist nützlich, wenn Sie viele Dateien und Daten haben!
Nur die Daten, die Sie wollen!
data.query("1==2")
Jetzt können Sie nur eine Spalte mit dem Namen 1 mit dem Wert 2 haben.
Unverzichtbar beim Formen von Dateien, um Datenbeziehungen abzuleiten!
pd.merge(data1, data, on='Spaltenname')
Dadurch werden die Daten mit denselben Spaltenwerten zusammengehalten.
Geduld ist wichtig für die stumpfe Datenformung! Danach können Sie es sofort tun, indem Sie für usw. verwenden. Es ist einfach, Spalten und Zeilen gut auszutauschen, indem Sie ein Array von numpy und eine Datei in der Mitte erstellen. Denken Sie an die gewünschten Daten und arbeiten Sie hart daran. Danke, dass Sie mein schlechtes Memo gelesen haben.
Recommended Posts