Schreiben Sie auf, was ich bei der Formatierung von Pos-Daten mit ipython verwendet habe

Einführung

Ich musste die unordentlichen Daten mit Bytes formatieren, daher ist dies zu dieser Zeit ein Memo Das Kritzeln von dem, was ich in R über Januar gemacht habe, ist hier. import スクリーンショット 2016-06-01 21.02.42.png Import eines vertrauten Datenanalysetools

スクリーンショット 2016-06-01 21.04.00.png Da wir jedoch häufig Daten verarbeiten, die viele Dateien umfassen, Glob wird auch importiert !! pandas

Datei lesen

data = pd.read_csv("Dateiname.csv")

--pd.read_ file format () unterstützt verschiedene Dateiformate

datas = glob.glob('*')

Wenn Sie eine große Anzahl von Dateien haben, erhalten Sie alle Dateien im Verzeichnis.

Bei Pandas ist die aufgerufene Datei kein Numpy-Array, sondern ein DataFrame-Typ.

スクリーンショット 2016-06-01 21.25.35.png

Spalten und Zeilen löschen

Es ist ein Abziehen des störenden Teils.

data.drop([1,2])
#Linie löschen
data.drop([1,2],axis=1)
#Spalten löschen

Auf diese Weise können Sie die Zeile und die Spalte löschen.

スクリーンショット 2016-06-01 21.31.15.png

Spalten und Zeilen verbinden

pd.concat([data[1],data[0]])
#Linien verbinden
pd.concat([data[1],data[0]],axis=1)
#Spalten verbinden

Dies ist nützlich, wenn Sie viele Dateien und Daten haben!

スクリーンショット 2016-06-01 21.40.16.png

Nur Zeilen mit den gewünschten Daten

Nur die Daten, die Sie wollen!

data.query("1==2")

Jetzt können Sie nur eine Spalte mit dem Namen 1 mit dem Wert 2 haben.

スクリーンショット 2016-06-01 21.47.03.png

Bleib bei den gleichen Daten

Unverzichtbar beim Formen von Dateien, um Datenbeziehungen abzuleiten!

pd.merge(data1, data, on='Spaltenname')

Dadurch werden die Daten mit denselben Spaltenwerten zusammengehalten.

スクリーンショット 2016-06-01 21.56.45.png

Schließlich

Geduld ist wichtig für die stumpfe Datenformung! Danach können Sie es sofort tun, indem Sie für usw. verwenden. Es ist einfach, Spalten und Zeilen gut auszutauschen, indem Sie ein Array von numpy und eine Datei in der Mitte erstellen. Denken Sie an die gewünschten Daten und arbeiten Sie hart daran. Danke, dass Sie mein schlechtes Memo gelesen haben.

Recommended Posts

Schreiben Sie auf, was ich bei der Formatierung von Pos-Daten mit ipython verwendet habe
Was wurde gefragt, wenn Random Forest in der Praxis verwendet wurde?
Worauf ich mich bei der Verwendung von Tensorflow-gpu eingelassen habe
[Frage] Was passiert, wenn Sie% in Python verwenden?
Was beim Nachahmen zu tun ist, wird in Python eingebettet
Wovon ich süchtig war, als ich Python Tornado benutzte
Skripte, die bei der Verwendung von Bottle in Python verwendet werden können
Probleme bei der Verwendung von Elasticsearch als Datenquelle in Redash
Bei Verwendung von optparse mit iPython
Was ich in Python gelernt habe
Bei Verwendung von @property in Python wird ein Attribut nicht festgelegt
Worauf ich bei der Verwendung von CodeIgniter auf einem Linux-Server gestoßen bin
Vorsichtsmaßnahmen bei der Verwendung von Pit mit Python
Worauf ich bei der Verwendung von Airflow gestoßen bin
Bei Verwendung regulärer Ausdrücke in Python
Ich habe Dash und Streamlit in der Docker-Umgebung anhand von B-League-Daten verglichen