Ein Datenrahmenobjekt für die Verarbeitung strukturierter Daten in Python. Sie können Dateien leicht lesen und nachfolgende SQL-Vorgänge ausführen. Für Arbeiten wie maschinelles Lernen müssen Daten verarbeitet, berechnet und visualisiert werden. Eine Memoliste häufig verwendeter Syntaxen für die Datenmanipulation. Dieser Abschnitt befasst sich mit dem Lesen und Verarbeiten von Daten.
Importiere Pandas mit dem Namen pd
python
import pandas as pd
python
dataflame = pd.read_csv('file.csv')
Excel usw. kann mit derselben Methode gelesen werden. Offizielle Pandas-Dokumentation [Eingabe / Ausgabe]
Geben Sie die gewünschte Nummer in Klammern ein.
python
dataflame.head(10)
Die Anzeige von Anfang an ist "Kopf" und die Anzeige von Ende ist "Schwanz".
Fügen Sie die vorhandenen "Spalte1" und "Spalte2" hinzu, um "Spalte3" zu erstellen.
python
dataflame['column3'] = dataflame['column1'] + dataflame['column2']
"Left Outer Join" mit "dataflame1" und "dataflame2" in der Spalte "key", um "join_dataflame" zu erstellen.
python
join_dataflame = pd.merge(dataflame1, dataflame2, on = 'key', how = 'left')
Wenn Sie die Spalten einschränken möchten, fügen Sie dataflame1 [['column1', 'column1']] hinzu.
Speichern Sie die Daten mit csv.
python
dataflame.to_csv('dump_file.csv', index = false, encoding = 'utf-8', sep=",")
"Index" gibt das Vorhandensein oder Fehlen eines Headers an, "encoding" gibt die Codierung an und "sep" gibt das Trennzeichen an.
Überprüfen Sie die Anzahl der "Datenflammen".
python
print(len(dataflame))
Recommended Posts