Ein Datenrahmenobjekt für die Verarbeitung strukturierter Daten in Python. Danach können Sie problemlos Dateien lesen und SQL-Vorgänge ausführen. Für Arbeiten wie maschinelles Lernen müssen Daten verarbeitet, berechnet und visualisiert werden. Eine Memoliste häufig verwendeter Syntaxen für die Datenmanipulation. Dieser Abschnitt gibt einen Überblick über die Daten.
Importiere Pandas mit dem Namen pd
python
import pandas as pd
Überprüfen Sie die Anzahl der "Datenflammen".
python
print(len(dataflame))
python
dataflame.dtypes
python
dataflame.describe
Gesamtanzahl (Anzahl der Daten), Mittelwert (Mittelwert), Standard (Standardabweichung), min (Minimum), 25% usw. (Viertelwert), max (Maximum).
python
dataflame.describe(include='O')
Es ist o, nicht null. Gesamtanzahl (Anzahl der Daten), eindeutig (Anzahl der eindeutigen Daten), top (Wert des am häufigsten vorkommenden Elements), freq (Anzahl der Elemente). Wenn Sie es zusammen mit dem numerischen Wert anzeigen möchten, verwenden Sie "beschreiben (include = 'all')".
Überprüfen Sie nach dem Lesen der Anfangsdaten und nach dem Verbinden, ob der Wert korrekt ist.
python
dataflame.isnull().sum()
Recommended Posts