[PYTHON] Pandas-Grundlagen für Anfänger ② Übersicht über die Daten

Was ist Pandas?

Ein Datenrahmenobjekt für die Verarbeitung strukturierter Daten in Python. Danach können Sie problemlos Dateien lesen und SQL-Vorgänge ausführen. Für Arbeiten wie maschinelles Lernen müssen Daten verarbeitet, berechnet und visualisiert werden. Eine Memoliste häufig verwendeter Syntaxen für die Datenmanipulation. Dieser Abschnitt gibt einen Überblick über die Daten.

Bibliotheksimport

Importiere Pandas mit dem Namen pd

python


import pandas as pd

Überprüfen Sie die Anzahl der Daten

Überprüfen Sie die Anzahl der "Datenflammen".

python


print(len(dataflame))

Datentypbestätigung

python


dataflame.dtypes

Statistikanzeige (numerische Daten)

python


dataflame.describe

Gesamtanzahl (Anzahl der Daten), Mittelwert (Mittelwert), Standard (Standardabweichung), min (Minimum), 25% usw. (Viertelwert), max (Maximum).

Statistikanzeige (kategoriale Daten)

python


dataflame.describe(include='O')

Es ist o, nicht null. Gesamtanzahl (Anzahl der Daten), eindeutig (Anzahl der eindeutigen Daten), top (Wert des am häufigsten vorkommenden Elements), freq (Anzahl der Elemente). Wenn Sie es zusammen mit dem numerischen Wert anzeigen möchten, verwenden Sie "beschreiben (include = 'all')".

Bestätigung fehlender Werte

Überprüfen Sie nach dem Lesen der Anfangsdaten und nach dem Verbinden, ob der Wert korrekt ist.

python


dataflame.isnull().sum()

Recommended Posts

Pandas-Grundlagen für Anfänger ② Übersicht über die Daten
Übersicht über Docker (für Anfänger)
Pandas Grundlagen für Anfänger ① Lesen & Verarbeiten
[Muss für Anfänger] Grundlagen von Linux
Pandas Basics Summary Link für Anfänger
Pandas-Grundlagen für Anfänger ④ Umgang mit Datums- und Zeitangaben
Seaborn-Grundlagen für Anfänger ① Aggregiertes Diagramm der Anzahl der Daten (Countplot)
Pandas-Grundlagen für Anfänger ③ Erstellen Sie ein Histogramm mit matplotlib
[Für Anfänger] Skript innerhalb von 10 Zeilen (5. Resample von Zeitreihendaten mit Pandas)
[Pandas] Grundlagen der Verarbeitung von Datumsdaten mit dt
Einfaches Verständnis von Python für & Arrays (für Super-Anfänger)
Ein Memorandum of Method, das häufig bei der Analyse von Daten mit Pandas verwendet wird (für Anfänger)
Zusammenfassung der Vorverarbeitungsmethoden für Python-Anfänger (Pandas-Datenrahmen)
Analyse der Messdaten ①-Memorandum of Scipy Fitting-
[Linux] Grundlagen der Berechtigungseinstellung von chmod für Anfänger
Seaborn Basics für Anfänger ④ Pairplot
100 Pandas klopfen für Python-Anfänger
[Für Anfänger] Grundlagen von Python erklärt durch Java Gold Teil 2
So erhalten Sie einen Überblick über Ihre Daten in Pandas
[Für Anfänger] Grundlagen von Python erklärt durch Java Gold Teil 1
Seaborn Grundlagen für Anfänger ② Histogramm (Distplot)
Lernen Sie die Grundlagen von Python ① Grundlegende Anfänger
[Pandas] Ich habe versucht, Verkaufsdaten mit Python zu analysieren. [Für Anfänger]
Grundlagen der Quanteninformationstheorie: Datenkomprimierung (1)
[Python] Protokoll des Studientreffens für Anfänger (7/15)
Pandas des Anfängers, vom Anfänger, für den Anfänger [Python]
Beispiel für eine effiziente Datenverarbeitung mit PANDAS
Grundlagen der Quanteninformationstheorie: Datenkomprimierung (2)
[Einführung in Data Scientist] Grundlagen von Python ♬
Best Practices für den Umgang mit Daten mit Pandas
Für SageMaker Anfänger-Material Links-
Praktisches Tool für Anfänger (unter Berücksichtigung von Ideen)
Grundprinzipien der Bilderkennungstechnologie (für Anfänger)
[Hikari-Python] Kapitel 09-01 Klassen (Grundlagen von Objekten)
Grundlegende Geschichte der Vererbung in Python (für Anfänger)
Pandas Daten lesen
Grundlagen von Python ①
Lassen Sie uns Covid-19 (Corona) -Daten mit Python analysieren [Für Anfänger]
[Übersetzung] NumPy Official Tutorial "NumPy: die absoluten Grundlagen für Anfänger"
Data Science 100 Knock ~ Kampf um weniger als Anfänger Teil3
Data Science 100 Knock ~ Kampf um weniger als Anfänger Teil6
Analyse von Finanzdaten durch Pandas und deren Visualisierung (2)
Exportieren Sie Zugriffsdaten für jeden Nutzer von Google Analytics.
[Für Anfänger] So studieren Sie den Python3-Datenanalysetest
Liste der Python-Bibliotheken für Datenwissenschaftler und Dateningenieure
Analyse von Finanzdaten durch Pandas und deren Visualisierung (1)
Masken sind nützlich für die Suche in Pandas-Datenrahmen
Ich habe das MNIST-Tutorial von tensorflow für Anfänger ausprobiert.
Data Science 100 Knock ~ Kampf um weniger als Anfänger Teil5
Data Science 100 Knock ~ Kampf um weniger als Anfänger Teil2
Data Science 100 Knock ~ Kampf um weniger als Anfänger Teil1
Data Science 100 Knock ~ Kampf um weniger als Anfänger Teil10
Übersicht und Tipps von Seaborn mit statistischer Datenvisualisierung
Data Science 100 Knock ~ Kampf um weniger als Anfänger Teil7
Zusammenfassung der beim Extrahieren von Daten verwendeten Pandas-Methoden [Python]
Techniken zum Verständnis der Grundlagen von Deep-Learning-Entscheidungen
Data Science 100 Knock ~ Kampf um weniger als Anfänger Teil4
Datensatz zur Auswertung des Spam-Reviewer-Erkennungsalgorithmus
Data Science 100 Knock ~ Kampf um weniger als Anfänger Teil8