[PYTHON] Pandas Grundlagen für Anfänger ① Lesen & Verarbeiten

Was ist Pandas?

Ein Datenrahmenobjekt für die Verarbeitung strukturierter Daten in Python. Sie können Dateien leicht lesen und nachfolgende SQL-Vorgänge ausführen. Für Arbeiten wie maschinelles Lernen müssen Daten verarbeitet, berechnet und visualisiert werden. Eine Memoliste häufig verwendeter Syntaxen für die Datenmanipulation. Dieser Abschnitt befasst sich mit dem Lesen und Verarbeiten von Daten.

Bibliotheksimport

Importiere Pandas mit dem Namen pd

python


import pandas as pd

Datei lesen

python


dataflame = pd.read_csv('file.csv')

Excel usw. kann mit derselben Methode gelesen werden. Offizielle Pandas-Dokumentation [Eingabe / Ausgabe]

Datenbestätigung

Geben Sie die gewünschte Nummer in Klammern ein.

python


dataflame.head(10)

Die Anzeige von Anfang an ist "Kopf" und die Anzeige von Ende ist "Schwanz".

Spalte erstellen

Fügen Sie die vorhandenen "Spalte1" und "Spalte2" hinzu, um "Spalte3" zu erstellen.

python


dataflame['column3'] = dataflame['column1'] + dataflame['column2']

Beitreten

"Left Outer Join" mit "dataflame1" und "dataflame2" in der Spalte "key", um "join_dataflame" zu erstellen.

python


join_dataflame = pd.merge(dataflame1, dataflame2, on = 'key', how = 'left')

Wenn Sie die Spalten einschränken möchten, fügen Sie dataflame1 [['column1', 'column1']] hinzu.

Datenmüll

Speichern Sie die Daten mit csv.

python


dataflame.to_csv('dump_file.csv', index = false, encoding = 'utf-8', sep=",")

"Index" gibt das Vorhandensein oder Fehlen eines Headers an, "encoding" gibt die Codierung an und "sep" gibt das Trennzeichen an.

Überprüfen Sie die Anzahl der Daten

Überprüfen Sie die Anzahl der "Datenflammen".

python


print(len(dataflame))

Recommended Posts

Pandas Grundlagen für Anfänger ① Lesen & Verarbeiten
Pandas Grundlagen für Anfänger ⑧ Ziffernverarbeitung
Pandas Basics Summary Link für Anfänger
Pandas-Grundlagen für Anfänger ② Übersicht über die Daten
Seaborn Basics für Anfänger ④ Pairplot
100 Pandas klopfen für Python-Anfänger
Seaborn Grundlagen für Anfänger ② Histogramm (Distplot)
Pandas Grundlagen
[Muss für Anfänger] Grundlagen von Linux
Pandas Grundlagen
Pandas-Grundlagen für Anfänger ④ Umgang mit Datums- und Zeitangaben
Verarbeiten von Memos, die häufig bei Pandas (Anfängern) verwendet werden
Python Pandas ist nicht für die Stapelverarbeitung geeignet
[Pandas] Grundlagen der Verarbeitung von Datumsdaten mit dt
100 Sprachverarbeitung Knock-20 (unter Verwendung von Pandas): Lesen von JSON-Daten
[Zur Aufnahme] Pandas Memorandum
Spacemacs-Einstellungen (für Anfänger)
Python-Grundlagen ② für Anweisung
Datensätze mit Pandas verarbeiten (1)
Datensätze mit Pandas verarbeiten (2)
Zusammenfassung der Vorverarbeitungsmethoden für Python-Anfänger (Pandas-Datenrahmen)
MongoDB-Grundlagen: Transaktionsverarbeitung
Pandas-Formatdatei lesen
Python Lehrbuch für Anfänger
100 Sprachverarbeitung Knock: Kapitel 2 UNIX-Befehlsgrundlagen (mit Pandas)
100 Sprachverarbeitung Knock-30 (unter Verwendung von Pandas): Lesen der Ergebnisse der morphologischen Analyse
[Linux] Grundlagen der Berechtigungseinstellung von chmod für Anfänger
Dikstra-Algorithmus für Anfänger
OpenCV für Python-Anfänger
Seaborn-Grundlagen für Anfänger ③ Streudiagramm (Jointplot) * Mit Histogramm
[Für Anfänger] Grundlagen von Python erklärt durch Java Gold Teil 2
[Erklärung für Anfänger] Einführung in die Faltverarbeitung (erklärt in TensorFlow)
[Erklärung für Anfänger] Einführung in die Pooling-Verarbeitung (erklärt in TensorFlow)
[Für Anfänger] Grundlagen von Python erklärt durch Java Gold Teil 1
Lernablauf für Python-Anfänger
[Für Anfänger] Kaggle-Übung (Merucari)
Empfohlene Linux-Distribution für Anfänger
CNN (1) zur Bildklassifizierung (für Anfänger)
Python3-Umgebungskonstruktion (für Anfänger)
Übersicht über Docker (für Anfänger)
Python #Funktion 2 für Super-Anfänger
Grundlegende Python-Grammatik für Anfänger
Python #Funktion 1 für Super-Anfänger
Python #Liste für Super-Anfänger
~ Tipps für Python-Anfänger mit Liebe von Pythonista ③ ~
[Für Kaggle-Anfänger] Titanic (LightGBM)
Linux Command Memorandum [für Anfänger]
Datenverarbeitungstipps mit Pandas
Praktische Linux-Verknüpfung (für Anfänger)
[Python] Iterative Verarbeitung (für, während)
[Pandas] Ich habe versucht, Verkaufsdaten mit Python zu analysieren. [Für Anfänger]
Seaborn-Grundlagen für Anfänger ① Aggregiertes Diagramm der Anzahl der Daten (Countplot)