Python-Anwendung: Pandas Teil 1: Basic

Ich werde ab heute über Pandas posten.

Was ist Pandas?

Eine Bibliothek für Datenbanken in Python.

Speziell Eine Bibliothek für den Umgang mit Datensätzen wie NumPy. NumPy kann Daten als mathematische Matrix behandeln und ist auf wissenschaftliche Berechnungen spezialisiert.

Pandas hingegen können Vorgänge ausführen, die mit gängigen Datenbanken ausgeführt werden können. Zusätzlich zu numerischen Werten können Sie problemlos Zeichenfolgendaten wie Name und Adresse verarbeiten.

Mit NumPy und Pandas können Daten effizient analysiert werden.

Zwei Arten von Datenstrukturen

In Pandas gibt es zwei Arten von Datenstrukturen: Series und DataFrame.

DataFrame Es handelt sich um eine Datenstruktur, die hauptsächlich verwendet wird und durch eine zweidimensionale Tabelle dargestellt wird. Horizontale Daten werden als Zeile und vertikale Daten als Spalte bezeichnet.

Jede Zeile und jede Spalte ist beschriftet Die Zeilenbezeichnung ist der Index Spaltenbeschriftungen werden als Spalten bezeichnet.

Series Es ist ein eindimensionales Array, das als Zeile oder Spalte eines DataFrame betrachtet werden kann. Auch hier ist jedes Element beschriftet.

Beispiel einer Datenstruktur

image.png

Der Index ist [0, 1, 2, 3, 4]. Außerdem sind die Spalten ["Präfektur", "Gebiet", "Bevölkerung", "Region"].

Überprüfen von Serien- und DataFrame-Daten

Serie ist Daten vom Wörterbuchtyp ({Schlüssel1: Wert1, Schlüssel2: Wert2, ...}) Beim Übergeben wird der Schlüssel in aufsteigender Reihenfolge sortiert.

#Seriendaten

import pandas as pd

fruits = {"orange": 2, "banana": 3}
print(pd.Series(fruits))
#Ausgabeergebnis
banana    3
orange    2
dtype: int64
#Ebenso wird DataFrame nach Schlüssel in aufsteigender Reihenfolge sortiert, wenn keine Spalten angegeben sind.
#Daten in DataFrame

import pandas as pd

data = {"fruits": ["apple", "orange", "banana", "strawberry", "kiwifruit"],
        "year": [2001, 2002, 2001, 2008, 2006],
        "time": [1, 4, 5, 6, 3]}
df = pd.DataFrame(data)
print(df)
#Ausgabeergebnis
       fruits  time  year
0       apple     1  2001
1      orange     4  2002
2      banana     5  2001
3  strawberry     6  2008
4   kiwifruit     3  2006
#Verwenden Sie zum Festlegen der Sortierreihenfolge Spalten als zweites Argument (siehe unten).=[aufführen]Angegeben.

import pandas as pd
df = pd.DataFrame(data, columns=["year", "time", "fruits"])
print(df)
#Ausgabeergebnis
   year  time      fruits
0  2001     1       apple
1  2002     4      orange
2  2001     5      banana
3  2008     6  strawberry
4  2006     3   kiwifruit

Recommended Posts

Python-Anwendung: Pandas Teil 1: Basic
Python-Anwendung: Pandas Teil 2: Serie
Python-Anwendung: Datenvisualisierung Teil 1: Grundlegend
Anwendung von Python: Pandas Teil 4: Verketten und Kombinieren von DataFrames
Python Basic Memorandum Teil 2
Python-Grundnotiz - Teil 2
Python-Grundnotiz - Teil 1
Python-Anwendung: Pandas # 3: Dataframe
Python Basic - Pandas, Numpy -
Python-Grammatik-Grundnotiz (1)
Anwendung von Python: Datenbereinigung Teil 1: Python-Notation
Python-Anwendung: Datenverarbeitung # 3: Datenformat
Python-Anwendung: Numpy Teil 3: Double Array
1. Mit Python 1-1 gelernte Statistiken. Grundlegende Statistiken (Pandas)
QGIS + Python Teil 2
RF Python Basic_01
Meine Pandas (Python)
Anwendung von Python: Datenvisualisierung Teil 3: Verschiedene Grafiken
QGIS + Python Teil 1
Python-Grundschrift
Python: Scraping Teil 1
Grundlegende Grammatik von Python3
Python Basic Memorandum Teil 3 - Informationen zur Objektorientierung
RF Python Basic_02
Python Pandas Memo
Lösung Wenn Sie Python 3.6 oder höher verwenden, benötigen Sie die enum34-Bibliothek ebenfalls nicht. Deinstallieren Sie sie daher und verwenden Sie das Standard-Enum-Modul. Enum34 deinstallieren Führen Sie nach der Deinstallation von enum34 erneut `pip install optuna` aus und Sie haben Optuna erfolgreich installiert! Python, pip, Python3, enum, OptunaPython3 Beginn Teil 1
Python: Scraping Teil 2
Pandas Serie Teil 1
(Hinweis) Grundlegende Statistiken zu Python und Pandas unter IBM DSX
Anwendung von Python: Datenverarbeitung Teil 2: Analyse verschiedener Datenformate
Grundlegende Bedienung von Python Pandas Series und Dataframe (1)
Python-Grundkurs (12 Funktionen)
Python Memo Basic Edition
Python-Grundkurs (7 Wörterbuch)
Python-Grundkurs (2 Python-Installation)
Grundlegende Sortierung in Python
Python-Grundkurs (9 Iterationen)
Grundlegende Bedienung von Pandas
Grundmethode der [Python] -Klasse
Python-Grundkurs (11 Ausnahmen)
Python-Grundkurs (6 Sätze)
Grundlegende Bedienung von Pandas
Python3 Spickzettel (Basic)
Python-Grundgrammatik (Sonstiges)
Python-Grundkurs (Einführung)
Pandas auf python2.6 installieren
Python Basic ② in Windows
Python-Grundkurs (13 Klassen)
Grundlegende Python-Befehlsnotizen
Grundkenntnisse in Python
Python grundlegende Grammatik Memo
Anwendung von Python 3 vars
Python Memorandum Super Basic
Python-Grundkurs (8 Zweige)
Python grundlegende if-Anweisung