Python-Anwendung: Pandas Teil 2: Serie

Aus der Fortsetzung des letzten Males

Ich werde eine Serie veröffentlichen, die sich mit eindimensionalen Arrays befasst.

Seriengenerierung

Im Grunde ist es dasselbe wie Numpy, Pandas importieren, umbenennen und verwenden.

import pandas as pd
#Pandas mit Import eingeführt
#Aktiviert, um Pandas mit pd mit as zu behandeln.

Eine der Datenstrukturen von Pandas, Series, kann wie ein eindimensionales Array behandelt werden.

Sie können eine Serie generieren, indem Sie eine Liste mit Wörterbuchtypen in Form von pd.Series (Liste mit Wörterbuchtypen) übergeben.

Sie können eine Serie auch generieren, indem Sie die Daten und den damit verbundenen Index angeben.

pd.Series(Datenarray, index=Indexarray) #Geben Sie in diesem Format an.

Wenn kein Index angegeben ist, werden Ganzzahlen automatisch als Indizes in aufsteigender Reihenfolge von 0 hinzugefügt.

Wenn Sie Serien ausgeben

dtype: int64

Obwohl es wie oben ausgegeben wird Gibt an, dass der in Series gespeicherte Wert vom Datentyp "int64" ist. dtype steht für "Datentyp" und bezieht sich auf den Datentyp. (Wenn die Daten eine Ganzzahl sind, "int", wenn sie einen Dezimalpunkt haben, "float" usw.)

int64 ist eine Ganzzahl mit einer Größe von 64 Bit von −263−263 bis 263-1263-1. Es kann ganze Zahlen verarbeiten.

Es gibt andere dtypes wie int32, die dieselbe Ganzzahl, aber unterschiedliche Größen haben. Beispielsweise hat der Bool-Typ nur 0 oder 1 als Wert.

import pandas as pd

fruits = {"banana": 3, "orange": 2}
print(pd.Series(fruits))
#Ausgabeergebnis
banana    3
orange    2
dtype: int64

Serie (oberes Kapital)

Beim Umgang mit pd beschäftigen wir uns mit der Series-Methode Beachten Sie, dass der Kopf als S großgeschrieben wird.

Referenz

Beim Verweisen auf Elemente von Serien So geben Sie die Indexnummer an Es gibt eine Möglichkeit, den Indexwert anzugeben.

Durch Angabe von Serien [: 3] usw. wie der Slice-Notation der Liste Sie können jeden Bereich abrufen.

Beziehen Sie sich auf die Indexwerte der gewünschten Elemente in einer Liste. Wenn Sie anstelle einer Liste einen ganzzahligen Wert angeben, können Sie nur die Daten abrufen, die dieser Position entsprechen.

Im folgenden Code wird die Indexnummer mithilfe von Slices angegeben und die Daten werden abgerufen.

import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[0:2])

#Weil die Reihenfolge beim Konvertieren in Serien erhalten bleibt
#Neben Banane ist Orange.
# (Pandas Version ist 0.23.Wenn es vor 0 ist,
#Da die Schlüssel in aufsteigender Reihenfolge sortiert sind, ist die alphabetische Reihenfolge nach der Banane Traube.)

#Ausgabeergebnis
banana    3
orange    4

#Der folgende Code ruft die Daten ab, indem die Indexwerte in einer Liste angegeben werden.

import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[["orange", "peach"]])
#Ausgabeergebnis
orange    4
peach     5
#Der folgende Code gibt die Indexnummer an und ruft ein einzelnes Datenelement ab.

import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[3])
#Ausgabeergebnis
5

Hinweis: Indexwerte auflisten

Bei der Angabe des Indexwerts wie unten gezeigt Muss in doppelten Klammern angegeben werden

[[]]

#Beispiel
import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[["orange", "peach"]]) #Achten Sie hier

Daten und Index extrahieren

Es gibt eine Methode, um nur den Datenwert der erstellten Serie oder nur den Index abzurufen.

Datenwerte (Serienwerte)

import pandas as pd

index = ["soccer", "tennis", "basketball"]
data = [11, 4, 10]
series = pd.Series(data, index=index)
print(series.values)
#Ausgabeergebnis
[11  4 10]

Indexreferenz (series.index)

Als Indexreferenz

import pandas as pd

index = ["soccer", "tennis", "basketball"]
data = [11, 4, 10]
series = pd.Series(data, index=index)
print(series.index)
#Ausgabeergebnis
Index(['soccer', 'tennis', 'basketball'], dtype='object')

Fügen Sie ein Element hinzu

Wenn Sie einer Serie ein Element hinzufügen, muss das hinzuzufügende Element auch vom Typ Serie sein.

Konvertieren Sie das Element, das Sie hinzufügen möchten, im Voraus zum Serientyp

Sie kann mithilfe des Variablennamens .append () des Serientyps des Additionsziels hinzugefügt werden.

import pandas as pd

fruits = {"banana": 3, "orange": 2}
series = pd.Series(fruits)
print(series)
#Ausgabeergebnis
banana    3
orange    2
dtype: int64

#Die obige Serie wird weggelassen
grape = {"grape": 3}
series = series.append(pd.Series(grape))
print(series)
#Ausgabeergebnis
banana    3
orange    2
grape     3
dtype: int64

#Sie können es auch wie folgt hinzufügen, ohne es vorher zu konvertieren.

series = series.append(pd.Series([3], index=["grape"]))

Ein Element löschen (.drop)

Sie können ein Element mithilfe der Serienindexreferenz löschen.

Wenn die Variable vom Typ Serie Serie ist

series.drop("Indexwert")
#Sie können das Element jetzt mit dem angegebenen Indexwert entfernen.
fruits = {"banana": 3, "orange": 2}
series = pd.Series(fruits)
series= series.drop("banana")
#Ausgabeergebnis
orange    2

Filtern

Möglicherweise möchten Sie Elemente extrahieren, die den Bedingungen in Serientypdaten entsprechen.

Wenn Sie in Pandas eine Bool-Typsequenz angeben Es können nur wahre extrahiert werden.

Eine Sequenz ist eine "kontinuierliche" oder "Reihenfolge".

import pandas as pd

index = ["apple", "orange", "banana", "strawberry", "kiwifruit"]
data = [10, 5, 8, 12, 3]
series = pd.Series(data, index=index)

conditions = [True, True, False, False, False]
print(series[conditions])
#Ausgabeergebnis
apple     10
orange     5

Ich habe hier eine Bool-Typ-Sequenz erstellt. Wenn Sie in Pandas einen bedingten Ausdruck mit Series (oder DataFrame) erstellen Sie können eine Bool-Sequenz erhalten.

Nur bedingtes Element

series[series >= 5]

Wenn Sie wie oben angeben Sie können nur Elemente mit einem Wert von 5 oder höher erhalten.

UND Zustand

#Im Falle einer UND-Bedingung
series[ ][ ] #[ ]Geben Sie die UND-Bedingung an, indem Sie mehrere anordnen
series[(Bedingung 1)&(Bedingung 2)]

ODER Bedingung

#Für OP-Bedingungen
series[(Bedingung 1)|(Bedingung 2)]
# (Bedingungen)Zu|Verbinden mit (Hub).

Sortieren

In der Serie können Sie Indizes bzw. Daten sortieren. Wenn die Variable vom Typ Serie Serie ist

series.sort_index() #Indexsortierung
series.sort_values() #Daten sortieren

Sofern nicht anders angegeben, wird es in aufsteigender Reihenfolge sortiert. Wenn Sie das Folgende als Argument übergeben, wird es in absteigender Reihenfolge angezeigt.

ascending=False #Wenn Sie dies übergeben, wird es in absteigender Reihenfolge sortiert.
#In aufsteigender Reihenfolge sortieren
import pandas as pd

index = ["apple", "orange", "banana", "strawberry", "kiwifruit"]
data = [10, 5, 8, 12, 3]
series = pd.Series(data, index=index)

items1 = series.sort_index()
print(items1)
#Ausgabeergebnis
apple         10
banana         8
kiwifruit      3
orange         5
strawberry    12
#In absteigender Reihenfolge sortieren
items2 = series.sort_values(ascending=False)
print(items2)
#Ausgabeergebnis
strawberry    12
apple         10
banana         8
orange         5
kiwifruit      3

Recommended Posts

Python-Anwendung: Pandas Teil 2: Serie
Python-Anwendung: Pandas Teil 1: Basic
Pandas Serie Teil 1
Anwendung von Python: Pandas Teil 4: Verketten und Kombinieren von DataFrames
Python-Anwendung: Pandas # 3: Dataframe
Anwendung von Python: Datenbereinigung Teil 1: Python-Notation
Python-Anwendung: Datenverarbeitung # 3: Datenformat
[Python] Verwendung der Pandas-Serie
Python-Anwendung: Numpy Teil 3: Double Array
Python-Anwendung: Datenvisualisierung Teil 1: Grundlegend
QGIS + Python Teil 2
[Python] Was ist Pandas Series und DataFrame?
Meine Pandas (Python)
Anwendung von Python: Datenvisualisierung Teil 3: Verschiedene Grafiken
QGIS + Python Teil 1
Python: Scraping Teil 1
Hinzufügen von Serien zur Spalte in Python-Pandas
Python Pandas Memo
Lösung Wenn Sie Python 3.6 oder höher verwenden, benötigen Sie die enum34-Bibliothek ebenfalls nicht. Deinstallieren Sie sie daher und verwenden Sie das Standard-Enum-Modul. Enum34 deinstallieren Führen Sie nach der Deinstallation von enum34 erneut `pip install optuna` aus und Sie haben Optuna erfolgreich installiert! Python, pip, Python3, enum, OptunaPython3 Beginn Teil 1
Python: Scraping Teil 2
Anwendung von Python: Datenverarbeitung Teil 2: Analyse verschiedener Datenformate
Grundlegende Bedienung von Python Pandas Series und Dataframe (1)
Python: Zeitreihenanalyse
Python-Zeitreihenfrage
Pandas auf python2.6 installieren
Python Basic Memorandum Teil 2
Python-Grundnotiz - Teil 2
[Python-Lernteil 3] Konvertieren Sie Pandas DataFrame, Series und Standard List ineinander
Python-Grundnotiz - Teil 1
Anwendung von Python 3 vars
Python Basic - Pandas, Numpy -
"My Graph Generation Application" von Python (PySide + PyQtGraph) Teil 2
Webanwendung erstellt mit Python3.4 + Django (Teil.1 Umgebungskonstruktion)
"My Graph Generation Application" von Python (PySide + PyQtGraph) Teil 1
Einführung in Python numpy pandas matplotlib (für ~ B3 ~ part2)
Illustrierter Pandas-Funktionsanwendungsprozess
Python mit freeCodeCamp Teil1 studieren
Lesen Sie CSV mit Python-Pandas
Angrenzende Bilder mit Python Teil 1
Python 2-Serie und 3-Serie (Anaconda Edition)
Schaben mit Selen + Python Teil 1
Python: Schiffsüberlebensvorhersage Teil 2
[Python] Liste in Pandas konvertieren [Pandas]
Python-Pandas entfernen den Header-Bereich
Python: Überwachtes Lernen: Hyperparameter Teil 1
Python-Grammatik-Grundnotiz (1)
Python: Schiffsüberlebensvorhersage Teil 1
Python studieren mit freeCodeCamp part2
[Python] Ändere den Typ mit Pandas
Python-Anwendung: Datenverarbeitung Teil 1: Datenformatierung und Dateieingabe / -ausgabe
Bildverarbeitung mit Python (Teil 1)
Installieren Sie pandas 0.14 auf python3.4 [auf Mac]
Python-Anwendung: Datenvisualisierung # 2: matplotlib
Nampre mit Python lösen (Teil 2)
Installation der Python 3-Serie für Mac