Aus der Fortsetzung des letzten Males
Ich werde eine Serie veröffentlichen, die sich mit eindimensionalen Arrays befasst.
Im Grunde ist es dasselbe wie Numpy, Pandas importieren, umbenennen und verwenden.
import pandas as pd
#Pandas mit Import eingeführt
#Aktiviert, um Pandas mit pd mit as zu behandeln.
Eine der Datenstrukturen von Pandas, Series, kann wie ein eindimensionales Array behandelt werden.
Sie können eine Serie generieren, indem Sie eine Liste mit Wörterbuchtypen in Form von pd.Series (Liste mit Wörterbuchtypen) übergeben.
Sie können eine Serie auch generieren, indem Sie die Daten und den damit verbundenen Index angeben.
pd.Series(Datenarray, index=Indexarray) #Geben Sie in diesem Format an.
Wenn kein Index angegeben ist, werden Ganzzahlen automatisch als Indizes in aufsteigender Reihenfolge von 0 hinzugefügt.
Wenn Sie Serien ausgeben
dtype: int64
Obwohl es wie oben ausgegeben wird Gibt an, dass der in Series gespeicherte Wert vom Datentyp "int64" ist. dtype steht für "Datentyp" und bezieht sich auf den Datentyp. (Wenn die Daten eine Ganzzahl sind, "int", wenn sie einen Dezimalpunkt haben, "float" usw.)
int64 ist eine Ganzzahl mit einer Größe von 64 Bit von −263−263 bis 263-1263-1. Es kann ganze Zahlen verarbeiten.
Es gibt andere dtypes wie int32, die dieselbe Ganzzahl, aber unterschiedliche Größen haben. Beispielsweise hat der Bool-Typ nur 0 oder 1 als Wert.
import pandas as pd
fruits = {"banana": 3, "orange": 2}
print(pd.Series(fruits))
#Ausgabeergebnis
banana 3
orange 2
dtype: int64
Beim Umgang mit pd beschäftigen wir uns mit der Series-Methode Beachten Sie, dass der Kopf als S großgeschrieben wird.
Beim Verweisen auf Elemente von Serien So geben Sie die Indexnummer an Es gibt eine Möglichkeit, den Indexwert anzugeben.
Durch Angabe von Serien [: 3] usw. wie der Slice-Notation der Liste Sie können jeden Bereich abrufen.
Beziehen Sie sich auf die Indexwerte der gewünschten Elemente in einer Liste. Wenn Sie anstelle einer Liste einen ganzzahligen Wert angeben, können Sie nur die Daten abrufen, die dieser Position entsprechen.
Im folgenden Code wird die Indexnummer mithilfe von Slices angegeben und die Daten werden abgerufen.
import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[0:2])
#Weil die Reihenfolge beim Konvertieren in Serien erhalten bleibt
#Neben Banane ist Orange.
# (Pandas Version ist 0.23.Wenn es vor 0 ist,
#Da die Schlüssel in aufsteigender Reihenfolge sortiert sind, ist die alphabetische Reihenfolge nach der Banane Traube.)
#Ausgabeergebnis
banana 3
orange 4
#Der folgende Code ruft die Daten ab, indem die Indexwerte in einer Liste angegeben werden.
import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[["orange", "peach"]])
#Ausgabeergebnis
orange 4
peach 5
#Der folgende Code gibt die Indexnummer an und ruft ein einzelnes Datenelement ab.
import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[3])
#Ausgabeergebnis
5
Bei der Angabe des Indexwerts wie unten gezeigt Muss in doppelten Klammern angegeben werden
[[]]
#Beispiel
import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[["orange", "peach"]]) #Achten Sie hier
Es gibt eine Methode, um nur den Datenwert der erstellten Serie oder nur den Index abzurufen.
import pandas as pd
index = ["soccer", "tennis", "basketball"]
data = [11, 4, 10]
series = pd.Series(data, index=index)
print(series.values)
#Ausgabeergebnis
[11 4 10]
Als Indexreferenz
import pandas as pd
index = ["soccer", "tennis", "basketball"]
data = [11, 4, 10]
series = pd.Series(data, index=index)
print(series.index)
#Ausgabeergebnis
Index(['soccer', 'tennis', 'basketball'], dtype='object')
Wenn Sie einer Serie ein Element hinzufügen, muss das hinzuzufügende Element auch vom Typ Serie sein.
Konvertieren Sie das Element, das Sie hinzufügen möchten, im Voraus zum Serientyp
Sie kann mithilfe des Variablennamens .append () des Serientyps des Additionsziels hinzugefügt werden.
import pandas as pd
fruits = {"banana": 3, "orange": 2}
series = pd.Series(fruits)
print(series)
#Ausgabeergebnis
banana 3
orange 2
dtype: int64
#Die obige Serie wird weggelassen
grape = {"grape": 3}
series = series.append(pd.Series(grape))
print(series)
#Ausgabeergebnis
banana 3
orange 2
grape 3
dtype: int64
#Sie können es auch wie folgt hinzufügen, ohne es vorher zu konvertieren.
series = series.append(pd.Series([3], index=["grape"]))
Sie können ein Element mithilfe der Serienindexreferenz löschen.
Wenn die Variable vom Typ Serie Serie ist
series.drop("Indexwert")
#Sie können das Element jetzt mit dem angegebenen Indexwert entfernen.
fruits = {"banana": 3, "orange": 2}
series = pd.Series(fruits)
series= series.drop("banana")
#Ausgabeergebnis
orange 2
Möglicherweise möchten Sie Elemente extrahieren, die den Bedingungen in Serientypdaten entsprechen.
Wenn Sie in Pandas eine Bool-Typsequenz angeben Es können nur wahre extrahiert werden.
Eine Sequenz ist eine "kontinuierliche" oder "Reihenfolge".
import pandas as pd
index = ["apple", "orange", "banana", "strawberry", "kiwifruit"]
data = [10, 5, 8, 12, 3]
series = pd.Series(data, index=index)
conditions = [True, True, False, False, False]
print(series[conditions])
#Ausgabeergebnis
apple 10
orange 5
Ich habe hier eine Bool-Typ-Sequenz erstellt. Wenn Sie in Pandas einen bedingten Ausdruck mit Series (oder DataFrame) erstellen Sie können eine Bool-Sequenz erhalten.
series[series >= 5]
Wenn Sie wie oben angeben Sie können nur Elemente mit einem Wert von 5 oder höher erhalten.
#Im Falle einer UND-Bedingung
series[ ][ ] #[ ]Geben Sie die UND-Bedingung an, indem Sie mehrere anordnen
series[(Bedingung 1)&(Bedingung 2)]
#Für OP-Bedingungen
series[(Bedingung 1)|(Bedingung 2)]
# (Bedingungen)Zu|Verbinden mit (Hub).
In der Serie können Sie Indizes bzw. Daten sortieren. Wenn die Variable vom Typ Serie Serie ist
series.sort_index() #Indexsortierung
series.sort_values() #Daten sortieren
Sofern nicht anders angegeben, wird es in aufsteigender Reihenfolge sortiert. Wenn Sie das Folgende als Argument übergeben, wird es in absteigender Reihenfolge angezeigt.
ascending=False #Wenn Sie dies übergeben, wird es in absteigender Reihenfolge sortiert.
#In aufsteigender Reihenfolge sortieren
import pandas as pd
index = ["apple", "orange", "banana", "strawberry", "kiwifruit"]
data = [10, 5, 8, 12, 3]
series = pd.Series(data, index=index)
items1 = series.sort_index()
print(items1)
#Ausgabeergebnis
apple 10
banana 8
kiwifruit 3
orange 5
strawberry 12
#In absteigender Reihenfolge sortieren
items2 = series.sort_values(ascending=False)
print(items2)
#Ausgabeergebnis
strawberry 12
apple 10
banana 8
orange 5
kiwifruit 3
Recommended Posts