"Loc" kann Zeilen und Spalten extrahieren, die die Bedingungen im DataFrame erfüllen. "Loc" wird häufig bei der Verwendung von Pandas angezeigt, es gibt jedoch Unterschiede in der Datenspezifikationsmethode. Daher möchte ich diesen Bereich zusammenfassen.
Die folgenden Daten können für loc angegeben werden.
Es gibt viele Möglichkeiten, es zu verwenden ... (゜ _ ゜) Sie müssen beim Schreiben eines Programms vorsichtig sein, aber wenn Sie nicht ruhig unterscheiden, welches Muster beim Lesen implementiert wird, ist es wahrscheinlich "???". Ich werde jeden Beispielcode schreiben und die Operation überprüfen.
Die Daten, die dieses Mal für die Operationsprüfung verwendet wurden, wurden von mir selbst erstellt.
import pandas as pd
loc_sample_data = pd.read_csv("loc_sample_data.csv",index_col="item_name")
loc_sample_data.head()
Der Zeilenindex besteht aus Artikelname und die Spalten bestehen aus Preis, Lagerbestand und Produktionsbereich.
Geben Sie die Indexbezeichnung (einzeln) der Zeile an, die Sie extrahieren möchten, und extrahieren Sie die Daten. Dieses Mal werden wir Punkt C extrahieren.
loc_sample_data.loc["itemC"]
Ich konnte es extrahieren. Die extrahierten Daten sind vom Typ Serie.
Das obige Beispiel extrahiert nur eine einzelne Zeile, es ist jedoch möglich, mehrere Zeilen anzugeben / zu extrahieren. Wenn Sie mehrere angeben möchten, geben Sie diese in der Liste an. Als nächstes werden wir itemA und itemD extrahieren.
loc_sample_data.loc[["itemA", "itemD"]]
Ich konnte es extrahieren. Die extrahierten Daten waren vom Typ DataFrame.
Es ist auch möglich, Daten zu extrahieren, indem die entsprechenden Beschriftungen für die Zeilen und Spalten angegeben werden. Geben Sie diesmal Zeile → ElementB und Spalte → Erzeugungsbereich an, um Daten zu extrahieren.
loc_sample_data.loc["itemB", "producing_area"]
Ich konnte es extrahieren. Extrahierter Datenstr-Typ. In diesem Beispiel handelt es sich um den extrahierten Datenstr-Typ. Dies hängt jedoch vom Inhalt der im DataFrame gespeicherten Daten ab.
Sie können mithilfe von Slices mehrere Zeilen und Spalten angeben. Verwenden Sie diese Option, um die Preise für Artikel A und Artikel B zu extrahieren.
loc_sample_data.loc["itemA":"itemB","price"]
Ich konnte es extrahieren. Benutzt du das ...?
Durch Angabe einer booleschen Liste mit derselben Länge (Anzahl der Zeilen) wie der Quelldatenrahmen können nur echte Zeilen extrahiert werden. Dieses Mal werde ich itemB und itemD extrahieren.
loc_sample_data.loc[[False, True, False, True]]
Ich konnte es extrahieren. Es scheint, dass es keine Möglichkeit gibt, dies zu verwenden, wenn es sich um einen einzelnen Schuss handelt, aber es scheint, dass es eine Verwendung gibt, wenn Sie im Voraus beurteilen, ob die Extraktionsbedingungen für jede Zeile erfüllt sind, und eine Liste erstellen.
Es ist das, was Sie am wahrscheinlichsten verwenden. Dieses Mal werde ich versuchen, Daten (itemC, itemD) zu extrahieren, deren Preis größer als 500 ist.
loc_sample_data.loc[loc_sample_data["price"] > 500]
Ich konnte es extrahieren. Wenn es sich um eine einzelne Einheit handelt, scheint sie am häufigsten verwendet zu werden.
Geben Sie zusätzlich zu dem obigen bedingten Ausdruck eine bestimmte Spalte an und extrahieren Sie. Die Bedingungen sind die gleichen wie zuvor, aber dieses Mal wird nur die Spalte "produzierendes Gebiet" extrahiert.
loc_sample_data.loc[loc_sample_data["price"] > 500, ["producing_area"]]
Es gibt viele Möglichkeiten, es zu verwenden, aber die, die Sie unbedingt lernen sollten, ist die Datenextraktion mit bedingten Ausdrücken. Ich bin diesmal etwas lang und müde, also werde ich es beenden. Wir sehen uns im nächsten Beitrag!
Recommended Posts