[PYTHON] Zusammenfassung der Verwendung von pandas.DataFrame.loc

"Loc" kann Zeilen und Spalten extrahieren, die die Bedingungen im DataFrame erfüllen. "Loc" wird häufig bei der Verwendung von Pandas angezeigt, es gibt jedoch Unterschiede in der Datenspezifikationsmethode. Daher möchte ich diesen Bereich zusammenfassen.

Informationen zur Datenspezifikation

Die folgenden Daten können für loc angegeben werden.

Es gibt viele Möglichkeiten, es zu verwenden ... (゜ _ ゜) Sie müssen beim Schreiben eines Programms vorsichtig sein, aber wenn Sie nicht ruhig unterscheiden, welches Muster beim Lesen implementiert wird, ist es wahrscheinlich "???". Ich werde jeden Beispielcode schreiben und die Operation überprüfen.

Ich habe es tatsächlich benutzt

Die Daten, die dieses Mal für die Operationsprüfung verwendet wurden, wurden von mir selbst erstellt.

import pandas as pd
loc_sample_data = pd.read_csv("loc_sample_data.csv",index_col="item_name")
loc_sample_data.head()

キャプチャ.JPG

Der Zeilenindex besteht aus Artikelname und die Spalten bestehen aus Preis, Lagerbestand und Produktionsbereich.

Angabe einer einzelnen Indexbezeichnung

Geben Sie die Indexbezeichnung (einzeln) der Zeile an, die Sie extrahieren möchten, und extrahieren Sie die Daten. Dieses Mal werden wir Punkt C extrahieren.

loc_sample_data.loc["itemC"]

キャプチャ1.JPG

Ich konnte es extrahieren. Die extrahierten Daten sind vom Typ Serie.

Angeben der Indexbezeichnungsliste

Das obige Beispiel extrahiert nur eine einzelne Zeile, es ist jedoch möglich, mehrere Zeilen anzugeben / zu extrahieren. Wenn Sie mehrere angeben möchten, geben Sie diese in der Liste an. Als nächstes werden wir itemA und itemD extrahieren.

loc_sample_data.loc[["itemA", "itemD"]]

キャプチャ2.JPG

Ich konnte es extrahieren. Die extrahierten Daten waren vom Typ DataFrame.

Angeben einer einzelnen Zeilen- oder Spaltenbezeichnung

Es ist auch möglich, Daten zu extrahieren, indem die entsprechenden Beschriftungen für die Zeilen und Spalten angegeben werden. Geben Sie diesmal Zeile → ElementB und Spalte → Erzeugungsbereich an, um Daten zu extrahieren.

loc_sample_data.loc["itemB", "producing_area"]

キャプチャ3.JPG Ich konnte es extrahieren. Extrahierter Datenstr-Typ. In diesem Beispiel handelt es sich um den extrahierten Datenstr-Typ. Dies hängt jedoch vom Inhalt der im DataFrame gespeicherten Daten ab.

Festlegen von Zeilen- und Spaltenbeschriftungen mithilfe von Slices

Sie können mithilfe von Slices mehrere Zeilen und Spalten angeben. Verwenden Sie diese Option, um die Preise für Artikel A und Artikel B zu extrahieren.

loc_sample_data.loc["itemA":"itemB","price"]

キャプチャ4.JPG

Ich konnte es extrahieren. Benutzt du das ...?

Angeben von Daten mithilfe einer booleschen Liste

Durch Angabe einer booleschen Liste mit derselben Länge (Anzahl der Zeilen) wie der Quelldatenrahmen können nur echte Zeilen extrahiert werden. Dieses Mal werde ich itemB und itemD extrahieren.

loc_sample_data.loc[[False, True, False, True]]

キャプチャ5.JPG Ich konnte es extrahieren. Es scheint, dass es keine Möglichkeit gibt, dies zu verwenden, wenn es sich um einen einzelnen Schuss handelt, aber es scheint, dass es eine Verwendung gibt, wenn Sie im Voraus beurteilen, ob die Extraktionsbedingungen für jede Zeile erfüllt sind, und eine Liste erstellen.

Datenspezifikation unter Verwendung von bedingten Ausdrücken

Es ist das, was Sie am wahrscheinlichsten verwenden. Dieses Mal werde ich versuchen, Daten (itemC, itemD) zu extrahieren, deren Preis größer als 500 ist.

loc_sample_data.loc[loc_sample_data["price"] > 500]

キャプチャ6.JPG

Ich konnte es extrahieren. Wenn es sich um eine einzelne Einheit handelt, scheint sie am häufigsten verwendet zu werden.

Extrahieren Sie nur bestimmte Spalten mit bedingten Ausdrücken

Geben Sie zusätzlich zu dem obigen bedingten Ausdruck eine bestimmte Spalte an und extrahieren Sie. Die Bedingungen sind die gleichen wie zuvor, aber dieses Mal wird nur die Spalte "produzierendes Gebiet" extrahiert.

loc_sample_data.loc[loc_sample_data["price"] > 500, ["producing_area"]]

キャプチャ7.JdPG.JPG

Schließlich

Es gibt viele Möglichkeiten, es zu verwenden, aber die, die Sie unbedingt lernen sollten, ist die Datenextraktion mit bedingten Ausdrücken. Ich bin diesmal etwas lang und müde, also werde ich es beenden. Wir sehen uns im nächsten Beitrag!

Recommended Posts

Zusammenfassung der Verwendung von pandas.DataFrame.loc
Zusammenfassung der Verwendung von pyenv-virtualenv
Zusammenfassung der Verwendung von csvkit
[Python2.7] Zusammenfassung der Verwendung von unittest
Zusammenfassung der Verwendung der Python-Liste
[Python2.7] Zusammenfassung der Verwendung des Unterprozesses
Zusammenfassung der Verwendung von MNIST mit Python
[Python] Zusammenfassung der Verwendung von Split- und Join-Funktionen
scikit-learn Verwendung der Zusammenfassung (maschinelles Lernen)
Berechnen Verwenden Sie% des Befehls df
Jupyter Notebook Grundlagen der Verwendung
Grundlagen von PyTorch (1) - Verwendung von Tensor-
Zusammenfassung des Schreibens von AWS Lambda
[Frage] Wie verwende ich plot_surface von Python?
Verwendung von xml.etree.ElementTree
Wie benutzt man Python-Shell
Hinweise zur Verwendung von tf.data
Verwendung von virtualenv
Verwendung von Image-Match
Wie man Shogun benutzt
Verwendung von Pandas 2
Verwendung von Virtualenv
Verwendung von numpy.vectorize
Verwendung von pytest_report_header
Wie man teilweise verwendet
Wie man Bio.Phylo benutzt
Verwendung von SymPy
Wie man x-means benutzt
Verwendung von WikiExtractor.py
Verwendung von IPython
Verwendung von virtualenv
Wie benutzt man Matplotlib?
Verwendung von iptables
Wie benutzt man numpy?
Verwendung von TokyoTechFes2015
Wie benutzt man venv
Verwendung des Wörterbuchs {}
Wie benutzt man Pyenv?
Verwendung der Liste []
Wie man Python-Kabusapi benutzt
Verwendung von OptParse
Verwendung von return
Wie man Imutils benutzt
Verwendung von Folium (Visualisierung von Standortinformationen)
[Python] Verwendung von zwei Arten von type ()
Zusammenfassung zum Importieren von Dateien in Python 3
Nicht viel erwähnt, wie man Pickle benutzt
Zusammenfassung des Studiums von Python zur Verwendung von AWS Lambda
Verwendung von Qt Designer
Verwendung der Suche sortiert
[gensim] Verwendung von Doc2Vec
python3: Verwendung der Flasche (2)
Verstehen Sie, wie man Django-Filter verwendet
Verwendung des Generators
[Python] Verwendung von Liste 1
Verwendung von FastAPI ③ OpenAPI