[Python] Operationsnotiz von Pandas DataFrame

Einführung

Weil ich die Möglichkeit hatte, Daten zu analysieren, obwohl ich ein Anfänger war Daher werde ich die grammatikalischen Elemente des neu erhaltenen Python DataFrame zusammenfassen.

Annahme

product.csv

id name price category isPopular
1 eraser 100 stationary 1
2 pencil 200 stationary 0
3 socks 400 clothes 1
4 pants 1000 clothes 0
5 apple 100 food 0

analyze.py


import pandas as pd

Extrahieren Sie den Wertetyp einer Spalte

df['category'].value_counts().index

Ausführungsergebnis

Index(['stationery', 'clothes', 'food'], dtype='object')

Ändern / fügen Sie den Wert von DataFrame hinzu, indem Sie die Bedingung angeben

df.loc[df.name == 'socks', 'price'] = 500
df.loc[df.category == 'stationery', 'category_id'] = 0
df.loc[df.category == 'clothes', 'category_id'] = 1
df.loc[df.category == 'food', 'category_id'] = 2
df

Ausführungsergebnis

id name price category isPopular category_id
1 eraser 100 stationary 1 0.0
2 pencil 200 stationary 0 0.0
3 socks 500 clothes 1 1.0
4 pants 1000 clothes 0 1.0
5 apple 100 food 0 2.0

Wechseln Sie zu einem heißen Ausdruck

#Spalte isPopular und Kategorie_Nur ID extrahieren (es funktioniert nur, wenn es sich um einen ganzzahligen Wert handelt)
df_X = df.drop(['id','name','price','category'], axis=1)

from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder()
enc.fit(df_X)
onehot_array = enc.transform(df_X).toarray()
onehot_df = pd.DataFrame(onehot_array)
df = pd.concat([df_id, onehot_df], axis=1)
df

Ausführungsergebnis

id 0 1 2 3 4
1 0.0 1.0 1.0 0.0 0.0
2 1.0 0.0 1.0 0.0 0.0
3 0.0 1.0 0.0 1.0 0.0
4 1.0 0.0 0.0 1.0 0.0
5 1.0 0.0 0.0 0.0 1.0

Recommended Posts

[Python] Operationsnotiz von Pandas DataFrame
Grundlegende Bedienung von Python Pandas Series und Dataframe (1)
[Python] Operation der Aufzählung
Grundlegende Bedienung von Pandas
Grundlegende Bedienung von Pandas
Python-Dekorator-Operationsnotiz
Python-Anwendung: Pandas # 3: Dataframe
Automatischer Betrieb von Chrome mit Python + Selen + Pandas
Die Kraft der Pandas: Python
Zusammenfassung der Vorverarbeitungsmethoden für Python-Anfänger (Pandas-Datenrahmen)
[Python] Zusammenfassung der Methode zur Tabellenerstellung mit DataFrame (Pandas)
Pandas Memo
Python-Handspiel (Pandas / DataFrame-Beginn)
Python-Memo
Python-Memo
Python-Memo
"Python Startbook" Python3-kompatibles Memo
Python-Memo
[Memo] Kleine Geschichte von Pandas, numpy
Python-Memo
Separate Python-Diagramme (Memo)
Pandas Memo
Betriebsnotiz der virtuellen Conda-Umgebung
Python-Memo
[Python] Zusammenfassung der Verwendung von Pandas
[Lernnotiz] Grundlagen des Unterrichts mit Python
[Python-Anfängermemo] Python-Zeichenfolge, Pfadoperation
Anwendung von Python: Pandas Teil 4: Verketten und Kombinieren von DataFrames
Struktur und Betrieb der Python-Daten (Python-Lernnotiz ③)
[Pandas_flavor] Fügen Sie eine Methode von Pandas DataFrame hinzu
Pandas des Anfängers, vom Anfänger, für den Anfänger [Python]
[Python] Fügen Sie Pandas DataFrame insgesamt Zeilen hinzu
Hinweis auf Probleme hinsichtlich der Koexistenz des Python 2/3-Systems
Meine Pandas (Python)
Python-Anfänger-Memo (9.2-10)
[Python] Vektoroperation
Python-Anfänger-Memo (9.1)
[Python] Visualisieren Sie die Hitze der Präfekturen Tokio und XX (DataFrame-Nutzungsnotiz)
Python-Grundlagen ①
★ Memo ★ Python Iroha
Grundlagen von Python ①
Python-Betriebssystembetrieb
Notiz der Pixelpositionsoperation für Bilddaten mit Python (numpy, cv2)
Kopie von Python
[Python] EDA-Memo
Python 3-Operator-Memo
[Python] Matrixoperation
Pandas Operations Memorandum
[Mein Memo] Python
Python3-Metaklassen-Memo
[Python] Grundkarten-Memo
Python-Anfänger-Memo (2)
Python Pandas Memo
[Python] Numpy Memo
Einführung von Python
Ein Memo, das ein Tutorial zum Ausführen von Python auf Heroku erstellt hat
Zusammenfassung der Korrespondenz zwischen Ruby- und Python-Array-Operationen