[Python] Mémo d'opération de pandas DataFrame

introduction

Parce que j'ai eu l'opportunité d'analyser des données alors que j'étais débutant Je vais donc résumer les éléments grammaticaux du Python DataFrame nouvellement obtenu.

supposition

product.csv

id name price category isPopular
1 eraser 100 stationary 1
2 pencil 200 stationary 0
3 socks 400 clothes 1
4 pants 1000 clothes 0
5 apple 100 food 0

analyze.py


import pandas as pd

Extraire le type de valeur d'une colonne

df['category'].value_counts().index

Résultat d'exécution

Index(['stationery', 'clothes', 'food'], dtype='object')

Modifier / ajouter la valeur de DataFrame en spécifiant la condition

df.loc[df.name == 'socks', 'price'] = 500
df.loc[df.category == 'stationery', 'category_id'] = 0
df.loc[df.category == 'clothes', 'category_id'] = 1
df.loc[df.category == 'food', 'category_id'] = 2
df

Résultat d'exécution

id name price category isPopular category_id
1 eraser 100 stationary 1 0.0
2 pencil 200 stationary 0 0.0
3 socks 500 clothes 1 1.0
4 pants 1000 clothes 0 1.0
5 apple 100 food 0 2.0

Passer à une expression unique

#colonne isPopular et category_Extraire uniquement l'identifiant (cela ne fonctionnera que s'il s'agit d'une valeur entière)
df_X = df.drop(['id','name','price','category'], axis=1)

from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder()
enc.fit(df_X)
onehot_array = enc.transform(df_X).toarray()
onehot_df = pd.DataFrame(onehot_array)
df = pd.concat([df_id, onehot_df], axis=1)
df

Résultat d'exécution

id 0 1 2 3 4
1 0.0 1.0 1.0 0.0 0.0
2 1.0 0.0 1.0 0.0 0.0
3 0.0 1.0 0.0 1.0 0.0
4 1.0 0.0 0.0 1.0 0.0
5 1.0 0.0 0.0 0.0 1.0

Recommended Posts

[Python] Mémo d'opération de pandas DataFrame
Fonctionnement de base de Python Pandas Series et Dataframe (1)
[Python] Opération d'énumération
Fonctionnement de base des pandas
Fonctionnement de base des Pandas
Mémo d'opération de décorateur Python
Application Python: Pandas # 3: Dataframe
Fonctionnement automatique de Chrome avec Python + Sélénium + pandas
Le pouvoir des pandas: Python
Résumé des méthodes de prétraitement pour les débutants en Python (trame de données Pandas)
[Python] Résumé de la méthode de création de table utilisant DataFrame (pandas)
Mémo Pandas
Jeu à la main Python (Pandas / DataFrame début)
Mémo Python
mémo python
Mémo Python
"Python startbook" mémo compatible python3
mémo python
[Mémo] Petite histoire de pandas, stupide
Mémo Python
Graphiques Python séparés (mémo)
mémo pandas
Mémo de fonctionnement de l'environnement virtuel Conda
Mémo Python
[Python] Résumé de l'utilisation des pandas
[Mémo d'apprentissage] Bases de la classe par python
[Mémo du débutant Python] chaîne de caractères python, opération de chemin
Application de Python: Pandas Partie 4: Concaténation et combinaison de DataFrames
Structure et fonctionnement des données Python (mémo d'apprentissage Python ③)
[Pandas_flavor] Ajouter une méthode de Pandas DataFrame
Pandas du débutant, par le débutant, pour le débutant [Python]
[Python] Ajouter le nombre total de lignes à Pandas DataFrame
Note de problèmes sur la coexistence du système Python 2/3
[Python] Mémo sur le dictionnaire
Mes pandas (Python)
mémo débutant python (9.2-10)
[python] Opération vectorielle
mémo débutant python (9.1)
[Python] Visualisez la chaleur de Tokyo et de la préfecture ○○ (mémo d'utilisation de DataFrame)
Les bases de Python ①
★ Mémo ★ Python Iroha
Bases de python ①
Fonctionnement du système d'exploitation Python
Mémo de l'opération de position de pixel pour les données d'image avec Python (numpy, cv2)
Copie de python
[Python] Mémo EDA
Mémo opérateur Python 3
[Python] Opération de matrice
Mémorandum d'opération Pandas
[Mon mémo] python
Mémo de métaclasse Python3
[Python] Mémo de fond de carte
Mémo débutant Python (2)
mémo pandas python
[Python] Mémo Numpy
Introduction de Python
Un mémo qui a fait un tutoriel pour exécuter python sur heroku
Résumé de la correspondance entre les opérations de tableau ruby et python