Je vais rassembler des choses que je vais utiliser à nouveau (Remarque: veuillez noter qu'il n'y a rien de nouveau sur le contenu de l'article de mémo personnel)
Préparation du jeu de données
import pandas as pd
from sklearn import datasets
iris = datasets.load_iris()
columns = list(map(lambda x: ' '.join(x.split(' ')[:2]), iris.feature_names))
df = pd.DataFrame(iris.data, columns=columns)
df['target'] = iris.target_names[iris.target]
df.head()

df.groupby('target').size().to_frame.plot.barh()
Résultat de l'exécution:

to_frame pour utiliser pandas.DataFrame.plot.barhsize () pour chaque valeur dans la colonne spécifiéebar et barh sont possibles, mais j'aime personnellement barh, qui a des étiquettes faciles à lire.
for key, indices in df.groupby('target').groups.items():
x = df.loc[indices]['sepal length']
y = df.loc[indices]['petal length']
plt.scatter(x, y, label=key, alpha=0.4)
plt.legend()
plt.show()
Résultat de l'exécution:

df.groupby ('target'). Groups vous donne un dictionnaire de la forme {Valeur de colonne spécifiée: index} contenant la valeur de colonne spécifiée.

.items () attaché au type de dictionnaire dans le standard Python.Recommended Posts