Le diagramme de Sankey est un graphique qui exprime le débit entre les processus. L'épaisseur de la flèche indique la quantité de débit. En particulier, il est utilisé pour représenter le déplacement d'énergie, les fournitures, les dépenses, etc. Source: [Wikipédia](https://ja.wikipedia.org/wiki/%E3%82%B5%E3%83%B3%E3%82%AD%E3%83%BC_%E3%83%80%E3 % 82% A4% E3% 82% A2% E3% 82% B0% E3% 83% A9% E3% 83% A0)
import pandas as pd
import plotly.express as px
#Génération DF
#Créer un bloc de données de sorte qu'une ligne de données représente une transition
df =pd.DataFrame([['Cat1', 'CatA-2', 'AI', 'Normal'],
['Cat1', 'CatA-3', 'AI', 'Normal'],
['Cat1', 'CatA-3', 'No', 'NG'],
['Cat3', 'CatA-3', 'Random', 'Normal'],
['Cat3', 'CatA-5', 'Random', 'NG'],
['Cat3', 'CatA-1', 'Random', 'NG'],
['Cat3', 'CatA-1', 'No', 'NG']],
columns=['one','two','three',"output"])
#Faire des variables catégoriques des variables factices
#Erreur si la dernière colonne du bloc de données est une chaîne de caractères?
df["output"] = pd.get_dummies(df["output"])
fig = px.parallel_categories(df,
dimensions=['one','two','three','output'],
color="output",
color_continuous_scale=px.colors.diverging.BrBG,
labels={'one':'FirstArea', 'two':'SecondArea', 'three':'ThirdArea','output':'output'}
)
fig.show()
Recommended Posts