[PYTHON] Visualisez facilement le coefficient de corrélation entre les variables

Afficher une liste de coefficients de corrélation

Utilisez Kaggle's Titanic Victim Data pour afficher une liste de coefficients de corrélation à l'aide d'une carte thermique. Notez que vous ne pouvez vérifier que par valeur numérique

corr.py


# lib install
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline 

train = pd.read_csv('./train.csv')
train.head()

2017-07-25_122911.png

corr.py


plt.figure(figsize=(8, 6)) #heatmap size
sns.heatmap(train.corr(), annot=True, cmap='plasma', linewidths=.5) # annot:Afficher ou non les largeurs de ligne de valeur:Ligne de coupe

2017-07-25_123429.png

Dans cet exemple, il est important que vous ayez survécu, afin que vous puissiez trouver les variables corrélées en regardant la colonne Survived.

Référence: Seaborn Heatmap

Recommended Posts

Visualisez facilement le coefficient de corrélation entre les variables
Repenser le coefficient de corrélation
Examiner la relation entre deux variables (1)
Organisez facilement les différences entre Apache Tomcat
Comment trouver la corrélation pour les variables catégorielles
Visualisez les données et saisissez la corrélation en même temps
pca.components_ de sklearn est le coefficient de corrélation entre le composant principal et le montant de la fonction et est appelé le montant de chargement de facteur.
Comprendre la différence entre l'affectation cumulative aux variables et l'affectation cumulative aux objets
[Statistiques] Visualisons la relation entre la distribution normale et la distribution du chi carré.
Visualisez la matrice de corrélation par l'analyse des composants principaux avec Python