Divers outils de visualisation Python

Objectif

Un résumé de divers outils de visualisation pour améliorer l'efficacité des compétitions d'analyse. Augmente graduellement!

table des matières

  1. Carte de corrélation
  2. Matrice de confusion
  3. Importance de la quantité de fonctionnalités Light GBM

1. Carte de corrélation

Affichage de la carte thermique de la corrélation de chaque colonne de la trame de données pandas. Il est utilisé pour corréler chaque quantité d'entités et le résultat de la prédiction pour l'ensemble du modèle.

référence

code

fig ,ax = plt.subplots(1,1,figsize=(12,12))
sns.heatmap(df.corr(), annot=True, fmt='.7f', ax=ax)
df.corr()

2. Matrice de confusion

référence

code

import numpy as np
import pandas as pd
from scipy import signal
from sklearn.metrics import confusion_matrix, f1_score, plot_confusion_matrix

# Thanks to https://www.kaggle.com/marcovasquez/basic-nlp-with-tensorflow-and-wordcloud
def plot_cm(y_true, y_pred, title="", figsize=(14,14):
    y_pred = y_pred.astype(int)
    cm = confusion_matrix(y_true, y_pred, labels=np.unique(y_true))
    cm_sum = np.sum(cm, axis=1, keepdims=True)
    cm_perc = cm / cm_sum.astype(float) * 100
    annot = np.empty_like(cm).astype(str)
    nrows, ncols = cm.shape
    for i in range(nrows):
        for j in range(ncols):
            c = cm[i, j]
            p = cm_perc[i, j]
            if i == j:
                s = cm_sum[i]
                annot[i, j] = '%.1f%%\n%d/%d' % (p, c, s)
            elif c == 0:
                annot[i, j] = ''
            else:
                annot[i, j] = '%.1f%%\n%d' % (p, c)
    cm = pd.DataFrame(cm, index=np.unique(y_true), columns=np.unique(y_true))
    cm.index.name = 'Actual'
    cm.columns.name = 'Predicted'
    fig, ax = plt.subplots(figsize=figsize)
    plt.title(title)
    sns.heatmap(cm, cmap='viridis', annot=annot, fmt='', ax=ax)

3. Importance de la quantité de fonctionnalités Light GBM

Visualisation de l'importance des fonctionnalités des résultats d'apprentissage de LightGBM

code

def display_feature_importance(models):
    fi = pd.DataFrame(columns=['importance','feature'])
    for i, m in enumerate(models):
        df_t = pd.DataFrame(columns=['importance','feature'])
        df_t['importance'] = m.feature_importance(importance_type='gain')
        df_t['feature'] = m.feature_name()

        fi = pd.concat([fi, df_t], axis=0)
    fi = fi.groupby('feature').sum() 
    best_features = fi.sort_values(by='importance', ascending=False).reset_index()

    plt.figure(figsize=(16, 16));
    sns.barplot(x="importance", y="feature", data=best_features);
    plt.title('LGB Features (avg over folds)');
    print('worst:\n',best_features['feature'][-20:].values)

Recommended Posts

Divers outils de visualisation Python
# 3 [python3] Divers opérateurs
Application de Python: visualisation de données Partie 3: divers graphiques
Mémo de visualisation par Python
Bibliothèques de visualisation de données Python
[Diverses analyses d'images avec plotly] Visualisation dynamique avec plotly [python, image]
Refactoring des outils utilisables avec Python
Divers outils de test de charge
Visualisation de la logistique avec Python
Divers traitements de Python
HoloViews peut devenir la norme pour les outils de visualisation Python
Supprimer divers caractères vides [Python]
Diverses opérations de chaîne avec Python intégré
À propos de divers encodages de Python 3
Application Python: visualisation de données, partie 2: matplotlib
Manipulez diverses bases de données avec Python
Python
[ns3-30] Activer la visualisation des scripts Python
Comment utiliser correctement le package de visualisation Python
5 outils Python faciles à utiliser | Augmenter l'efficacité du travail
Python mais visualisation facile avec PixieDust
Clustering et visualisation à l'aide de Python et CytoScape
Visualisez facilement vos données avec Python seaborn.
Application Python: visualisation de données partie 1: basique
Analyse de données à partir de python (visualisation de données 1)
Analyse de données à partir de python (visualisation de données 2)
[Python] Chapitre 04-06 Différentes structures de données (création de dictionnaire)
[Python] Accélération du traitement à l'aide des outils de cache
Outil de visualisation Python pour le travail d'analyse de données
Appliquer diverses formes de mosaïques aux images (Python, OpenCV)
[Python] Chapitre 04-03 Diverses structures de données (liste multidimensionnelle)
[Python] Chapitre 04-04 Diverses structures de données (voir liste)
[Python] Divers traitements de données utilisant le tableau Numpy
[Python] Chapitre 04-02 Diverses structures de données (manipulation de liste)
1. Statistiques apprises avec Python 1-3. Calcul de diverses statistiques (statistiques)
Diverses spécifications de format de la méthode str.format () de Python3
[Python] Chapitre 04-07 Diverses structures de données (manipulation de dictionnaire)
Recommandation d'Altair! Visualisation des données avec Python
Text mining avec Python ② Visualisation avec Word Cloud
Guide d'installation des outils Python pour Visual Studio
Conseils pour créer de petits outils avec python
[Python] Diverses combinaisons de chaînes de caractères et de valeurs
[Python] J'ai recherché différents types! (Dactylographie)