Verschiedene Python-Visualisierungstools

Zweck

Eine Zusammenfassung verschiedener Visualisierungswerkzeuge zur Verbesserung der Effizienz von Analysewettbewerben. Allmählich erhöhen!

Inhaltsverzeichnis

  1. Korrelationskarte
  2. Verwirrungsmatrix
  3. Leichte GBM-Merkmalsmengenbedeutung

1. Korrelationskarte

Heatmap-Anzeige der Korrelation jeder Spalte des Pandas-Datenrahmens. Es wird verwendet, um jede Merkmalsmenge und das Vorhersageergebnis für das Modellensemble zu korrelieren.

Referenz

Code

fig ,ax = plt.subplots(1,1,figsize=(12,12))
sns.heatmap(df.corr(), annot=True, fmt='.7f', ax=ax)
df.corr()

2. Verwirrungsmatrix

Referenz

Code

import numpy as np
import pandas as pd
from scipy import signal
from sklearn.metrics import confusion_matrix, f1_score, plot_confusion_matrix

# Thanks to https://www.kaggle.com/marcovasquez/basic-nlp-with-tensorflow-and-wordcloud
def plot_cm(y_true, y_pred, title="", figsize=(14,14):
    y_pred = y_pred.astype(int)
    cm = confusion_matrix(y_true, y_pred, labels=np.unique(y_true))
    cm_sum = np.sum(cm, axis=1, keepdims=True)
    cm_perc = cm / cm_sum.astype(float) * 100
    annot = np.empty_like(cm).astype(str)
    nrows, ncols = cm.shape
    for i in range(nrows):
        for j in range(ncols):
            c = cm[i, j]
            p = cm_perc[i, j]
            if i == j:
                s = cm_sum[i]
                annot[i, j] = '%.1f%%\n%d/%d' % (p, c, s)
            elif c == 0:
                annot[i, j] = ''
            else:
                annot[i, j] = '%.1f%%\n%d' % (p, c)
    cm = pd.DataFrame(cm, index=np.unique(y_true), columns=np.unique(y_true))
    cm.index.name = 'Actual'
    cm.columns.name = 'Predicted'
    fig, ax = plt.subplots(figsize=figsize)
    plt.title(title)
    sns.heatmap(cm, cmap='viridis', annot=annot, fmt='', ax=ax)

3. Leichte GBM-Merkmalsmengenbedeutung

Visualisierung der Bedeutung der Funktionen der Lernergebnisse von LightGBM

Code

def display_feature_importance(models):
    fi = pd.DataFrame(columns=['importance','feature'])
    for i, m in enumerate(models):
        df_t = pd.DataFrame(columns=['importance','feature'])
        df_t['importance'] = m.feature_importance(importance_type='gain')
        df_t['feature'] = m.feature_name()

        fi = pd.concat([fi, df_t], axis=0)
    fi = fi.groupby('feature').sum() 
    best_features = fi.sort_values(by='importance', ascending=False).reset_index()

    plt.figure(figsize=(16, 16));
    sns.barplot(x="importance", y="feature", data=best_features);
    plt.title('LGB Features (avg over folds)');
    print('worst:\n',best_features['feature'][-20:].values)

Recommended Posts

Verschiedene Python-Visualisierungstools
# 3 [python3] Verschiedene Operatoren
Anwendung von Python: Datenvisualisierung Teil 3: Verschiedene Grafiken
Visualisierungsnotiz von Python
Python-Datenvisualisierungsbibliotheken
[Verschiedene Bildanalysen mit Plotly] Dynamische Visualisierung mit Plotly [Python, Bild]
Refactoring-Tools, die mit Python verwendet werden können
Verschiedene Lasttestwerkzeuge
Visualisierung der Logistik mit Python
Verschiedene Verarbeitung von Python
HoloViews werden möglicherweise zum Standard für Python-Visualisierungstools
Verschiedene Leerzeichen löschen [Python]
Verschiedene String-Operationen in Python integriert
Über verschiedene Codierungen von Python 3
Python-Anwendung: Datenvisualisierung # 2: matplotlib
Bearbeiten Sie verschiedene Datenbanken mit Python
Python
[ns3-30] Aktivieren Sie die Visualisierung von Python-Skripten
So verwenden Sie das Python-Visualisierungspaket ordnungsgemäß
5 Einfach zu verwendende Python-Tools | Steigern Sie die Arbeitseffizienz
Python aber einfache Visualisierung mit PixieDust
Clustering und Visualisierung mit Python und CytoScape
Visualisieren Sie Ihre Daten ganz einfach mit Python Seaborn.
Python-Anwendung: Datenvisualisierung Teil 1: Grundlegend
Datenanalyse beginnend mit Python (Datenvisualisierung 1)
Datenanalyse beginnend mit Python (Datenvisualisierung 2)
[Python] Kapitel 04-06 Verschiedene Datenstrukturen (Erstellung eines Wörterbuchs)
[Python] Beschleunigung der Verarbeitung mit Cache-Tools
Python-Visualisierungstool für die Datenanalyse
Wenden Sie verschiedene Formen von Mosaiken auf Bilder an (Python, OpenCV).
[Python] Kapitel 04-03 Verschiedene Datenstrukturen (mehrdimensionale Liste)
[Python] Kapitel 04-04 Verschiedene Datenstrukturen (siehe Liste)
[Python] Verschiedene Datenverarbeitung mit Numpy-Array
[Python] Kapitel 04-02 Verschiedene Datenstrukturen (Listenmanipulation)
1. Mit Python 1-3 gelernte Statistiken. Berechnung verschiedener Statistiken (Statistiken)
Verschiedene Formatspezifikationen der str.format () -Methode von Python3
[Python] Kapitel 04-07 Verschiedene Datenstrukturen (Wörterbuchmanipulation)
Empfehlung von Altair! Datenvisualisierung mit Python
Text Mining mit Python ② Visualisierung mit Word Cloud
Installationshandbuch für Python Tools für Visual Studio
Tipps zum Erstellen kleiner Werkzeuge mit Python
[Python] Verschiedene Kombinationen von Zeichenketten und Werten
[Python] Ich habe nach verschiedenen Typen gesucht! (Tippen)