[PYTHON] À propos de scatter_matrix

Bonjour ~. 2019/12/23 Avant Noël. Aujourd'hui, je voudrais parler de la procession de dispersion.

matrice de dispersion ・ ・ ・ Un diagramme utilisé pour voir approximativement le type de corrélation de chaque donnée.

API

pandas.plotting.scatter_matrix(frame, alpha=0.5, figsize=None, ax=None, grid=False, diagonal='hist', marker='.', density_kwds=None, hist_kwds=None, range_padding=0.05, **kwds) Document officiel

Description des paramètres

Exemple de code

Extrait de Machine learning starting with Python.

sample.py


import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import mglearn

iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(
    iris['data'], iris['target'], random_state=0
)

fig, ax = plt.subplots()
iris_dataframe = pd.DataFrame(X_train, columns=iris.feature_names)

grr = pd.scatter_matrix(iris_dataframe, c=y_train, figsize=(15, 15),
                        ax=ax, marker='o', hist_kwds ={'bins': 20}, s = 60,
                        alpha=0.8, cmap=mglearn.cm3)
plt.show()

scatter_matrix.png

beau. Pour expliquer brièvement, il s'agit essentiellement d'une matrice de graphiques, et la combinaison de x et y dépend des éléments de la matrice. Des histogrammes individuels (bin: 20) sont dessinés sur la partie diagonale.

scatter_matcix est une fonction pour tracer la combinaison d'entités qui peuvent être combinées pour toutes les variables. Cependant, notez que cette méthode ne vous permet pas de voir toutes les fonctionnalités en même temps, vous ne pourrez donc peut-être pas voir les aspects intéressants des données.

Pour le moment, c'est peut-être la meilleure façon d'inspecter les données.

Les références

page officielle scatter_matrix

Recommended Posts

À propos de scatter_matrix
À propos de Confusion Matrix
À propos de la matrice de confusion