[PYTHON] Über Scatter_Matrix

Hallo ~. 23.12.2019 Vor Weihnachten. Heute möchte ich auf die Streuprozession eingehen.

Streumatrix ・ ・ ・ Ein Diagramm, mit dem grob festgestellt wird, welche Art von Korrelation die einzelnen Daten aufweisen.

API

pandas.plotting.scatter_matrix(frame, alpha=0.5, figsize=None, ax=None, grid=False, diagonal='hist', marker='.', density_kwds=None, hist_kwds=None, range_padding=0.05, **kwds) Offizielles Dokument

Parameterbeschreibung

Beispielcode

Zitiert aus Maschinelles Lernen ab Python.

sample.py


import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import mglearn

iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(
    iris['data'], iris['target'], random_state=0
)

fig, ax = plt.subplots()
iris_dataframe = pd.DataFrame(X_train, columns=iris.feature_names)

grr = pd.scatter_matrix(iris_dataframe, c=y_train, figsize=(15, 15),
                        ax=ax, marker='o', hist_kwds ={'bins': 20}, s = 60,
                        alpha=0.8, cmap=mglearn.cm3)
plt.show()

scatter_matrix.png

wunderschönen. Um es kurz zu erklären, handelt es sich im Grunde genommen um eine Matrix von Graphen, und die Kombination von x und y hängt von den Elementen der Matrix ab. Auf dem diagonalen Teil werden einzelne Histogramme (bin: 20) gezeichnet.

Scatter_matcix ist eine Funktion zum Zeichnen der Kombination von Features, die für alle Variablen kombiniert werden können. Beachten Sie jedoch, dass Sie mit dieser Methode nicht alle Funktionen gleichzeitig anzeigen können, sodass Sie möglicherweise nicht in der Lage sind, interessante Aspekte der Daten anzuzeigen.

Derzeit ist dies möglicherweise der beste Weg, um die Daten zu überprüfen.

Verweise

Scatter_matrix offizielle Seite

Recommended Posts

Über Scatter_Matrix
Über die Verwirrungsmatrix
Über die Verwirrungsmatrix