Hallo ~. 23.12.2019 Vor Weihnachten. Heute möchte ich auf die Streuprozession eingehen.
Streumatrix ・ ・ ・ Ein Diagramm, mit dem grob festgestellt wird, welche Art von Korrelation die einzelnen Daten aufweisen.
API
pandas.plotting.scatter_matrix(frame, alpha=0.5, figsize=None, ax=None, grid=False, diagonal='hist', marker='.', density_kwds=None, hist_kwds=None, range_padding=0.05, **kwds) Offizielles Dokument
Zitiert aus Maschinelles Lernen ab Python.
sample.py
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import mglearn
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(
iris['data'], iris['target'], random_state=0
)
fig, ax = plt.subplots()
iris_dataframe = pd.DataFrame(X_train, columns=iris.feature_names)
grr = pd.scatter_matrix(iris_dataframe, c=y_train, figsize=(15, 15),
ax=ax, marker='o', hist_kwds ={'bins': 20}, s = 60,
alpha=0.8, cmap=mglearn.cm3)
plt.show()
wunderschönen. Um es kurz zu erklären, handelt es sich im Grunde genommen um eine Matrix von Graphen, und die Kombination von x und y hängt von den Elementen der Matrix ab. Auf dem diagonalen Teil werden einzelne Histogramme (bin: 20) gezeichnet.
Scatter_matcix ist eine Funktion zum Zeichnen der Kombination von Features, die für alle Variablen kombiniert werden können. Beachten Sie jedoch, dass Sie mit dieser Methode nicht alle Funktionen gleichzeitig anzeigen können, sodass Sie möglicherweise nicht in der Lage sind, interessante Aspekte der Daten anzuzeigen.
Derzeit ist dies möglicherweise der beste Weg, um die Daten zu überprüfen.