[PYTHON] Visualisierung, wo bei der Klassifizierung der Datenanalyse eine Fehlklassifizierung auftritt

Identifizieren Sie, wo die Fehlklassifizierung aufgetreten ist, um die Genauigkeit der Datenanalyseergebnisse zu verbessern

Das ist das Thema dieser Zeit.

Daher werde ich heute die Verwirrungsmatrix verwenden, um zu visualisieren, wo die Fehlklassifizierung stattgefunden hat.



from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import confusion_matrix

clf = DecisionTreeClassifier()

clf.fit(X_train, Y_train)
result = clf.predict(X_test)
cm = confusion_matrix(Y_test, result)

print(cm)


Wenn Sie den Iris-Datensatz verwenden, wird er wie in der folgenden Abbildung dargestellt angezeigt.

Screen Shot 2017-05-12 at 17.47.25.png Auszug aus sklearn Offizielles Dokument

Es mag etwas klein und schwer zu erkennen sein, aber die y-Achse ist der wahre Wert, dh die korrekte Beschriftung, die x-Achse ist der vorhergesagte Wert und sie wird unter Verwendung eines maschinellen Lernmodells beschriftet. In der obigen Abbildung befindet sich rechts in der mittleren Reihe eine Fehlklassifizierung.

Wenn Sie dies erkennen, die Datenvorverarbeitung überprüfen und die Parameter des maschinellen Lernmodells neu anpassen, kann dies die Genauigkeit verbessern.

Recommended Posts

Visualisierung, wo bei der Klassifizierung der Datenanalyse eine Fehlklassifizierung auftritt
Verwendung ist und == in Python
Verwendung von Datenanalysetools für Anfänger
So erstellen Sie Daten für CNN (Chainer)
Lesen von Zeitreihendaten in PyTorch
Ich möchte visualisieren, wo und wie viele Leute in der Fabrik sind
Der erste Schritt zur Protokollanalyse (Formatieren und Einfügen von Protokolldaten in Pandas)
Verwendung von xgboost: Mehrklassenklassifizierung mit Irisdaten
So wenden Sie mit matplotlib Marker nur auf bestimmte Daten an
[Für Anfänger] So studieren Sie den Python3-Datenanalysetest
Darstellung der Verteilung der Bakterienzusammensetzung aus Qiime2-Analysedaten in einem Box-Whisker-Diagramm
So testen Sie, ob die Ausnahme in Python unittest ausgelöst wird
So erhalten Sie einen Überblick über Ihre Daten in Pandas
Data Science-Begleiter in Python, wie man Elemente in Pandas spezifiziert
Wie man in Python entwickelt
Umgang mit Datenrahmen
Geben und meinen Sie die Einschränkungsoption in scipy.optimize.minimize
So stellen Sie fest, dass in Python3 ein Kreuzschlüssel eingegeben wurde
<Pandas> Umgang mit Zeitreihendaten in der Pivot-Tabelle
Wie erstelle ich eine große Menge an Testdaten in MySQL? ??
[Ln] Das Einfügen des symbolischen Links des Verzeichnisses ist kompliziert
Wie man sich verbessert, wenn Spyders Editor in Mavericks sehr schwer ist
[Python] Wie man MP3-Daten fFT
[Python] Wie man PCA mit Python macht
Umgang mit Sitzungen in SQLAlchemy
Lesen von e-Stat-Subregionsdaten
Wie man nüchtern mit Pandas schreibt
Verwendung von SQLite in Python
Umgang mit unausgeglichenen Daten
So konvertieren Sie 0,5 in 1056964608 auf einmal
Wie man CSS in Django reflektiert
Wie man Prozesse in großen Mengen abbricht
Wie man MySQL mit Python benutzt
Aufblasen von Daten (Datenerweiterung) mit PyTorch
So verpacken Sie C in Python
Verwendung von ChemSpider in Python
Verwendung von PubChem mit Python
So führen Sie TensorFlow 1.0-Code in 2.0 aus
Umgang mit Japanisch mit Python
So melden Sie sich bei Docker + NGINX an
Sammeln von Daten zum maschinellen Lernen
So rufen Sie PyTorch in Julia an
So senden Sie ein visualisiertes Bild der in Python erstellten Daten an Typetalk
Speichern von CSV-Daten in Amazon Kinesis Streams mit Standardeingabe
Datenanalyse: Einfache Anwendung deskriptiver Statistiken und Schätzungsstatistiken auf CSV-Daten in Python
Zeichnen von Daten einer Galaxie mit sichtbarem Licht mithilfe der OpenNGC-Datenbank in Python