Eine Matrix, die die Zahl darstellt, die korrekt bestimmt wurde, und die Zahl, die fälschlicherweise zwischen dem vorhergesagten Ergebnis, das durch ein Modell geleitet wurde, und dem tatsächlichen Wert bestimmt wurde.
Im Allgemeinen binäre Klassifizierung.
Wenn Sie beispielsweise anhand eines bestimmten Bildes vorhersagen möchten, ob Sie Krebs haben oder nicht, Der tatsächliche Wert ist 98/100 für Nicht-Krebs-Menschen (0) 2/100 für Menschen mit Krebs (1) Angenommen, es war.
Wenn zu diesem Zeitpunkt alle Vorhersagen 0 sind, beträgt die korrekte Antwortrate 98%. Dies sieht nach einer guten Zahl aus, wenn man die korrekte Antwortrate betrachtet. Ist das wirklich eine gute Bewertung? Sind die beiden Leute, die es verpasst haben, nicht ein fataler Fehler?
Auch in solchen Fällen wird die Verwirrungsmatrix verwendet, um eine erfolgreiche Bewertung vorzunehmen.
Im Allgemeinen ist die horizontale Achse das Vorhersageergebnis des Modells und die vertikale Achse ist der tatsächliche Wert.
True: Ergebnisse, die korrekt vorhergesagt werden können Falsch: Falsch vorhergesagtes Ergebnis positiv: Das Ergebnis der Feststellung, dass eine Krankheit vorliegt (= 1) negativ: Ergebnis der Feststellung, dass keine Krankheit vorliegt (= 0)
matrix.py
from sklearn.metrics import confusion_matrix
#Erstellen einer Verwirrungsmatrix
cm = confusion_matrix(y_true=y_test, y_pred=y_pred)
# y_Übergabe an true sind die objektiven Variablendaten für die Bewertung
# y_X an pred übergeben_mit Test vorhersagen()Ergebnis mit der Funktion vorhergesagt
#Datenrahmen der Verwirrungsmatrix
df_cm = pd.DataFrame(np.rot90(cm, 2), index=["actual_Positive", "actual_Negative"], columns=["predict_Positive", "predict_Negative"])
print(df_cm)
#Visualisierung der Verwirrungsmatrix durch Heatmap
sns.heatmap(df_cm, annot=True, fmt="2g", cmap='Blues')
plt.yticks(va='center')
plt.show()
Betrachten Sie den Bewertungsindex, der die Leistung des Modells von hier aus misst
Überprüfen Sie zunächst, wie korrekt Sie die gesamten Daten klassifizieren können
Überprüfen Sie nach Erhalt eines positiven (1) Ergebnisses, ob Sie tatsächlich richtig geantwortet haben
Die tatsächlichen Daten sind positiv (1), wie viel Werden die vorhergesagten Daten korrekt als positiv geschätzt? Je höher dieser Wert ist, desto besser ist die Leistung und desto weniger falsch positive Beurteilungen werden vorgenommen.
Die tatsächlichen Daten sind negativ (0), wie viel Werden die vorhergesagten Daten korrekt als negativ geschätzt? Je höher dieser Wert ist, desto besser ist die Leistung und desto weniger falsche negative Urteile.
Die tatsächlichen Daten sind positiv (1), wie viel Wurden die vorhergesagten Daten fälschlicherweise als negativ angenommen? Je niedriger dieser Wert ist, desto besser ist die Leistung und es gibt nur wenige falsch positive Beurteilungen.
Die tatsächlichen Daten sind negativ (0), wie viel Wurden die vorhergesagten Daten fälschlicherweise als positiv angenommen? Je niedriger dieser Wert ist, desto besser ist die Leistung und es gibt nur wenige falsche negative Beurteilungen.
Positives Vorhersageergebnis | Negatives Vorhersageergebnis | |
---|---|---|
Tatsächlich positives Ergebnis | 98 | 0 |
Tatsächlich negatives Ergebnis | 2 | 0 |
98% korrekte Antwortrate
100% => Dies bestimmt, dass alle Positiven korrekt klassifiziert sind
0% => Dies beurteilt, dass alle Negative versehentlich klassifiziert wurden.
Berechnen Sie einen Index zur Messung der Leistung, um ein Modell für maschinelles Lernen mit binärer Klassifizierung in Unternehmen zu verwenden. Es ist wichtig, den für den Zweck geeigneten Indexwert zu verstehen und zu verwenden
Recommended Posts