Aidemy 2020/9/23
Hallo, es ist ja! Ich bin ein Student, aber ich interessiere mich für das AI-Feld, also studiere ich an der AI-spezialisierten Schule "Aidemy". Ich möchte das hier gewonnene Wissen mit Ihnen teilen und habe es in Qiita zusammengefasst. Ich freue mich sehr, dass viele Menschen den vorherigen zusammenfassenden Artikel gelesen haben. Vielen Dank! Dieses Mal werde ich wichtige Hinweise zur Einführung in das maschinelle Lernen aufschreiben.
・ Maschinelles Lernen umfasst __ "Lernen mit Lehrer", "Lernen ohne Lehrer" und "erweitertes Lernen" __. ・ Unterrichtetes Lernen ist eine Methode, um Lerndaten und korrekte Antwortdaten (Lehrerdaten) zu geben und zu denken, bis die Antwort korrekt ist. Meistens.
・ __ Überwachte Lernprozedur __: Datenerfassung → Datenbereinigung → Lernen → Mit Testdaten prüfen → Implementierung
・ __ Betreute Lernpraxis 1__: Holdout-Methode: Die Daten werden in Lerndaten und Testdaten unterteilt. Verwenden Sie die Funktion train_test_split (). __X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = Testdatenverhältnis, random_state = 0) __
・ __ Betreute Lernpraxis 2 __: k-Division Kreuzverifikation: Teilen Sie die Daten in k und verwenden Sie eine davon als Testdaten. Die Testdaten werden jedes Mal geändert und insgesamt k Mal überprüft, um die durchschnittliche Leistung zu berechnen. (Wenn es 20 Ex-Daten gibt, sind 19 Trainingsdaten und 1 Testdaten und werden insgesamt 20 Mal überprüft.)
-__ Überlernen : Ein Zustand, in dem die Lerngenauigkeit zu hoch ist, um richtig abstrahiert zu werden, und unbekannte Daten nicht verarbeitet werden können. - Dropout : Ein Mittel, um Überlernen zu vermeiden. Ignorieren Sie offensichtliche Ausnahmen. - Ensemble-Lernen __: Verbessern Sie die Genauigkeit, indem Sie mehrere Modelle trainieren und die Ergebnisse mitteln.
-__ Verwirrungsmatrix __: Eine Tabelle zur Bewertung der Genauigkeit des Modells. Die Ergebnisse werden in __ "wahr positiv", "falsch positiv", "wahr negativ" und "falsch negativ" __ klassifiziert. "Richtig oder falsch" gibt an, ob die Antwort richtig ist, und "Yin" gibt die Antwort des Modells an. (Das heißt, wenn es "falsch positiv" ist, antwortete das Modell mit "Wahr", aber die Antwort war "Falsch".)
-Implementierung der Verwirrungsmatrix: Beschreiben Sie wie folgt ("y_true" wird angegeben [Liste der richtigen Antworten] und "y_pred" wird angegeben [Liste der Modellantworten])
from sklearn.metrics import confusion_matrix
#Definieren Sie "richtige Antwort" und "Antwort" in einer Liste(0 ist positiv, 1 ist negativ)
y_true=[1,1,1,1,1,1]
y_pred=[1,1,1,0,0,0]
confmat = confusion_matrix(y_true, y_pred)
#[[0 0] #[[Richtig positiv Falsch negativ]
# [3 3]] # [Falsch positiv Richtig negativ]]
・ __Korrekte Antwortrate __: Prozentsatz aller Antworten, die "wahr" waren. (Richtig positiv + Richtig negativ / Insgesamt) ・ __Konformitätsrate / Genauigkeit : Der Prozentsatz derjenigen, die mit "positiv" geantwortet haben, war "wahr". (Richtig positiv / Richtig positiv + Falsch positiv) - Rückrufrate : Der Prozentsatz der "tatsächlichen Sonne", der "wahr" war. (Richtig positiv / Richtig positiv + Falsch negativ) - F-Wert __: Harmonisierter Durchschnitt von Präzision und Rückruf (2 * Präzision * Rückruf / Präzision + Rückruf)
-Implementieren Sie den obigen Bewertungsindex: Er berechnet, indem er die Funktion importiert und "y_true" bzw. "y_pred" als Argumente angibt.
#precision_Punktzahl: Übereinstimmungsrate, recall_Punktzahl: Rückruf, f1_Punktzahl: Import des F-Wertes
from sklearn.metrics import precision_score,recall_score,f1_score
y_true=[0,0,1,1]
y_pred=[0,1,1,1]
#F-Wert Ausgabe
print("F1".format(f1_score(y_true,y_pred)))
# 0.666666
-__ PR-Kurve __: Ein Diagramm, in dem die vertikale Achse die Genauigkeitsrate (Präzision) und die horizontale Achse die Rückrufrate (Rückruf) ist. ・ __Konformitätsrate und Rückrufrate stehen in einer Kompromissbeziehung __, und es muss überlegt werden, welche in einigen Fällen hervorgehoben werden sollte. Es wird empfohlen, den F-Wert oder den Punkt zu verwenden, an dem P und R auf der PR-Kurve übereinstimmen (__break gerade Punkt (BEP) __), es sei denn, Sie sind besonders darüber informiert.
Recommended Posts