Aidemy　2020/9/27

Einführung

Hallo, es ist ja! Ich bin eine knusprige Literaturschule, aber ich war an den Möglichkeiten der KI interessiert, also ging ich zur KI-Fachschule "Aidemy", um zu studieren. Ich möchte das hier gewonnene Wissen mit Ihnen teilen und habe es in Qiita zusammengefasst. Ich freue mich sehr, dass viele Menschen den vorherigen zusammenfassenden Artikel gelesen haben. Vielen Dank! Dies ist der dritte Beitrag des überwachten Lernens. Freut mich, dich kennenzulernen.

Dieser Artikel ist eine Zusammenfassung dessen, was Sie in "Aidemy" "in Ihren eigenen Worten" gelernt haben. Es kann Fehler und Missverständnisse enthalten. Bitte beachten Sie.

Was diesmal zu lernen ・ Hyperparameter für Entscheidungsbaum, zufällige Gesamtstruktur und k-NN ・ Automatisierung der Abstimmung (Parametereinstellung)

Hyperparameter des Entscheidungsbaums

Parameter max_depth

-__ Max_depth__ gibt die Tiefe des Baums an, den das __- Modell lernt. Wenn dieser Wert nicht festgelegt ist oder der Wert zu groß ist, liegt er zu nahe an den Lehrerdaten und wird nicht verallgemeinert. Begrenzen Sie daher max_depth, um ihn zu verallgemeinern. Dies wird als "Beschneiden des Entscheidungsbaums" bezeichnet.

Parameter random_state

Da der Entscheidungsbaum eine hierarchische Struktur hat, ist das Verhältnis der zu Beginn extrahierten Daten zum Ganzen größer. Daher ist der Einfluss auf das Ergebnis von __random_state, der die Reihenfolge des Datenabrufs angibt, größer als der anderer Modelle. __ __

Zufällige Waldhyperparameter

Parameter n_estimators

Zufällige Gesamtstruktur ist ein Modell, das "mehrere Entscheidungsbäume für zufällige Daten erstellt und als Ergebnis die Klasse mit der größten Anzahl von Klassifizierungsergebnissen ausgibt", aber zu diesem Zeitpunkt wird n_estimators erstellt __ " Die Anzahl der ermittelten Bäume "__ wird angezeigt.

Parameter max_depth

Obwohl die Tiefe des Entscheidungsbaums auch in der zufälligen Gesamtstruktur festgelegt werden kann, ist es besser, nicht jeden einzelnen zu vertiefen, da mehrere Entscheidungsbäume vorhanden sind. Daher sollte der Wert kleiner als der normale Entscheidungsbaum sein. __ __

Parameter random_state

In der Zufallsstruktur werden auch Zufallszahlen für die Datenextraktion verwendet, wie in "Mehrere zufällige Datenbestimmungsbäume erstellen". Wenn sich also der Wert von __random_state ändert, unterscheiden sich die Analyseergebnisse erheblich. __ __

k-NN-Hyperparameter

Parameter n_neighbors

-K-NN ist ein Modell, das "k Lehrerdaten ähnlich den Vorhersagedaten extrahiert und die häufigste Klasse als Vorhersageergebnis ausgibt", aber n_nachbarn gibt den Wert __ dieses __k an. .. Das heißt, "die Anzahl der Lehrerdaten, die zur Vorhersage in Bezug auf eine Daten verglichen werden sollen".

Automatisierung der Abstimmung (Parametereinstellung)

・ Es ist sehr mühsam, alle Parameter einzustellen, während ihre Werte geändert werden. Daher können Sie Zeit sparen, indem Sie den Parameterbereich __ angeben und den Computer den Parametersatz mit den besten Ergebnissen suchen lassen. -Es gibt zwei Arten der Automatisierung: __ "Rastersuche" und "Zufallssuche" __.

Rastersuche

-Grid-Suche ist eine __ Methode, bei der mehrere Kandidaten für __ Parameterwerte im Voraus angegeben werden, jeder Satz ausgewertet wird und der Satz mit den besten Ergebnissen übernommen wird.

Wird häufig verwendet, wenn der Wert "Zeichenfolge", "Ganzzahl", "Richtig / Falsch" usw. ist (da es einfach ist, ihn explizit anzugeben).
Führen Sie tatsächlich eine Rastersuche mit einer nichtlinearen SVM durch. Die Methode besteht darin, jeden Parameter als Wörterbuchschlüssel und Werte als Liste beim Erstellen des __- Modells zu übergeben. __ __

from sklearn.model_selection import GridSearchCV
#Parameterkandidaten (Kernel ist nicht vorberechnet, C ist-5~10 zur i-ten Potenz mit bis zu 5 als Index)
set_grid = {SVC():{"kernel":["linear","poly","rbf","sigmoid"],"C":[10**i for i in range(-5,5)],"decision_function_shape":["ovr","ovo"],"random_state":[0]}}
#Definieren Sie die "richtige Antwortrate" und den "verwendeten Parameter" mit den besten Ergebnissen, die später gespeichert werden sollen
max_score = 0
best_param = None
#set_Führen Sie eine Rastersuche mit "SVC ()" des Rasters als "Modell" und "Parameter (Kandidat)" als "Parameter" durch.
for model,param in set_grid.items():
    search_model = GridSearchCV(model, param)
    search_model.fit(train_X, train_y)
#Berechnen Sie die richtige Antwortrate und speichern Sie den Parametersatz mit den besten Ergebnissen und der richtigen Antwortrate.
    pred_y = search_model.predict(test_X)
    score = f1_score(test_y,pred_y,average="micro")
    if max_score<score:
        max_score = score
        best_model = model.class.name
        best_param = searchmodel.best_param

Zufällige Suche

Die Zufallssuche ist eine __- Methode, die einen Bereich von __ Parameterwerten angibt, Werte zufällig aus diesem Bereich festlegt, das Modell auswertet und den Parametersatz mit den besten Ergebnissen übernimmt.
Verwenden Sie die __probability-Funktion __, um den Bereich anzugeben. Dies wird aus dem Modul scipy.stats importiert.
Führen Sie tatsächlich eine Rastersuche mit einer nichtlinearen SVM durch. Die Methode entspricht der Rastersuche.

import scipy.stats as sc
from sklearn.model_selection import RandomizedSearchCV
#Parameterkandidaten (C ist durchschnittlich 0).00001,Gleichmäßige Verteilung mit Standardabweichung von 1000, zufällig_state nimmt zufällig einen ganzzahligen Wert von 0 bis 100 an)
set_rondom = {SVC():{"kernel":["linear","poly","rbf","sigmoid"],"C":sc.uniform(0.00001,1000),"decision_function_shape":["ovr","ovo"],"random_state":sc.randint(0,100)}}
#Definieren Sie die "richtige Antwortrate" und den "verwendeten Parameter" mit den besten Ergebnissen, die später gespeichert werden sollen(Das Folgende ist fast das gleiche wie das Gitter)
max_score = 0
best_param = None
#set_Führen Sie eine zufällige Suche mit "SVC ()" im Raster als "Modell" und "Parameter (Kandidat)" als "Parameter" durch.
for model,param in set_random.items():
    search_model = RandomizedSearchCV(model, param)
    search_model.fit(train_X, train_y)
#Berechnen Sie die richtige Antwortrate und speichern Sie den Parametersatz mit den besten Ergebnissen und der richtigen Antwortrate.
    pred_y = search_model.predict(test_X)
    score = f1_score(test_y,pred_y,average="micro")
    if max_score<score:
        max_score = score
        best_model = model.__class__.__name__
        best_param = search_model.best_params_

Schwierigkeiten bei der Einstellung der Hyperparameter

-Automatische Parametereinstellung verwendet grundsätzlich eine Methode namens Gradientenmethode, bei der der Wert verschoben wird, um die Verlustfunktion zu reduzieren. Bei dieser Gradientenmethode gibt es eine Pseudolösung __ Sattelpunkt __, und wenn Sie sich darauf einlassen, können Sie die ursprüngliche Lösung nicht erreichen. ・ Da sich diese Verlustfunktion jedoch je nach Fall ändert, muss beim Versuch die Einstellung __ festgelegt werden. __ __

Zusammenfassung

-Der Hyperparameter des Entscheidungsbaums enthält zusätzlich zu __ "max_depth" __ "random_state", wodurch die Tiefe des Baums begrenzt wird.

Zufällige Gesamtstruktur-Hyperparameter umfassen "max_depth" und "random_state" zusätzlich zu __ "n_estimators" __, die die Anzahl der bestimmten Bäume angeben. -Der Hyperparameter von k-NN hat __ "n_Nachbarn" __, der die Anzahl der Lehrerdaten angibt, die zur Vorhersage verglichen werden sollen. -Tuning kann mit __ "Rastersuche" "Zufallssuche" __ automatisiert werden.

Diese Zeit ist vorbei. Vielen Dank, dass Sie so weit gelesen haben.

[PYTHON] Überwachtes Lernen 3 Hyperparameter und Abstimmung (2)

Einführung

Hyperparameter des Entscheidungsbaums

Parameter max_depth

Parameter random_state

Zufällige Waldhyperparameter

Parameter n_estimators

Parameter max_depth

Parameter random_state

k-NN-Hyperparameter

Parameter n_neighbors

Automatisierung der Abstimmung (Parametereinstellung)

Rastersuche

Zufällige Suche

Schwierigkeiten bei der Einstellung der Hyperparameter

Zusammenfassung