In diesem Artikel werde ich die Parameter von LightGBM zusammenfassen. Ich habe gerade das offizielle Dokument ins Japanische übersetzt, aber ich hoffe, Sie finden es hilfreich. (Ich möchte die Geschichte von LightGBM selbst von Zeit zu Zeit aktualisieren.)
max_depth
Gibt die Tiefe des zu verwendenden Baums an. Lassen Sie uns mit dem Parameter num_leaves
darüber nachdenken.
num_leaves
Es ist ein Parameter, der die Komplexität des Modells bestimmt. Theoretisch scheint 2 ^ (max_depth
) gut zu sein, aber in der Praxis scheint ein Wert kleiner als 2 ^ ( max_depth
) gut zu sein. ** Wenn max_depth
als 7 angegeben ist, sollte num_leaves
als ungefähr 70-80 angegeben werden? Wurde geschrieben. ** **.
min_data_in_leaf
Dies ist ein wichtiger Parameter, um eine Überanpassung zu vermeiden. Es wird geschrieben, dass dies durch die Anzahl der Stichproben von Trainingsdaten und den Wert von "num_leaves" entschieden wird. Bei einer großen Anzahl von Stichproben scheint ein Wert von Hunderten bis Tausenden gut zu sein.
Ich habe eine ordentlich organisierte [Site] gefunden (https://www.codexa.net/lightgbm-beginner/). Bitte lesen Sie dies auch!