expand_node() Eine Methode, die nicht erweiterte Knoten erweitert. Angenommen, Sie möchten einen Knoten erweitern, wie in der folgenden Abbildung dargestellt.
Wenn node_expand () ausgeführt wird, wird der Index (hier x) aus dem Hash dieses Knotens bestimmt, und node_hash [x] und uct_node [x] werden diesem Knoten zugewiesen. Generieren Sie die 9 rot angezeigten Parameter und speichern Sie sie als Mitgliedsvariablen von uct_node [x].
eval_node() Ein Verfahren, das den Aspekt des zu bewertenden Knotens eingibt und die vorhergesagte Wahrscheinlichkeit des Richtliniennetzwerks und die vorhergesagte Gewinnrate des Wertnetzwerks ausgibt. Angenommen, Sie möchten einen Knoten auswerten, wie in der folgenden Abbildung dargestellt.
Die Phaseninformationen werden in das neuronale Netzwerk eingegeben, um die vorhergesagte Wahrscheinlichkeit des Richtliniennetzwerks und die vorhergesagte Gewinnrate des Wertnetzwerks zu erhalten.
Aktualisieren Sie die Knoteninformationen (drei in Rot).
Recommended Posts