expand_node() Une méthode qui développe les nœuds non développés. Par exemple, supposons qu'il y ait un nœud que vous souhaitez développer comme indiqué dans la figure ci-dessous.
Lorsque node_expand () est exécuté, l'index (ici, x) est déterminé à partir du hachage de ce nœud, et node_hash [x] et uct_node [x] sont attribués à ce nœud. Générez les 9 paramètres affichés en rouge et enregistrez-les en tant que variables membres de uct_node [x].
eval_node() L'invention concerne un procédé qui entre l'aspect du nœud à évaluer et qui sort la probabilité prédite du réseau politique et le taux de victoire prédit du réseau de valeur. Par exemple, supposons qu'il existe un nœud que vous souhaitez évaluer comme indiqué dans la figure ci-dessous.
Entrez des informations de phase dans le réseau neuronal pour obtenir la probabilité prédite du réseau politique et le taux de victoire prédit du réseau de valeur.
Mettez à jour les informations du nœud (trois en rouge).
Recommended Posts