[PYTHON] Je veux que DQN Puniki frappe un home run

Deep Q-Network (DQN)

J'ai trouvé intéressant Deep Q-Network, qui utilise Deep Learning + apprentissage amélioré pour apprendre les modèles de comportement, alors je l'ai implémenté. Je vais le publier car j'ai un petit résultat.

Le code source est disponible ci-dessous. https://github.com/dsanno/chainer-dqn

Ce qui suit est détaillé sur DQN. Histoire de DQN + Deep Q-Network écrite dans Chainer

Objectif d'apprentissage

Le jeu que DQN apprendra cette fois est Homelander Bee de Kuma no Pooh! . (Notez qu'un son sera entendu à la destination du lien) Le but est de faire en sorte qu'Aniki, également connu sous le nom de Puniki, frappe de nombreux circuits.

Les raisons de choisir ce jeu sont les suivantes

Il y avait aussi une raison pour laquelle c'était très difficile pour les humains, mais je ne pouvais pas atteindre le point où cela devenait difficile. (Référence: [Niko Niko Encyclopedia](http://dic.nicovideo.jp/a/%E3%81%8F%E3%81%BE%E3%81%AE%E3%83%97%E3%83% BC% E3% 81% 95% E3% 82% 93% E3% 81% AE% E3% 83% 9B% E3% 83% BC% E3% 83% A0% E3% 83% A9% E3% 83% B3% E3% 83% 80% E3% 83% BC% E3% 83% 93% E3% 83% BC!))

Environnement de développement

Configuration du réseau neuronal

À propos du jeu

À propos de l'apprentissage

Réglage

Résultat d'apprentissage

Après avoir continué à étudier au stade 1 pendant environ 10 heures, j'ai pu presque terminer le stade 1. J'ai téléchargé la vidéo de lecture ci-dessous. J'essaie de ne pas prendre d'actions aléatoires lors de la prise de vue de vidéos. https://youtu.be/J4V6ZveYFUM

Après avoir appris y compris d'autres étapes, j'ai pu confirmer que l'étape 3 avait été effacée par un hasard.

Les références

Recommended Posts

Je veux que DQN Puniki frappe un home run
Je veux faire fonctionner un ordinateur quantique avec Python
Je veux imprimer dans la notation d'inclusion
Je veux créer un environnement Python
Je veux faire de matplotlib un thème sombre
Je souhaite créer facilement un modèle de bruit
Je veux INSÉRER un DataFrame dans MSSQL
Je veux créer une fenêtre avec Python
Je veux faire un jeu avec Python
Je ne veux pas passer un test de codage
Je souhaite créer un type d'implémentation pouvant être branché
Je veux trouver facilement une délicieuse boutique
Je veux écrire dans un fichier avec Python
Je souhaite télécharger une application Django sur heroku
Je souhaite intégrer une variable dans une chaîne Python
Je veux facilement implémenter le délai d'expiration en python
100 coups sur le traitement d'image !! (021-030) Je veux faire une pause ...
Je veux donner un group_id à une trame de données pandas
Je veux générer rapidement UUID (memo memo) ~ Edition Python ~
Je veux faire la transition avec un bouton sur le ballon
Je veux escalader une montagne avec l'apprentissage par renforcement
Je veux écrire en Python! (2) Écrivons un test
Je veux trouver un package populaire sur PyPi
Je veux échantillonner au hasard un fichier avec Python
Je souhaite créer facilement un environnement de développement basé sur un modèle
Je veux travailler avec un robot en python.
Je veux diviser une chaîne de caractères avec hiragana
Je souhaite installer un package de Php Redis
[Python] Je veux faire d'une liste imbriquée un taple
Je souhaite créer manuellement une légende avec matplotlib
Je souhaite envoyer automatiquement un e-mail de création d'entreprise
Je suis un utilisateur Windows mais je souhaite exécuter tensorflow
Je veux lier une variable locale avec lambda
Je veux un générateur de mox
Je veux résoudre SUDOKU
Je veux un générateur mox (2)
Je veux créer un éditeur de blog avec l'administrateur de django
Je veux démarrer un environnement Jupyter avec une seule commande
[Python] Je souhaite obtenir un ensemble commun entre numpy
Je veux démarrer beaucoup de processus à partir de python
Je veux faire une macro de clic avec pyautogui (désir)
Je veux générer automatiquement un nom de groupe de metal moderne
Je veux faire une macro de clic avec pyautogui (Outlook)
Je souhaite utiliser un environnement virtuel avec jupyter notebook!
Je veux installer le package de requirements.txt avec poésie
Je souhaite envoyer un message de Python à LINE Bot
[Visualisation] Je veux dessiner un beau graphique avec Plotly
Je veux pouvoir exécuter Python avec VS Code
Je veux ajouter un joli complément à input () en python
Lorsque vous souhaitez lancer une commande UNIX sur Python
Je veux créer un Dockerfile pour le moment.
Je souhaite enregistrer l'heure d'exécution et conserver un journal.
Je souhaite utiliser un caractère générique que je souhaite décortiquer avec Python remove
Je veux comprendre à peu près systemd
Configuration MacBookPro Après tout, je veux faire une installation propre
Je veux utiliser des rails avec des rails même dans un environnement vagabond
Qiskit: Je veux créer un circuit qui crée des états arbitraires! !!
Je veux exécuter l'interface graphique Python au démarrage de Raspberry Pi
Je souhaite rechercher le texte intégral avec elasticsearch + python