Bewegen wir CartPole sofort.
CartPole.py
import gym
env = gym.make('CartPole-v0')
for i_episode in range(20):
observation = env.reset()
for t in range(100):
env.render()
action = env.action_space.sample()
observation, reward, done, info = env.step(action)
if done:
print("Episode finished after {} timesteps".format(t+1))
break
env.close()
python ./CartPole.py
Wenn es funktioniert, ist es OK. CartPole scheint einfach zu sein und es gibt viele Erklärungen. Ignorieren Sie die Erklärungen.
Recommended Posts