cartpole-dqn-tf:
    env: CartPole-v0
    run: DQN
    stop:
        episode_reward_mean: 150
        timesteps_total: 50000
    config:
        use_pytorch: false
        n_step: 3
        gamma: 0.95