cartpole-es-tf:
    env: CartPole-v0
    run: ES
    stop:
        episode_reward_mean: 150
        timesteps_total: 400000
    config:
        use_pytorch: false
        num_workers: 2
        noise_size: 25000000
        episodes_per_batch: 50