ray/rllib/tuned_examples/regression_tests/cartpole-ppo-torch.yaml

cartpole-ppo-tf:
    env: CartPole-v0
    run: PPO
    stop:
        episode_reward_mean: 150
        timesteps_total: 100000
    config:
        num_workers: 1
        batch_mode: complete_episodes
        observation_filter: MeanStdFilter
        use_pytorch: true
Add cartpole PPO torch to regression (besides tf). (#7005) 2020-02-02 02:41:38 +01:00			`cartpole-ppo-tf:`
			`env: CartPole-v0`
			`run: PPO`
			`stop:`
			`episode_reward_mean: 150`
			`timesteps_total: 100000`
			`config:`
			`num_workers: 1`
			`batch_mode: complete_episodes`
			`observation_filter: MeanStdFilter`
			`use_pytorch: true`