ray/rllib/tuned_examples/regression_tests/pendulum-td3.yaml

pendulum-td3-tf:
    env: Pendulum-v0
    run: TD3
    stop:
        use_pytorch: false
        episode_reward_mean: -900
        timesteps_total: 100000
[RLlib] Stabilize Pendulum-v0 regression test cases. (#8232) Stabilize Pendulum regression test cases. 2020-04-30 15:48:11 +02:00			`pendulum-td3-tf:`
[RLlib] DDPG refactor and Exploration API action noise classes. (#7314) * WIP. * WIP. * WIP. * WIP. * WIP. * Fix * WIP. * Add TD3 quick Pendulum regresison. * Cleanup. * Fix. * LINT. * Fix. * Sort quick_learning test cases, add TD3. * Sort quick_learning test cases, add TD3. * Revert test_checkpoint_restore.py (debugging) changes. * Fix old soft_q settings in documentation and test configs. * More doc fixes. * Fix test case. * Fix test case. * Lower test load. * WIP. 2020-03-01 20:53:35 +01:00			`env: Pendulum-v0`
			`run: TD3`
			`stop:`
[RLlib] Stabilize Pendulum-v0 regression test cases. (#8232) Stabilize Pendulum regression test cases. 2020-04-30 15:48:11 +02:00			`use_pytorch: false`
[RLlib] DDPG refactor and Exploration API action noise classes. (#7314) * WIP. * WIP. * WIP. * WIP. * WIP. * Fix * WIP. * Add TD3 quick Pendulum regresison. * Cleanup. * Fix. * LINT. * Fix. * Sort quick_learning test cases, add TD3. * Sort quick_learning test cases, add TD3. * Revert test_checkpoint_restore.py (debugging) changes. * Fix old soft_q settings in documentation and test configs. * More doc fixes. * Fix test case. * Fix test case. * Lower test load. * WIP. 2020-03-01 20:53:35 +01:00			`episode_reward_mean: -900`
			`timesteps_total: 100000`