ray/rllib/tuned_examples/maml/cartpole-maml.yaml

# Same configs as Pendulum
cartpole-maml:
    env: CartPole-v0
    run: MAML
    stop:
        training_iteration: 100
    config:
        # Works with both frameworks, "tf" and "torch".
        framework: torch
        horizon: 200
        rollout_fragment_length: 200
        num_envs_per_worker: 10
        inner_adaptation_steps: 1
        maml_optimizer_steps: 5
        gamma: 0.99
        lambda: 1.0
        lr: 0.001
        vf_loss_coeff: 0.5
        clip_param: 0.3
        kl_target: 0.01
        kl_coeff: 0.001
        num_workers: 20
        num_gpus: 1
        inner_lr: 0.03
        clip_actions: False
        use_meta_env: False
        model:
            fcnet_hiddens: [64, 64]