ray/rllib/examples/bandit at 716ee7f83f76f045b2bf8c2b5c923fb00b14e25a - hiro/ray

hiro/ray

mirror of https://github.com/vale981/ray synced 2025-03-06 10:31:39 -05:00

History

Sven Mika 130b7eeaba [RLlib] `Trainer` to `Algorithm` renaming. (#25539 )		2022-06-11 15:10:39 +02:00
..
lin_ts_train_wheel_env.py	[RLlib] `Trainer` to `Algorithm` renaming. (#25539 )	2022-06-11 15:10:39 +02:00
tune_lin_ts_train_wheel_env.py	[RLlib] Trainer.training_iteration -> Trainer.training_step; Iterations vs reportings: Clarification of terms. (#25076 )	2022-06-10 17:09:18 +02:00
tune_lin_ucb_train_recommendation.py	[RLlib] Trainer.training_iteration -> Trainer.training_step; Iterations vs reportings: Clarification of terms. (#25076 )	2022-06-10 17:09:18 +02:00
tune_lin_ucb_train_recsim_env.py	[RLlib] Trainer.training_iteration -> Trainer.training_step; Iterations vs reportings: Clarification of terms. (#25076 )	2022-06-10 17:09:18 +02:00