ray/rllib/agents at 7318439c3d57242d523b37101dc71128bbbd95b8 - hiro/ray

hiro/ray

mirror of https://github.com/vale981/ray synced 2025-03-06 10:31:39 -05:00

History

Sven Mika 7318439c3d [RLlib] DQN native_ratio (for training intensity) incorrect (discussion 1763). (#15436 ) Thanks @Manuscrit !		2021-04-22 11:06:29 +02:00
..
a3c	[RLlib] Obsolete usage tracking dict via sample batch. (#13065 )	2021-03-17 08:18:15 +01:00
ars	[RLlib] Multi-GPU support for Torch algorithms. (#14709 )	2021-04-16 09:16:24 +02:00
cql	[RLlib] Remove all (already soft-deprecated) `SampleBatch.data` from code. (#15335 )	2021-04-15 19:19:51 +02:00
ddpg	[RLlib] Redo issue 14533 tf enable eager exec (#14984 )	2021-03-29 20:07:44 +02:00
dqn	[RLlib] DQN native_ratio (for training intensity) incorrect (discussion 1763). (#15436 )	2021-04-22 11:06:29 +02:00
dreamer	[RLlib] Multi-GPU for tf-DQN/PG/A2C. (#13393 )	2021-03-08 15:41:27 +01:00
es	[RLlib] Multi-GPU support for Torch algorithms. (#14709 )	2021-04-16 09:16:24 +02:00
impala	[RLlib] Report mean losses instead of sum in IMPALA (discussion 1709) (#15427 )	2021-04-21 10:59:06 +02:00
maml	[RLlib] Multi-GPU for tf-DQN/PG/A2C. (#13393 )	2021-03-08 15:41:27 +01:00
marwil	[RLlib] Remove all (already soft-deprecated) `SampleBatch.data` from code. (#15335 )	2021-04-15 19:19:51 +02:00
mbmpo	[RLlib] Multi-GPU for tf-DQN/PG/A2C. (#13393 )	2021-03-08 15:41:27 +01:00
pg	[RLlib] Multi-GPU for tf-DQN/PG/A2C. (#13393 )	2021-03-08 15:41:27 +01:00
ppo	[RLlib] Multi-GPU support for Torch algorithms. (#14709 )	2021-04-16 09:16:24 +02:00
qmix	[RLlib] Multi-GPU support for Torch algorithms. (#14709 )	2021-04-16 09:16:24 +02:00
sac	[RLlib] Multi-GPU support for Torch algorithms. (#14709 )	2021-04-16 09:16:24 +02:00
slateq	[RLlib] Multi-GPU for tf-DQN/PG/A2C. (#13393 )	2021-03-08 15:41:27 +01:00
__init__.py	[RLlib] MB-MPO cleanup (comments, docstrings, type annotations). (#11033 )	2020-10-06 20:28:16 +02:00
callbacks.py	[RLlib] Extend on_learn_on_batch callback to allow for custom metrics to be added. (#13584 )	2021-02-08 15:02:19 +01:00
mock.py	Auto report object store memory usage; remove some deprecated code (#14260 )	2021-03-01 13:19:44 -08:00
registry.py	[RLlib] R2D2 Implementation. (#13933 )	2021-02-25 12:18:11 +01:00
trainer.py	[RLlib] Remove atari dependency for RLlib (in favor of detailed error message). (#15292 )	2021-04-20 08:46:58 +02:00
trainer_template.py	[RLlib] Support parallelizing evaluation and training (optional). (#15040 )	2021-04-13 09:53:35 +02:00