ray/rllib/policy at 765e8d8d535a17850c922311bba89db3dd8de78a - hiro/ray

hiro/ray

mirror of https://github.com/vale981/ray synced 2025-03-06 10:31:39 -05:00

History

mvindiola1 8cee0c03bf [RLlib] Update `max_seq_len` in pad_batch_to_sequences_of_same_size (#20743 )		2021-11-30 18:00:07 +01:00
..
tests	[RLlib] Update `max_seq_len` in pad_batch_to_sequences_of_same_size (#20743 )	2021-11-30 18:00:07 +01:00
__init__.py	[RLlib] JAXPolicy prep. PR #1 . (#13077 )	2020-12-26 20:14:18 -05:00
dynamic_tf_policy.py	[RLlib] Issue 20269: Offline RL example not working due to new_obs not being written to file. (#20366 )	2021-11-15 16:41:08 +01:00
eager_tf_policy.py	Revert "Revert [RLlib] POC: Deprecate `build_policy` (policy template) for torch only; PPOTorchPolicy (#20061 ) (#20399 )" (#20417 )	2021-11-16 14:49:41 +01:00
policy.py	Revert "Revert [RLlib] POC: Deprecate `build_policy` (policy template) for torch only; PPOTorchPolicy (#20061 ) (#20399 )" (#20417 )	2021-11-16 14:49:41 +01:00
policy_map.py	[RLlib; Docs] Auto API reference pages overhaul: `rllib/policy` and `rllib/agents` packages. (#20537 )	2021-11-25 09:35:19 +01:00
policy_template.py	Revert "Revert [RLlib] POC: Deprecate `build_policy` (policy template) for torch only; PPOTorchPolicy (#20061 ) (#20399 )" (#20417 )	2021-11-16 14:49:41 +01:00
rnn_sequencing.py	[RLlib] Update `max_seq_len` in pad_batch_to_sequences_of_same_size (#20743 )	2021-11-30 18:00:07 +01:00
sample_batch.py	[RLlib] SampleBatch.concat_samples fix incorrect max_seq_len calculation (#20704 )	2021-11-29 12:01:40 +01:00
tf_policy.py	[RLlib] Tf2 + eager-tracing same speed as framework=tf; Add more test coverage for tf2+tracing. (#19981 )	2021-11-05 16:10:00 +01:00
tf_policy_template.py	[RLlib; Docs overhaul] Docstring cleanup: Evaluation (#19783 )	2021-10-29 12:03:56 +02:00
torch_policy.py	Revert "Revert [RLlib] POC: Deprecate `build_policy` (policy template) for torch only; PPOTorchPolicy (#20061 ) (#20399 )" (#20417 )	2021-11-16 14:49:41 +01:00
torch_policy_template.py	[RLlib; Docs overhaul] Docstring cleanup: rllib/utils (#19829 )	2021-11-01 21:46:02 +01:00
view_requirement.py	[RLlib] Remove all non-trajectory view API code. (#14860 )	2021-03-23 09:50:18 -07:00