框架.中间件.收集器¶
收集器¶
步骤收集器¶
- class ding.framework.middleware.collector.StepCollector(*args, **kwargs)[source]¶
- Overview:
按步骤运行的收集器类,包括模型推理和转换过程。使用__call__方法来执行整个收集过程。
- __call__(ctx: OnlineRLContext) None[source]¶
- Overview:
推理和推出中间件的封装。在完成目标步骤数时停止。
- Input of ctx:
env_step (
int): 在收集过程中会增加的env步骤。
- __init__(cfg: EasyDict, policy, env: BaseEnvManager, random_collect_size: int = 0) None[source]¶
- Arguments:
cfg (
EasyDict): 配置。policy (
Policy): 要收集的策略。env (
BaseEnvManager): 用于收集的环境,支持BaseEnvManager对象或其派生类。random_collect_size (
int): 随机收集的样本数量,通常用于初始运行。
剧集收集器¶
- class ding.framework.middleware.collector.EpisodeCollector(cfg: EasyDict, policy, env: BaseEnvManager, random_collect_size: int = 0)[source]¶
- Overview:
按情节运行的收集器类,包括模型推理和转换过程。使用__call__方法来执行整个收集过程。
- __call__(ctx: OnlineRLContext) None[source]¶
- Overview:
推理和推出中间件的封装。在完成目标数量的回合时停止。
- Input of ctx:
env_episode (
int): 在收集过程中会增加的env_episode。
- __init__(cfg: EasyDict, policy, env: BaseEnvManager, random_collect_size: int = 0) None[源代码]¶
- Arguments:
cfg (
EasyDict): 配置。policy (
Policy): 要收集的策略。env (
BaseEnvManager): 用于收集的环境,支持BaseEnvManager对象或其派生类。random_collect_size (
int): 随机收集的样本数量,通常用于初始运行。