框架.中间件.收集器¶

收集器¶

步骤收集器¶

class ding.framework.middleware.collector.StepCollector(*args, **kwargs)[source]¶

Overview:: 按步骤运行的收集器类，包括模型推理和转换过程。使用__call__方法来执行整个收集过程。

__call__(ctx: OnlineRLContext) → None[source]¶

Overview:

推理和推出中间件的封装。在完成目标步骤数时停止。

Input of ctx:

env_step (int): 在收集过程中会增加的env步骤。

__init__(cfg: EasyDict, policy, env: BaseEnvManager, random_collect_size: int = 0) → None[source]¶

Arguments:

cfg (EasyDict): 配置。
policy (Policy): 要收集的策略。
env (BaseEnvManager): 用于收集的环境，支持BaseEnvManager对象或其派生类。
random_collect_size (int): 随机收集的样本数量，通常用于初始运行。

剧集收集器¶

class ding.framework.middleware.collector.EpisodeCollector(cfg: EasyDict, policy, env: BaseEnvManager, random_collect_size: int = 0)[source]¶

Overview:: 按情节运行的收集器类，包括模型推理和转换过程。使用__call__方法来执行整个收集过程。

__call__(ctx: OnlineRLContext) → None[source]¶

Overview:

推理和推出中间件的封装。在完成目标数量的回合时停止。

Input of ctx:

env_episode (int): 在收集过程中会增加的env_episode。

__init__(cfg: EasyDict, policy, env: BaseEnvManager, random_collect_size: int = 0) → None[源代码]¶

Arguments:

cfg (EasyDict): 配置。
policy (Policy): 要收集的策略。
env (BaseEnvManager): 用于收集的环境，支持BaseEnvManager对象或其派生类。
random_collect_size (int): 随机收集的样本数量，通常用于初始运行。