Shortcuts

框架.中间件.收集器

收集器

步骤收集器

class ding.framework.middleware.collector.StepCollector(*args, **kwargs)[source]
Overview:

按步骤运行的收集器类,包括模型推理和转换过程。使用__call__方法来执行整个收集过程。

__call__(ctx: OnlineRLContext) None[source]
Overview:

推理和推出中间件的封装。在完成目标步骤数时停止。

Input of ctx:
  • env_step (int): 在收集过程中会增加的env步骤。

__init__(cfg: EasyDict, policy, env: BaseEnvManager, random_collect_size: int = 0) None[source]
Arguments:
  • cfg (EasyDict): 配置。

  • policy (Policy): 要收集的策略。

  • env (BaseEnvManager): 用于收集的环境,支持BaseEnvManager对象或其派生类。

  • random_collect_size (int): 随机收集的样本数量,通常用于初始运行。

剧集收集器

class ding.framework.middleware.collector.EpisodeCollector(cfg: EasyDict, policy, env: BaseEnvManager, random_collect_size: int = 0)[source]
Overview:

按情节运行的收集器类,包括模型推理和转换过程。使用__call__方法来执行整个收集过程。

__call__(ctx: OnlineRLContext) None[source]
Overview:

推理和推出中间件的封装。在完成目标数量的回合时停止。

Input of ctx:
  • env_episode (int): 在收集过程中会增加的env_episode。

__init__(cfg: EasyDict, policy, env: BaseEnvManager, random_collect_size: int = 0) None[源代码]
Arguments:
  • cfg (EasyDict): 配置。

  • policy (Policy): 要收集的策略。

  • env (BaseEnvManager): 用于收集的环境,支持BaseEnvManager对象或其派生类。

  • random_collect_size (int): 随机收集的样本数量,通常用于初始运行。