框架.中间件.ckpt_handler¶

ckpt_handler¶

class ding.framework.middleware.ckpt_handler.CkptSaver(*args, **kwargs)[source]¶

__call__(ctx: OnlineRLContext | OfflineRLContext) → None[source]¶

Overview:

用于保存检查点数据的方法。检查点数据将在以下三种情况下保存到文件中： - 当自训练开始以来，迭代次数达到self.train_freq的倍数时； - 当评估回合的回报是迄今为止最好的时； - 当task.finish为True时。

Input of ctx:

__init__(policy: Policy, save_dir: str, train_freq: int | None = None, save_finish: bool = True)[源代码]¶

Overview:

初始化 CkptSaver。

Arguments: