ray.rllib.algorithms.algorithm.Algorithm.export_策略_模型#

Algorithm.export_policy_model(export_dir: str, policy_id: str = 'default_policy', onnx: int | None = None) → None[源代码]#

将具有给定 policy_id 的导出策略模型导出到本地目录。

参数:

export_dir – 可写的本地目录。
policy_id – 可选的导出策略ID。
onnx – 如果给出，将导出模型为 ONNX 格式。此参数的值设置要使用的 ONNX OpSet 版本。如果为 None，输出格式将是特定于深度学习框架的。

from ray.rllib.algorithms.ppo import PPO, PPOConfig
config = PPOConfig().environment("CartPole-v1")
algo = PPO(config=config)
algo.train()
algo.export_policy_checkpoint("/tmp/export_dir")
algo.export_policy_model("/tmp/dir")