ray.rllib.algorithms.algorithm.Algorithm.export_策略_模型#
- Algorithm.export_policy_model(export_dir: str, policy_id: str = 'default_policy', onnx: int | None = None) None [源代码]#
将具有给定 policy_id 的导出策略模型导出到本地目录。
- 参数:
export_dir – 可写的本地目录。
policy_id – 可选的导出策略ID。
onnx – 如果给出,将导出模型为 ONNX 格式。此参数的值设置要使用的 ONNX OpSet 版本。如果为 None,输出格式将是特定于深度学习框架的。
from ray.rllib.algorithms.ppo import PPO, PPOConfig config = PPOConfig().environment("CartPole-v1") algo = PPO(config=config) algo.train() algo.export_policy_checkpoint("/tmp/export_dir") algo.export_policy_model("/tmp/dir")