mars.learn.contrib.pytorch.run_pytorch_script#
- mars.learn.contrib.pytorch.run_pytorch_script(script: 联合[字节, 字符串, 二进制输入输出, 文本输入输出], n_workers: 整型, data: 可选[字典[字符串, TileableType]] = None, gpu: 可选[布尔型] = None, command_argv: 可选[列表[字符串]] = None, retry_when_fail: 布尔型 = False, session: 可选[SessionType] = None, run_kwargs: 可选[字典[字符串, 任何]] = None, port: 可选[整型] = None)[来源]#
在Mars集群中运行PyTorch脚本。
- Parameters
脚本 (str 或 类文件对象) – 要运行的脚本
n_workers (int) – PyTorch工作者的数量
data (dict) – 数据的变量名。
gpu (bool) – 在GPU上运行PyTorch脚本
command_argv (list) – 脚本的额外命令参数
retry_when_fail (bool) – 如果为 True,在函数失败时重试。
session – Mars 会话,如果未提供,将使用默认会话。
run_kwargs (dict) – session.run 的额外参数。
port (int) – PyTorch工作者或参数服务器的端口,将为相同工作者自动增加
- Returns
如果成功则返回 {‘status’: ‘ok’},否则抛出错误
- Return type
状态