mars.learn.contrib.pytorch.run_pytorch_script#

mars.learn.contrib.pytorch.run_pytorch_script(script: 联合[字节, 字符串, 二进制输入输出, 文本输入输出], n_workers: 整型, data: 可选[字典[字符串, TileableType]] = None, gpu: 可选[布尔型] = None, command_argv: 可选[列表[字符串]] = None, retry_when_fail: 布尔型 = False, session: 可选[SessionType] = None, run_kwargs: 可选[字典[字符串, 任何]] = None, port: 可选[整型] = None)[来源]#

在Mars集群中运行PyTorch脚本。

Parameters
  • 脚本 (str类文件对象) – 要运行的脚本

  • n_workers (int) – PyTorch工作者的数量

  • data (dict) – 数据的变量名。

  • gpu (bool) – 在GPU上运行PyTorch脚本

  • command_argv (list) – 脚本的额外命令参数

  • retry_when_fail (bool) – 如果为 True,在函数失败时重试。

  • session – Mars 会话,如果未提供,将使用默认会话。

  • run_kwargs (dict) – session.run 的额外参数。

  • port (int) – PyTorch工作者或参数服务器的端口,将为相同工作者自动增加

Returns

如果成功则返回 {‘status’: ‘ok’},否则抛出错误

Return type

状态