多进程包 - torch.multiprocessing¶

torch.multiprocessing 是围绕原生 multiprocessing 模块的封装。

它注册了自定义的reducers，这些reducers使用共享内存来在不同进程中提供对相同数据的共享视图。一旦张量/存储被移动到共享内存（参见share_memory_()），就可以将其发送到其他进程而无需进行任何复制。

该API与原始模块100%兼容 - 只需将import multiprocessing更改为import torch.multiprocessing，即可将通过队列或其他机制发送或共享的所有张量移动到共享内存中。

由于API的相似性，我们没有对本包的大部分内容进行文档化，我们建议参考原始模块的非常完善的文档。

警告

如果主进程突然退出（例如因为收到信号），Python的multiprocessing有时无法清理其子进程。这是一个已知的注意事项，所以如果你在中断解释器后看到任何资源泄漏，这可能意味着这种情况刚刚发生在你身上。

策略管理¶

torch.multiprocessing.set_sharing_strategy(new_strategy)[源代码]¶

设置共享CPU张量的策略。

Parameters: new_strategy (str) – 所选策略的名称。应该是由 get_all_sharing_strategies() 返回的值之一。

注意

适用于 Python >= 3.4。

这取决于Python的multiprocessing包中的spawn启动方法。

生成多个子进程来执行某些功能可以通过创建Process实例并调用join来等待它们完成。这种方法在处理单个子进程时效果良好，但在处理多个进程时可能会出现潜在问题。

即，顺序连接进程意味着它们将顺序终止。如果它们不终止，并且第一个进程不终止，进程终止将不会被注意到。此外，没有用于错误传播的原生设施。

下面的 spawn 函数解决了这些问题，并处理了错误传播、无序终止，并在检测到其中一个进程出错时主动终止进程。

torch.multiprocessing.spawn.spawn(fn, args=(), nprocs=1, join=True, daemon=False, start_method='spawn')[源代码]¶

生成 nprocs 个进程，这些进程运行 fn 并带有 args。

如果其中一个进程以非零退出状态退出，剩余的进程将被终止，并抛出一个异常，说明终止的原因。如果子进程中捕获了异常，该异常将被转发，并且其回溯信息将包含在父进程抛出的异常中。

Parameters

fn (函数) –
函数作为生成的进程的入口点被调用。此函数必须在模块的顶层定义，以便可以进行pickle处理并生成。这是由multiprocessing强加的要求。

函数被调用为 fn(i, *args)，其中 i 是进程索引，args 是通过的参数元组。
args (元组) – 传递给 fn 的参数。
nprocs (int) – 要生成的进程数。
join (bool) – 在所有进程上执行阻塞连接。
守护进程 (布尔值) – 生成的进程的守护进程标志。如果设置为True，将创建守护进程。
start_method (str) – (已弃用) 此方法将始终使用 spawn 作为启动方法。要使用不同的启动方法，请使用 start_processes()。

Returns

如果 join 是 True，则为 None，如果 join 是 False，则为 ProcessContext

class torch.multiprocessing.SpawnContext[源代码]¶

由 spawn() 在调用时返回，参数为 join=False。

join(timeout=None)¶

在spawn上下文中加入一个或多个进程。

尝试在此spawn上下文中加入一个或多个进程。如果其中一个进程以非零退出状态退出，此函数将杀死剩余的进程并引发一个异常，说明第一个进程退出的原因。

如果所有进程都已成功加入，则返回True，如果有更多进程需要加入，则返回False。