Torch 分布式弹性¶ 使分布式 PyTorch 具有容错性和弹性。 开始使用¶ 用法 快速入门 训练脚本 示例 文档¶ API torchrun (弹性启动) Elastic Agent 多进程处理 错误传播 集合点 过期计时器 指标 事件 子进程处理 高级 自定义 插件 TorchElastic Kubernetes