Shortcuts

torch.compiler.cudagraph_mark_step_begin

torch.compiler.cudagraph_mark_step_begin()[源代码]

表示一个新的推理或训练迭代即将开始。

CUDA 图将释放先前迭代的张量。只要没有未调用的挂起反向传播,每次调用 torch.compile 时都会启动一个新的迭代。

如果该启发式方法是错误的,例如在以下示例中,请使用此API手动标记。

@torch.compile(mode="reduce-overhead")
def rand_foo():
    return torch.rand([4], device="cuda")

for _ in range(5):
    torch.compiler.cudagraph_mark_step_begin()
    rand_foo() + rand_foo()

更多详情,请参阅 torch.compiler_cudagraph_trees

优云智算