• Docs >
  • Welcome to the TorchCodec documentation!
Shortcuts

欢迎来到 TorchCodec 文档!

TorchCodec 是一个用于将视频解码为 PyTorch 张量的 Python 库,支持 CPU 和 CUDA GPU。它的目标是快速、易于使用,并且与 PyTorch 生态系统良好集成。如果你想使用 PyTorch 在视频上训练机器学习模型,TorchCodec 就是将这些视频转换为数据的方式。

我们通过以下方式实现这些能力:

  • 遵循Python和PyTorch惯例的Pythonic API。

  • 依赖FFmpeg进行解码。TorchCodec使用您已安装的FFmpeg版本。FMPEG是一个成熟的库,覆盖广泛,可在大多数系统上使用。然而,它并不易于使用。TorchCodec抽象了FFmpeg的复杂性,以确保其正确且高效地使用。

  • 将数据作为PyTorch张量返回,准备输入到PyTorch转换中或直接用于训练模型。

Getting Started with TorchCodec

一个简单的视频解码示例

generated_examples/basic_example.html
Clip sampling

如何从视频中采样常规和随机片段

generated_examples/sampling.html
GPU decoding

一个简单的示例,演示CUDA GPU解码

generated_examples/basic_cuda_example.html

注意

TorchCodec 仍处于开发阶段,我们正在积极寻求反馈。如果您有任何建议或问题,请通过在我们的 GitHub 仓库提交问题 来告知我们。