欢迎来到 TorchCodec 文档!¶
TorchCodec 是一个用于将视频解码为 PyTorch 张量的 Python 库,支持 CPU 和 CUDA GPU。它的目标是快速、易于使用,并且与 PyTorch 生态系统良好集成。如果你想使用 PyTorch 在视频上训练机器学习模型,TorchCodec 就是将这些视频转换为数据的方式。
我们通过以下方式实现这些能力:
遵循Python和PyTorch惯例的Pythonic API。
依赖FFmpeg进行解码。TorchCodec使用您已安装的FFmpeg版本。FMPEG是一个成熟的库,覆盖广泛,可在大多数系统上使用。然而,它并不易于使用。TorchCodec抽象了FFmpeg的复杂性,以确保其正确且高效地使用。
将数据作为PyTorch张量返回,准备输入到PyTorch转换中或直接用于训练模型。
Installation instructions
如何安装TorchCodec
Getting Started with TorchCodec
一个简单的视频解码示例
Clip sampling
如何从视频中采样常规和随机片段
GPU decoding
一个简单的示例,演示CUDA GPU解码