Shortcuts

torchvision

这个库是PyTorch项目的一部分。PyTorch 是一个开源的机器学习框架。

本文档中描述的功能按发布状态分类:

稳定: 这些功能将长期维护,通常不应存在主要的性能限制或文档缺失。我们也期望保持向后兼容性(尽管可能会发生破坏性更改,并会在发布前提前通知)。

测试版: 功能被标记为测试版,因为API可能会根据用户反馈进行更改,因为性能需要改进,或者因为跨操作员的覆盖范围尚未完成。对于测试版功能,我们承诺将其推进到稳定分类。然而,我们并不承诺向后兼容性。

原型: 这些功能通常不作为二进制发行版(如PyPI或Conda)的一部分提供,除非有时通过运行时标志启用,并且处于反馈和测试的早期阶段。

torchvision 包包含了流行的数据集、模型架构以及用于计算机视觉的常见图像变换。

示例和培训参考资料

torchvision.get_image_backend()[source]

获取用于加载图像的包的名称

torchvision.get_video_backend()[source]

返回当前用于解码视频的活动视频后端。

Returns:

视频后端的名称。其中之一为 {'pyav', 'video_reader'}。

Return type:

str

torchvision.set_image_backend(backend)[source]

指定用于加载图像的包。

Parameters:

backend (string) – 图像后端的名称。其中之一是 {‘PIL’, ‘accimage’}。 accimage 包使用 Intel IPP 库。它通常比 PIL 更快,但不支持那么多操作。

torchvision.set_video_backend(backend)[source]

指定用于解码视频的包。

Parameters:

backend (string) – 视频后端的名称。其中之一是 {‘pyav’, ‘video_reader’}。 pyav 包使用第三方 PyAv 库。它是 FFmpeg 库的 Python 绑定。 video_reader 包包含一个基于 FFMPEG 库的原生 C++ 实现,以及一个 TorchScript 自定义操作符的 Python API。 它通常比 pyav 解码更快,但可能不太稳定。

注意

在最新的main中,默认情况下禁用FFMPEG构建。如果你想使用‘video_reader’后端,请从源代码编译torchvision。

使用 set_video_backend 的示例:

视频API

Video API

索引