Shortcuts

视频ResNet

VideoResNet模型基于A Closer Look at Spatiotemporal Convolutions for Action Recognition论文。

警告

视频模块处于测试阶段,不保证向后兼容性。

模型构建器

以下模型构建器可用于实例化VideoResNet模型,无论是否使用预训练权重。所有模型构建器内部都依赖于torchvision.models.video.resnet.VideoResNet基类。有关此类的更多详细信息,请参阅源代码

r3d_18(*[, weights, progress])

构建18层Resnet3D模型。

mc3_18(*[, weights, progress])

构建18层混合卷积网络,如

r2plus1d_18(*[, weights, progress])

构建18层深的R(2+1)D网络,如