数据集¶
Torchvision 在 torchvision.datasets 模块中提供了许多内置数据集,以及用于构建自定义数据集的实用类。
内置数据集¶
所有数据集都是torch.utils.data.Dataset的子类
即,它们实现了__getitem__和__len__方法。
因此,它们都可以传递给torch.utils.data.DataLoader
它可以使用torch.multiprocessing工作器并行加载多个样本。
例如:
imagenet_data = torchvision.datasets.ImageNet('path/to/imagenet_root/')
data_loader = torch.utils.data.DataLoader(imagenet_data,
batch_size=4,
shuffle=True,
num_workers=args.nThreads)
所有数据集都有几乎相似的API。它们都有两个共同的参数:
transform 和 target_transform 分别用于转换输入和目标。
你也可以使用提供的 基类 创建自己的数据集。
图像分类¶
|
Caltech 101 数据集。 |
|
Caltech 256 数据集。 |
|
|
|
CIFAR10 数据集。 |
|
CIFAR100 数据集。 |
|
The Country211 Data Set 来自 OpenAI。 |
|
|
|
EMNIST 数据集。 |
|
EuroSAT 数据集的RGB版本。 |
|
一个返回随机生成图像并将其作为PIL图像返回的假数据集 |
|
Fashion-MNIST 数据集。 |
|
FER2013 数据集。 |
|
FGVC Aircraft 数据集。 |
|
Flickr8k Entities 数据集。 |
|
Flickr30k Entities 数据集。 |
|
Oxford 102 Flower 数据集。 |
|
|
|
|
|
iNaturalist 数据集。 |
|
ImageNet 2012 分类数据集。 |
|
Imagenette 图像分类数据集。 |
|
Kuzushiji-MNIST 数据集。 |
|
LFW 数据集。 |
|
LSUN 数据集。 |
|
MNIST 数据集。 |
|
Omniglot 数据集。 |
|
|
|
Places365 分类数据集。 |
|
|
|
QMNIST 数据集。 |
|
|
|
SEMEION 数据集。 |
|
SBU Captioned Photo 数据集。 |
|
斯坦福汽车数据集 |
|
STL10 数据集。 |
|
|
|
SVHN 数据集。 |
|
USPS 数据集。 |
图像检测或分割¶
|
MS Coco Detection 数据集。 |
|
大规模名人面部属性(CelebA)数据集 数据集。 |
|
Cityscapes 数据集。 |
|
KITTI 数据集。 |
|
|
|
|
|
Pascal VOC 分割数据集。 |
|
Pascal VOC 检测数据集。 |
|
WIDERFace 数据集。 |
光流¶
|
FlyingChairs 光流数据集。 |
|
FlyingThings3D 数据集用于光流。 |
|
HD1K 数据集用于光流。 |
|
KITTI 数据集用于光流(2015年)。 |
|
Sintel 光流数据集。 |
立体匹配¶
|
Carla模拟器数据链接在CREStereo github repo中。 |
|
KITTI数据集来自2012年立体评估基准。 |
|
KITTI数据集来自2015立体评估基准。 |
|
用于训练CREStereo架构的合成数据集。 |
|
FallingThings 数据集。 |
|
Scene Flow 数据集的数据集接口。 |
|
Sintel Stereo Dataset. |
|
InStereo2k 数据集。 |
|
ETH3D 低分辨率双视图 数据集。 |
|
来自Middlebury数据集的公开可用场景 2014版本 |
图像对¶
|
LFW 数据集。 |
|
图像字幕¶
|
MS Coco Captions 数据集。 |
视频分类¶
|
HMDB51 数据集。 |
|
Generic Kinetics 数据集。 |
|
UCF101 数据集。 |
视频预测¶
|
MovingMNIST 数据集。 |
自定义数据集的基础类¶
|
一个通用的数据加载器。 |
|
一个通用的数据加载器,其中图像默认按以下方式排列:。 |
|
用于制作与torchvision兼容的数据集的基类。 |
转换 v2¶
|
将 |