RenderedSST2¶
- class torchvision.datasets.RenderedSST2(root: Union[str, Path], split: str = 'train', transform: Optional[Callable] = None, target_transform: Optional[Callable] = None, download: bool = False)[source]¶
-
Rendered SST2 是一个用于评估模型在光学字符识别能力上的图像分类数据集。该数据集是通过渲染 Standford Sentiment Treebank v2 数据集中的句子生成的。
该数据集包含两个类别(正类和负类),并分为三个部分:一个训练部分包含6920张图像(3610张正类和3310张负类),一个验证部分包含872张图像(444张正类和428张负类),以及一个测试部分包含1821张图像(909张正类和912张负类)。
- Parameters:
root (str 或
pathlib.Path) – 数据集的根目录。split (string, optional) – 数据集的分割,支持
"train"(默认),“val” 和"test"。transform (callable, optional) – 一个函数/变换,接收一个PIL图像并返回一个变换后的版本。例如,
transforms.RandomCrop。target_transform (callable, optional) – 一个函数/变换,它接收目标并对其进行变换。
下载 (bool, 可选) – 如果为True,则从互联网下载数据集并将其放置在根目录中。如果数据集已经下载,则不会再次下载。默认值为False。
- Special-members: