Shortcuts

RenderedSST2

class torchvision.datasets.RenderedSST2(root: Union[str, Path], split: str = 'train', transform: Optional[Callable] = None, target_transform: Optional[Callable] = None, download: bool = False)[source]

The Rendered SST2 Dataset.

Rendered SST2 是一个用于评估模型在光学字符识别能力上的图像分类数据集。该数据集是通过渲染 Standford Sentiment Treebank v2 数据集中的句子生成的。

该数据集包含两个类别(正类和负类),并分为三个部分:一个训练部分包含6920张图像(3610张正类和3310张负类),一个验证部分包含872张图像(444张正类和428张负类),以及一个测试部分包含1821张图像(909张正类和912张负类)。

Parameters:
  • root (str 或 pathlib.Path) – 数据集的根目录。

  • split (string, optional) – 数据集的分割,支持 "train"(默认),“val”"test"

  • transform (callable, optional) – 一个函数/变换,接收一个PIL图像并返回一个变换后的版本。例如,transforms.RandomCrop

  • target_transform (callable, optional) – 一个函数/变换,它接收目标并对其进行变换。

  • 下载 (bool, 可选) – 如果为True,则从互联网下载数据集并将其放置在根目录中。如果数据集已经下载,则不会再次下载。默认值为False。

Special-members:

__getitem__(idx: int) Tuple[Any, Any][source]
Parameters:

index (int) – 索引

Returns:

样本和元数据,可选择通过各自的转换进行转换。

Return type:

(任何)