RenderedSST2¶

class torchvision.datasets.RenderedSST2(root: Union[str, Path], split: str = 'train', transform: Optional[Callable] = None, target_transform: Optional[Callable] = None, download: bool = False)[source]¶

Rendered SST2 是一个用于评估模型在光学字符识别能力上的图像分类数据集。该数据集是通过渲染 Standford Sentiment Treebank v2 数据集中的句子生成的。

该数据集包含两个类别（正类和负类），并分为三个部分：一个训练部分包含6920张图像（3610张正类和3310张负类），一个验证部分包含872张图像（444张正类和428张负类），以及一个测试部分包含1821张图像（909张正类和912张负类）。

Parameters:

root (str 或 pathlib.Path) – 数据集的根目录。
split (string, optional) – 数据集的分割，支持 "train"（默认），“val” 和 "test"。
transform (callable, optional) – 一个函数/变换，接收一个PIL图像并返回一个变换后的版本。例如，transforms.RandomCrop。
target_transform (callable, optional) – 一个函数/变换，它接收目标并对其进行变换。
下载 (bool, 可选) – 如果为True，则从互联网下载数据集并将其放置在根目录中。如果数据集已经下载，则不会再次下载。默认值为False。

__getitem__(idx: int) → Tuple[Any, Any][source]¶