Shortcuts

PCAM

class torchvision.datasets.PCAM(root: Union[str, Path], split: str = 'train', transform: Optional[Callable] = None, target_transform: Optional[Callable] = None, download: bool = False)[source]

PCAM Dataset.

PatchCamelyon数据集是一个二元分类数据集,包含327,680张彩色图像(96px x 96px),这些图像是从淋巴结切片的组织病理学扫描中提取的。每张图像都标注有一个二元标签,指示是否存在转移组织。

此数据集需要h5py包,您可以使用pip install h5py进行安装。

Parameters:
  • root (str 或 pathlib.Path) – 数据集的根目录。

  • split (string, optional) – 数据集的分割,支持 "train"(默认),"test""val"

  • transform (callable, optional) – 一个函数/变换,接收一个PIL图像并返回一个变换后的版本。例如,transforms.RandomCrop

  • target_transform (callable, optional) – 一个函数/变换,它接收目标并对其进行变换。

  • 下载 (bool, 可选) –

    如果为True,则从互联网下载数据集并将其放入root/pcam。如果数据集已经下载,则不会再次下载。

    警告

    下载数据集需要gdown

Special-members:

__getitem__(idx: int) Tuple[Any, Any][source]
Parameters:

index (int) – 索引

Returns:

样本和元数据,可选择通过各自的转换进行转换。

Return type:

(任何)