torch_geometric.data.Dataset
- class Dataset(root: Optional[str] = None, transform: Optional[Callable] = None, pre_transform: Optional[Callable] = None, pre_filter: Optional[Callable] = None, log: bool = True, force_reload: bool = False)[source]
基础类:
Dataset用于创建图数据集的数据集基类。 请参阅这里以获取相关教程。
- Parameters:
transform (callable, optional) – 一个函数/转换,它接受一个
Data或HeteroData对象并返回一个 转换后的版本。 数据对象将在每次访问之前进行转换。 (默认:None)pre_transform (callable, optional) – 一个函数/转换,它接收一个
Data或HeteroData对象并返回一个 转换后的版本。 数据对象将在保存到磁盘之前进行转换。 (默认:None)pre_filter (callable, optional) – 一个函数,接收一个
Data或HeteroData对象并返回一个 布尔值,表示该数据对象是否应包含在最终数据集中。(默认值:None)
- property processed_file_names: Union[str, List[str], Tuple[str, ...]]
必须存在于
self.processed_dir文件夹中的文件名,以便跳过处理。
- property num_features: int
返回数据集中每个节点的特征数量。
num_node_features的别名。- Return type:
- property has_download: bool
检查数据集是否定义了
download()方法。- Return type:
- index_select(idx: Union[slice, Tensor, ndarray, Sequence]) 数据集[source]
从指定的索引
idx创建数据集的子集。 索引idx可以是一个切片对象,例如[2:5],一个 列表,一个元组,或者一个torch.Tensor或np.ndarray类型 为 long 或 bool。- Return type:
- to_datapipe() Any[source]
将数据集转换为
torch.utils.data.DataPipe。返回的实例随后可以与PyG’s内置的
DataPipes一起使用,用于批处理图,如下所示:from torch_geometric.datasets import QM9 dp = QM9(root='./data/QM9/').to_datapipe() dp = dp.batch_graphs(batch_size=2, drop_last=True) for batch in dp: pass
请参阅PyTorch教程以获取更多关于DataPipes的背景信息。
- Return type: