torch_geometric.datasets.AQSOL

class AQSOL(root: str, split: str = 'train', transform: Optional[Callable] = None, pre_transform: Optional[Callable] = None, pre_filter: Optional[Callable] = None, force_reload: bool = False)[source]

Bases: InMemoryDataset

来自基准测试图神经网络论文的AQSOL数据集基于 AqSolDB,一个 标准化的数据库,包含9,982个分子图及其水溶性值,这些数据来自9个不同的数据源。

水溶性目标是从实验测量中收集的,并在AqSolDB中标准化为LogS单位。这些最终值表示在AQSOL数据集中回归的属性。在过滤掉一些没有键/边的图后,分子图的总数为9,833。对于每个分子图,节点特征是重原子的类型,边特征是它们之间的键类型,类似于ZINC数据集中的情况。

Parameters:
  • root (str) – Root directory where the dataset should be saved.

  • split (str, 默认: 'train') – 如果 "train", 加载训练数据集。 如果 "val", 加载验证数据集。 如果 "test", 加载测试数据集。

  • transform (Optional[Callable], default: None) – A function/transform that takes in a torch_geometric.data.Data object and returns a transformed version. The data object will be transformed before every access.

  • pre_transform (Optional[Callable], default: None) – A function/transform that takes in a torch_geometric.data.Data object and returns a transformed version. The data object will be transformed before being saved to disk.

  • pre_filter (可调用的, 可选的) – 一个函数,它接收一个 torch_geometric.data.Data 对象并返回一个布尔值,表示该数据对象是否应包含在最终数据集中。

  • force_reload (bool, default: False) – Whether to re-process the dataset.

统计:

#图表

#节点

#edges

#特性

#classes

9,833

~17.6

~35.8

1

1