torch_geometric.datasets.AQSOL
- class AQSOL(root: str, split: str = 'train', transform: Optional[Callable] = None, pre_transform: Optional[Callable] = None, pre_filter: Optional[Callable] = None, force_reload: bool = False)[source]
Bases:
InMemoryDataset来自基准测试图神经网络论文的AQSOL数据集基于 AqSolDB,一个 标准化的数据库,包含9,982个分子图及其水溶性值,这些数据来自9个不同的数据源。
水溶性目标是从实验测量中收集的,并在AqSolDB中标准化为LogS单位。这些最终值表示在
AQSOL数据集中回归的属性。在过滤掉一些没有键/边的图后,分子图的总数为9,833。对于每个分子图,节点特征是重原子的类型,边特征是它们之间的键类型,类似于ZINC数据集中的情况。- Parameters:
root (
str) – Root directory where the dataset should be saved.split (
str, 默认:'train') – 如果"train", 加载训练数据集。 如果"val", 加载验证数据集。 如果"test", 加载测试数据集。transform (
Optional[Callable], default:None) – A function/transform that takes in atorch_geometric.data.Dataobject and returns a transformed version. The data object will be transformed before every access.pre_transform (
Optional[Callable], default:None) – A function/transform that takes in atorch_geometric.data.Dataobject and returns a transformed version. The data object will be transformed before being saved to disk.pre_filter (可调用的, 可选的) – 一个函数,它接收一个
torch_geometric.data.Data对象并返回一个布尔值,表示该数据对象是否应包含在最终数据集中。force_reload (
bool, default:False) – Whether to re-process the dataset.
统计:
#图表
#节点
#edges
#特性
#classes
9,833
~17.6
~35.8
1
1