torch_geometric.datasets.DBLP

class DBLP(root: str, transform: Optional[Callable] = None, pre_transform: Optional[Callable] = None, force_reload: bool = False)[source]

Bases: InMemoryDataset

DBLP计算机科学书目网站的一个子集,如“MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding”论文中所收集的。 DBLP是一个包含四种类型实体的异构图 - 作者(4,057个节点)、论文(14,328个节点)、术语(7,723个节点)和会议(20个节点)。 作者被分为四个研究领域(数据库、数据挖掘、人工智能、信息检索)。 每个作者通过其论文关键词的词袋表示来描述。

Parameters:
  • root (str) – Root directory where the dataset should be saved.

  • transform (callable, optional) – A function/transform that takes in an torch_geometric.data.HeteroData object and returns a transformed version. The data object will be transformed before every access. (default: None)

  • pre_transform (callable, optional) – A function/transform that takes in an torch_geometric.data.HeteroData object and returns a transformed version. The data object will be transformed before being saved to disk. (default: None)

  • force_reload (bool, optional) – Whether to re-process the dataset. (default: False)

统计:

节点/边类型

#节点/#边

#特性

#classes

作者

4,057

334

4

论文

14,328

4,231

术语

7,723

50

会议

20

0

作者-论文

196,425

论文术语

85,810

会议论文

14,328