内置数据集

class dgl.graphbolt.BuiltinDataset(name: str, root: str = 'datasets')[source]

基础类:OnDiskDataset

一个实用类,用于从AWS S3下载内置数据集并将其加载为 OnDiskDataset

可用的内置数据集包括:

cora

cora数据集是一个同质引用网络数据集,专为节点分类任务设计。

ogbn-mag

ogbn-mag数据集是由微软学术图谱(MAG)的一个子集组成的异质网络。更多详情请参见ogbn-mag

注意

反向边被添加到原始图中,并且重复的边被移除。

ogbl-citation2

ogbl-citation2 数据集是一个有向图,表示从 MAG 中提取的一部分论文之间的引用网络。更多详情请参见 ogbl-citation2

注意

反向边被添加到原始图中,并且重复的边被移除。

ogbn-arxiv

ogbn-arxiv 数据集是一个有向图,表示由 MAG 索引的所有计算机科学 (CS) arXiv 论文之间的引用网络。更多详情请参见 ogbn-arxiv

注意

反向边被添加到原始图中,并且重复的边被移除。

ogbn-papers100M

ogbn-papers100M 数据集是一个有向图,表示由 MAG 索引的所有计算机科学 (CS) arXiv 论文之间的引用网络。更多详情请参见 ogbn-papers100M

注意

反向边被添加到原始图中,并且重复的边被移除。

ogbn-products

ogbn-products 数据集是一个无向且无权的图,表示亚马逊产品共同购买网络。更多详细信息请参见 ogbn-products

注意

反向边被添加到原始图中。 节点特征存储为float32。

ogb-lsc-mag240m

ogb-lsc-mag240m 数据集是从微软学术图谱(MAG)中提取的异质学术图。更多详情请参见 ogb-lsc-mag240m

注意

反向边被添加到原始图中。

Parameters:
  • name (str) – 内置数据集的名称。

  • root (str, optional) – 数据集的根目录。默认为 datasets