数据集

class dgl.graphbolt.Dataset[source]

Bases: object

一个抽象的数据集,提供了访问训练所需数据的抽象。

数据抽象可以是本机CPU内存块、共享内存块、磁盘上已打开文件的文件句柄、提供访问数据API的服务等。数据集中有3个主要组件:

  • Task

    一个任务由多个元信息和训练/验证/测试集组成。一个数据集可以有多个任务。

  • Feature Storage

    一个存储节点/边/图特征的键值存储。

  • Graph Topology

    子图采样算法使用图拓扑来生成子图。

property all_nodes_set: ItemSet | ItemSetDict

返回包含所有节点的项目集。

property dataset_name: str

返回数据集名称。

property feature: FeatureStore

返回特征。

property graph: SamplingGraph

返回图表。

property tasks: List[Task]

返回任务。