🆕 dgl.graphbolt

dgl.graphbolt 是一个用于GNN的数据加载框架,它为数据管道的每个阶段提供了定义良好的API和多种标准实现。

Dataset

数据集是图结构数据、特征数据和任务的集合。

数据集

一个抽象的数据集,提供了访问训练所需数据的抽象。

OnDiskDataset

一个从磁盘读取图拓扑、特征数据和训练/验证/测试集的磁盘数据集。

BuiltinDataset

一个实用类,用于从AWS S3下载内置数据集并将其加载为OnDiskDataset

LegacyDataset

一个用于传统DGLDataset的Graphbolt数据集。

Task

一个抽象任务,由元信息和训练/验证/测试集组成。

图表

图是节点和边的集合。它可以是同构图或异构图。

SamplingGraph

用于采样图的类。

FusedCSCSamplingGraph

CSC格式的采样图。

特征与特征存储

特征是一组数据(张量、数组)。特征存储是特征的集合。

Feature

用于访问的特征数据的包装器。

FeatureStore

一个用于管理多个访问功能的存储。

BasicFeatureStore

一个基本的功能存储,用于管理多个功能以供访问。

TorchBasedFeature

一个基于pytorch的特征包装器。

TorchBasedFeatureStore

一个用于管理多个基于pytorch的功能以供访问的存储。

GPUCachedFeature

GPU缓存的特性包装了一个备用特性。

DataLoader

数据加载器用于遍历数据集并生成小批量数据。

DataLoader

多进程数据加载器。

ItemSet

一个项目集是一个可迭代的项目集合。

ItemSet

张量或张量元组的包装器。

ItemSetDict

Dictionary wrapper of ItemSet.

ItemSampler

项目采样器用于从项目集中采样项目。

ItemSampler

一个用于遍历输入项并创建子集的采样器。

DistributedItemSampler

一个采样器,用于迭代输入项并分布式创建子集。

MiniBatch

小批量是采样子图及其对应特征的集合。它是训练GNN模型的基本单位。

MiniBatch

用于graphbolt中数据结构的复合数据类。

MiniBatchTransformer

一个用于操作小批量数据的小批量转换器。

NegativeSampler

负采样器用于从小批量中采样负样本。

NegativeSampler

用于生成负样本并返回正负样本混合的负采样器。

UniformNegativeSampler

基于均匀分布为每个源节点采样负目标节点。

SubgraphSampler

子图采样器用于从图中采样子图。

SubgraphSampler

用于从较大图中的给定节点集中采样子图的子图采样器。

SampledSubgraph

一个用于采样子图的抽象类。

NeighborSampler

从图中采样邻居边并返回一个子图。

LayerNeighborSampler

从图中采样邻居边并返回子图。

SampledSubgraphImpl

CSCSamplingGraph的采样子图。

InSubgraphSampler

对给定节点的入边所诱导的子图进行采样。

FeatureFetcher

特征提取器用于从特征存储中提取特征。

FeatureFetcher

用于在graphbolt中获取节点/边的特征的特征提取器。

CopyTo

此数据管道用于将数据复制到设备。

CopyTo

将从前一个DataPipe生成的每个元素传输到给定设备的DataPipe。

实用工具

fused_csc_sampling_graph

从CSC表示创建一个FusedCSCSamplingGraph对象。

load_from_shared_memory

从共享内存加载一个FusedCSCSamplingGraph对象。

from_dglgraph

将DGLGraph转换为FusedCSCSamplingGraph。

etype_str_to_tuple

将规范的etype从字符串转换为元组。

etype_tuple_to_str

将规范的etype从元组转换为字符串。

isin

测试 elements 的每个元素是否在 test_elements 中。

seed

设置Graphbolt的随机种子。

index_select

返回一个新的张量,该张量使用索引中的条目沿维度dim对输入张量进行索引。

expand_indptr

将给定的indptr偏移张量转换为COO格式张量。

add_reverse_edges

此函数查找给定edges的反向边并返回它们的组合。

exclude_seed_edges

从迷你批次中的采样子图中排除种子边及其反向边。

compact_csc_format

将csc格式中的行(源)ID重新标记为从0开始的连续范围,并返回每种类型的原始行节点ID。

unique_and_compact

压缩节点张量列表。

unique_and_compact_csc_formats

紧凑的csc格式并返回唯一的节点(按类型)。