CoraGraphDataset
- class dgl.data.CoraGraphDataset(raw_dir=None, force_reload=False, verbose=True, reverse_edge=True, transform=None, reorder=False)[source]
基础类:
CitationGraphDataset
Cora引用网络数据集。
节点代表论文,边代表引用关系。每个节点都有一个预定义的1433维特征。该数据集是为节点分类任务设计的。任务是预测某篇论文的类别。
统计:
节点数:2708
边数: 10556
班级数量:7
标签分割:
训练:140
有效: 500
测试: 1000
- Parameters:
raw_dir (str) – 用于下载/包含输入数据目录的原始文件目录。 默认值:~/.dgl/
force_reload (bool) – Whether to reload the dataset. Default: False
verbose (bool) – Whether to print out progress information. Default: True.
reverse_edge (bool) – 是否在图中添加反向边。默认值:True。
transform (callable, optional) – A transform that takes in a
DGLGraph
object and returns a transformed version. TheDGLGraph
object will be transformed before every access.reorder (bool) – 是否使用
reorder_graph()
重新排序图。默认值:False。
注释
节点特征是行归一化的。
示例
>>> dataset = CoraGraphDataset() >>> g = dataset[0] >>> num_class = dataset.num_classes >>> >>> # get node feature >>> feat = g.ndata['feat'] >>> >>> # get data split >>> train_mask = g.ndata['train_mask'] >>> val_mask = g.ndata['val_mask'] >>> test_mask = g.ndata['test_mask'] >>> >>> # get labels >>> label = g.ndata['label']