GDELT数据集
- class dgl.data.GDELTDataset(mode='train', raw_dir=None, force_reload=False, verbose=False, transform=None)[source]
Bases:
DGLBuiltinDataset
基于事件的时间图的GDELT数据集
全球事件、语言和语调数据库(GDELT)数据集。 这包含了世界各地发生的事件(例如,在俄罗斯任何地方举行的每一次抗议活动在给定的一天内被合并为一个条目)。 该数据集包含从2018年1月1日到2018年1月31日收集的事件(15分钟的时间粒度)。
参考:
统计:
训练示例:2,304
有效示例:288
测试示例:384
- Parameters:
mode (str) – 必须是以下之一(‘train’, ‘valid’, ‘test’)。默认值:’train’
raw_dir (str) – Raw file directory to download/contains the input data directory. Default: ~/.dgl/
force_reload (bool) – Whether to reload the dataset. Default: False
verbose (bool) – Whether to print out progress information. Default: True.
transform (callable, optional) – A transform that takes in a
DGLGraph
object and returns a transformed version. TheDGLGraph
object will be transformed before every access.
示例
>>> # get train, valid, test dataset >>> train_data = GDELTDataset() >>> valid_data = GDELTDataset(mode='valid') >>> test_data = GDELTDataset(mode='test') >>> >>> # length of train set >>> train_size = len(train_data) >>> >>> for g in train_data: .... e_feat = g.edata['rel_type'] .... # your code here .... >>>