torch_geometric.datasets.GDELTLite

class GDELTLite(root: str, transform: Optional[Callable] = None, pre_transform: Optional[Callable] = None, force_reload: bool = False)[source]

Bases: InMemoryDataset

“我们真的需要复杂的时间网络模型架构吗?”论文中使用的全球事件、语言和语调数据库(GDELT)数据集的(简化)版本,包含从2016年到2020年收集的事件。

每个节点(参与者)持有一个413维的多热特征向量,表示附加到相应参与者到服务器的CAMEO代码。

每条边(事件)包含一个时间戳和一个186维的多热向量,表示附加到相应事件的CAMEO代码以发送到服务器。

Parameters:
  • root (str) – Root directory where the dataset should be saved.

  • transform (callable, optional) – A function/transform that takes in an torch_geometric.data.Data object and returns a transformed version. The data object will be transformed before every access. (default: None)

  • pre_transform (callable, optional) – A function/transform that takes in an torch_geometric.data.Data object and returns a transformed version. The data object will be transformed before being saved to disk. (default: None)

  • force_reload (bool, optional) – Whether to re-process the dataset. (default: False)

统计:

#节点

#edges

#特性

#classes

8,831

1,912,909

413