torch_geometric.datasets.GDELTLite
- class GDELTLite(root: str, transform: Optional[Callable] = None, pre_transform: Optional[Callable] = None, force_reload: bool = False)[source]
Bases:
InMemoryDataset在“我们真的需要复杂的时间网络模型架构吗?”论文中使用的全球事件、语言和语调数据库(GDELT)数据集的(简化)版本,包含从2016年到2020年收集的事件。
每个节点(参与者)持有一个413维的多热特征向量,表示附加到相应参与者到服务器的CAMEO代码。
每条边(事件)包含一个时间戳和一个186维的多热向量,表示附加到相应事件的CAMEO代码以发送到服务器。
- Parameters:
root (str) – Root directory where the dataset should be saved.
transform (callable, optional) – A function/transform that takes in an
torch_geometric.data.Dataobject and returns a transformed version. The data object will be transformed before every access. (default:None)pre_transform (callable, optional) – A function/transform that takes in an
torch_geometric.data.Dataobject and returns a transformed version. The data object will be transformed before being saved to disk. (default:None)force_reload (bool, optional) – Whether to re-process the dataset. (default:
False)
统计:
#节点
#edges
#特性
#classes
8,831
1,912,909
413