torch_geometric.datasets.UPFD
- class UPFD(root: str, name: str, feature: str, split: str = 'train', transform: Optional[Callable] = None, pre_transform: Optional[Callable] = None, pre_filter: Optional[Callable] = None, force_reload: bool = False)[source]
Bases:
InMemoryDataset来自“用户偏好感知的假新闻检测”论文的树结构假新闻传播图分类数据集。 它包括从Twitter提取的两组树结构假新闻和真实新闻传播图。 对于单个图,根节点代表源新闻,叶节点代表转发了相同根新闻的Twitter用户。 当且仅当用户直接转发了根新闻时,用户节点与新闻节点之间有一条边。 当且仅当一个用户从另一个用户转发了根新闻时,两个用户节点之间有一条边。 使用不同的编码器编码了四种不同的节点特征。 更多详情请参考GNN-FakeNews仓库。
注意
有关使用UPFD的示例,请参见examples/upfd.py。
- Parameters:
root (str) – Root directory where the dataset should be saved.
name (str) – 图集的名称 (
"politifact","gossipcop").特征 (str) – 节点特征类型 (
"profile","spacy","bert","content"). 如果设置为"profile", 10维节点特征 由十个Twitter用户资料属性组成。 如果设置为"spacy", 300维节点特征由 spaCy word2vec编码器编码的Twitter用户历史推文组成。 如果设置为"bert", 768维节点特征由 bert-as-service编码的Twitter用户历史推文组成。 如果设置为"content", 310维节点特征由 300维的“spacy”向量加上10维的“profile”向量组成。split (str, optional) – If
"train", loads the training dataset. If"val", loads the validation dataset. If"test", loads the test dataset. (default:"train")transform (callable, optional) – A function/transform that takes in an
torch_geometric.data.Dataobject and returns a transformed version. The data object will be transformed before every access. (default:None)pre_transform (callable, optional) – A function/transform that takes in an
torch_geometric.data.Dataobject and returns a transformed version. The data object will be transformed before being saved to disk. (default:None)pre_filter (callable, optional) – A function that takes in an
torch_geometric.data.Dataobject and returns a boolean value, indicating whether the data object should be included in the final dataset. (default:None)force_reload (bool, optional) – Whether to re-process the dataset. (default:
False)