PackedZipRemoteDataset

class PackedZipRemoteDataset(relative_training_path: str | PurePath, relative_testing_path: str | PurePath, relative_validation_path: str | PurePath, url: str | None = None, name: str | None = None, cache_root: str | None = None, eager: bool = False, create_inverse_triples: bool = False)[来源]

基础类:LazyDataset

包含对远程数据集的惰性引用,仅在需要时加载。

初始化数据集。

Parameters:
  • relative_training_path (str | pathlib.PurePath) – zip文件中训练数据的路径

  • relative_testing_path (str | pathlib.PurePath) – zip文件中测试数据的路径

  • relative_validation_path (str | pathlib.PurePath) – zip文件中验证数据的路径

  • url (str | None) – 下载数据集的URL地址

  • name (str | None) – 文件的名称。如果未提供,则尝试从URL的末尾获取名称

  • cache_root (Path) – 一个可选的目录,用于存储提取的文件。如果没有给出,则使用默认的PyKEEN目录。 这是由环境变量PYKEEN_HOME定义的,或者默认为~/.pykeen

  • eager (bool) – 数据是否应该立即加载?默认为 false。

  • create_inverse_triples (bool) – 是否应该创建反向三元组?默认为 false。

Raises:

ValueError – 如果没有指定URL并且在计算路径上没有数据

属性摘要

head_column

header

relation_column

sep

tail_column

属性文档

head_column: int = 0
header = None
relation_column: int = 1
sep = '\t'
tail_column: int = 2