TarFileRemoteDataset

class TarFileRemoteDataset(url: str, relative_training_path: str | PurePath, relative_testing_path: str | PurePath, relative_validation_path: str | PurePath, cache_root: str | None = None, eager: bool = False, create_inverse_triples: bool = False, timeout=None)[source]

基础类:RemoteDataset

一个以tar文件形式存储的远程数据集。

初始化数据集。

Parameters:
  • url (str) – 下载数据集的URL地址。

  • relative_training_path (str | pathlib.PurePath) – 训练路径在缓存根目录内被提取的路径

  • relative_testing_path (str | pathlib.PurePath) – 测试路径在缓存根目录中被提取的路径

  • relative_validation_path (str | pathlib.PurePath) – 缓存根目录中提取验证路径的路径

  • cache_root (Path) – 一个可选的目录,用于存储提取的文件。如果没有给出,则使用默认的PyKEEN目录。 这由环境变量 PYKEEN_HOME 定义,或默认为 ~/.data/pykeen

  • eager (bool) – 数据是否应该立即加载?默认为 false。

  • create_inverse_triples (bool) – 是否应该创建反向三元组?默认为 false。

  • timeout – 等待下载数据集的超时秒数。默认为60。