TarFileRemoteDataset
- class TarFileRemoteDataset(url: str, relative_training_path: str | PurePath, relative_testing_path: str | PurePath, relative_validation_path: str | PurePath, cache_root: str | None = None, eager: bool = False, create_inverse_triples: bool = False, timeout=None)[source]
基础类:
RemoteDataset一个以tar文件形式存储的远程数据集。
初始化数据集。
- Parameters:
url (str) – 下载数据集的URL地址。
relative_training_path (str | pathlib.PurePath) – 训练路径在缓存根目录内被提取的路径
relative_testing_path (str | pathlib.PurePath) – 测试路径在缓存根目录中被提取的路径
relative_validation_path (str | pathlib.PurePath) – 缓存根目录中提取验证路径的路径
cache_root (Path) – 一个可选的目录,用于存储提取的文件。如果没有给出,则使用默认的PyKEEN目录。 这由环境变量
PYKEEN_HOME定义,或默认为~/.data/pykeen。eager (bool) – 数据是否应该立即加载?默认为 false。
create_inverse_triples (bool) – 是否应该创建反向三元组?默认为 false。
timeout – 等待下载数据集的超时秒数。默认为60。