PackedZipRemoteDataset
- class PackedZipRemoteDataset(relative_training_path: str | PurePath, relative_testing_path: str | PurePath, relative_validation_path: str | PurePath, url: str | None = None, name: str | None = None, cache_root: str | None = None, eager: bool = False, create_inverse_triples: bool = False)[来源]
基础类:
LazyDataset包含对远程数据集的惰性引用,仅在需要时加载。
初始化数据集。
- Parameters:
relative_training_path (str | pathlib.PurePath) – zip文件中训练数据的路径
relative_testing_path (str | pathlib.PurePath) – zip文件中测试数据的路径
relative_validation_path (str | pathlib.PurePath) – zip文件中验证数据的路径
url (str | None) – 下载数据集的URL地址
name (str | None) – 文件的名称。如果未提供,则尝试从URL的末尾获取名称
cache_root (Path) – 一个可选的目录,用于存储提取的文件。如果没有给出,则使用默认的PyKEEN目录。 这是由环境变量
PYKEEN_HOME定义的,或者默认为~/.pykeen。eager (bool) – 数据是否应该立即加载?默认为 false。
create_inverse_triples (bool) – 是否应该创建反向三元组?默认为 false。
- Raises:
ValueError – 如果没有指定URL并且在计算路径上没有数据
属性摘要
属性文档
- header = None
- sep = '\t'