解压的远程数据集
- class UnpackedRemoteDataset(training_url: str, testing_url: str, validation_url: str, cache_root: str | None = None, force: bool = False, eager: bool = False, create_inverse_triples: bool = False, load_triples_kwargs: Mapping[str, Any] | None = None, download_kwargs: Mapping[str, Any] | None = None)[来源]
基础类:
PathDataset一个包含训练、测试和验证集作为URL的数据集。
初始化数据集。
- Parameters:
training_url (str) – 训练文件的URL
testing_url (str) – 测试文件的URL
validation_url (str) – 验证文件的URL
cache_root (Path) – 一个可选的目录,用于存储提取的文件。如果没有给出,则使用默认的PyKEEN目录。 这由环境变量
PYKEEN_HOME定义,或默认为~/.data/pykeen。force (bool) – 如果为真,重新下载任何缓存的文件
eager (bool) – 数据是否应该立即加载?默认为 false。
create_inverse_triples (bool) – 是否应该创建反向三元组?默认为 false。
load_triples_kwargs (Mapping[str, Any] | None) – 传递给
TriplesFactory.from_path()并最终传递给pykeen.triples.utils.load_triples()的参数。download_kwargs (Mapping[str, Any] | None) – 传递给
pystow.utils.download()的关键字参数