ZipSingleDataset
- class ZipSingleDataset(url: str, relative_path: str | PurePosixPath, name: str | None = None, cache_root: str | None = None, eager: bool = False, create_inverse_triples: bool = False, delimiter: str | None = None, random_state: None | int | Generator = None, read_csv_kwargs: dict[str, Any] | None = None)[source]
-
加载一个位于zip存档内的单个文件的数据集。
初始化数据集。
- Parameters:
url (str) – 下载数据集的URL地址
relative_path (str | pathlib.PurePosixPath) – 存档中到包含数据集的路径。
name (str | None) – 文件的名称。如果未提供,则尝试从URL的末尾获取名称
cache_root (Path) – 一个可选的目录,用于存储提取的文件。如果没有给出,则使用默认的PyKEEN目录。 这是由环境变量
PYKEEN_HOME定义的,或者默认为~/.pykeen。create_inverse_triples (bool) – 是否应该创建反向三元组?默认为 false。
eager (bool) – 数据是否应该立即加载?默认为 false。
random_state (TorchRandomHint) – 一个可选的随机状态,用于使训练/测试/验证分割可重复。
delimiter (str | None) – 包含数据集的分隔符。
read_csv_kwargs (dict[str, Any] | None) – 传递给
pandas.read_csv()的关键字参数。