压缩单数据集

class CompressedSingleDataset(url: str, relative_path: str | PurePosixPath, name: str | None = None, cache_root: str | None = None, eager: bool = False, create_inverse_triples: bool = False, delimiter: str | None = None, random_state: None | int | Generator = None, read_csv_kwargs: dict[str, Any] | None = None)[源代码]

基础类:LazyDataset

加载一个位于存档内的单个文件的数据集。

初始化数据集。

Parameters:
  • url (str) – 下载数据集的URL地址

  • relative_path (str | pathlib.PurePosixPath) – 存档中到包含数据集的路径。

  • name (str | None) – 文件的名称。如果未提供,则尝试从URL的末尾获取名称

  • cache_root (Path) – 一个可选的目录,用于存储提取的文件。如果没有给出,则使用默认的PyKEEN目录。 这是由环境变量PYKEEN_HOME定义的,或者默认为~/.pykeen

  • create_inverse_triples (bool) – 是否应该创建反向三元组?默认为 false。

  • eager (bool) – 数据是否应该立即加载?默认为 false。

  • random_state (TorchRandomHint) – 一个可选的随机状态,用于使训练/测试/验证分割可重复。

  • delimiter (str | None) – 包含数据集的分隔符。

  • read_csv_kwargs (dict[str, Any] | None) – 传递给 pandas.read_csv() 的关键字参数。

属性摘要

ratios

属性文档

ratios = (0.8, 0.1, 0.1)