单标签数据集

class SingleTabbedDataset(url: str, name: str | None = None, cache_root: str | None = None, eager: bool = False, create_inverse_triples: bool = False, random_state: None | int | Generator = None, download_kwargs: dict[str, Any] | None = None, read_csv_kwargs: dict[str, Any] | None = None)[source]

基础类:TabbedDataset

这个类适用于当你有一个单独的TSV边缘文件并希望它们自动分割时。

初始化数据集。

Parameters:
  • url (str) – 下载数据集的URL地址

  • name (str | None) – 文件的名称。如果未提供,则尝试从URL的末尾获取名称

  • cache_root (Path) – 一个可选的目录,用于存储提取的文件。如果没有给出,则使用默认的PyKEEN目录。 这是由环境变量PYKEEN_HOME定义的,或者默认为~/.pykeen

  • eager (bool) – 数据是否应该立即加载?默认为 false。

  • create_inverse_triples (bool) – 是否应该创建反向三元组?默认为 false。

  • random_state (TorchRandomHint) – 一个可选的随机状态,用于使训练/测试/验证分割可重复。

  • download_kwargs (dict[str, Any] | None) – 传递给 pystow.utils.download() 的关键字参数。

  • read_csv_kwargs (dict[str, Any] | None) – 传递给 pandas.read_csv() 的关键字参数。

Raises:

ValueError – 如果没有指定URL并且在计算路径上没有数据

属性摘要

ratios

属性文档

ratios: ClassVar[Sequence[float]] = (0.8, 0.1, 0.1)