单标签数据集

class SingleTabbedDataset(url: str, name: str | None = None, cache_root: str | None = None, eager: bool = False, create_inverse_triples: bool = False, random_state: None | int | Generator = None, download_kwargs: dict[str, Any] | None = None, read_csv_kwargs: dict[str, Any] | None = None)[source]

这个类适用于当你有一个单独的TSV边缘文件并希望它们自动分割时。

初始化数据集。

Parameters:

url (str) – 下载数据集的URL地址
name (str | None) – 文件的名称。如果未提供，则尝试从URL的末尾获取名称
cache_root (Path) – 一个可选的目录，用于存储提取的文件。如果没有给出，则使用默认的PyKEEN目录。这是由环境变量PYKEEN_HOME定义的，或者默认为~/.pykeen。
eager (bool) – 数据是否应该立即加载？默认为 false。
create_inverse_triples (bool) – 是否应该创建反向三元组？默认为 false。
random_state (TorchRandomHint) – 一个可选的随机状态，用于使训练/测试/验证分割可重复。
download_kwargs (dict[str, Any] | None) – 传递给 pystow.utils.download() 的关键字参数。
read_csv_kwargs (dict[str, Any] | None) – 传递给 pandas.read_csv() 的关键字参数。

Raises:

ValueError – 如果没有指定URL并且在计算路径上没有数据

属性摘要

属性文档