单标签数据集
- class SingleTabbedDataset(url: str, name: str | None = None, cache_root: str | None = None, eager: bool = False, create_inverse_triples: bool = False, random_state: None | int | Generator = None, download_kwargs: dict[str, Any] | None = None, read_csv_kwargs: dict[str, Any] | None = None)[source]
基础类:
TabbedDataset这个类适用于当你有一个单独的TSV边缘文件并希望它们自动分割时。
初始化数据集。
- Parameters:
url (str) – 下载数据集的URL地址
name (str | None) – 文件的名称。如果未提供,则尝试从URL的末尾获取名称
cache_root (Path) – 一个可选的目录,用于存储提取的文件。如果没有给出,则使用默认的PyKEEN目录。 这是由环境变量
PYKEEN_HOME定义的,或者默认为~/.pykeen。eager (bool) – 数据是否应该立即加载?默认为 false。
create_inverse_triples (bool) – 是否应该创建反向三元组?默认为 false。
random_state (TorchRandomHint) – 一个可选的随机状态,用于使训练/测试/验证分割可重复。
download_kwargs (dict[str, Any] | None) – 传递给
pystow.utils.download()的关键字参数。read_csv_kwargs (dict[str, Any] | None) – 传递给
pandas.read_csv()的关键字参数。
- Raises:
ValueError – 如果没有指定URL并且在计算路径上没有数据
属性摘要
属性文档