获取数据集
- get_dataset(*, dataset: None | str | Path | Dataset | type[Dataset] = None, dataset_kwargs: Mapping[str, Any] | None = None, training: None | str | Path | CoreTriplesFactory = None, testing: None | str | Path | CoreTriplesFactory = None, validation: None | str | Path | CoreTriplesFactory = None) Dataset[源代码]
获取一个数据集,基于给定的kwargs进行缓存。
- Parameters:
dataset (None | str | Path | Dataset | type[Dataset]) – 数据集的名称、数据集的实例或数据集的类。
dataset_kwargs (Mapping[str, Any] | None) – 关键字参数,仅在将数据集类用于
dataset关键字参数时使用。训练 (无 | str | Path | CoreTriplesFactory) – 用于训练三元组的工厂或训练三元组文件的路径,如果
dataset=None测试 (无 | str | Path | CoreTriplesFactory) – 用于测试三元组的工厂或测试三元组文件的路径,如果
dataset=None验证 (无 | str | Path | CoreTriplesFactory) – 用于验证三元组的工厂或验证三元组文件的路径 如果
dataset=None
- Returns:
一个实例化的数据集
- Raises:
ValueError – 函数输入使用不正确时抛出
TypeError – 如果为
dataset指定了一个类型,但它不是pykeen.datasets.Dataset的子类
- Return type: