load_and_run_classification_experiment#

load_and_run_classification_experiment(problem_path, results_path, dataset, classifier, resample_id=0, cls_name=None, overwrite=False, build_train=False, predefined_resample=False)[源代码][源代码]#

加载数据集并运行分类实验。

运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件,如果需要,还可以写入 trainFold<resampleID>.csv。

参数:
问题路径str

问题文件的位置,完整路径。

results_pathstr

写入结果的位置。任何需要的目录将被创建。

数据集str

问题名称。文件必须位于 <problem_path>/<dataset>/<dataset>+”_TRAIN.ts”,”_TEST” 同理。

分类器BaseClassifier

实验中使用的分类器,如果没有提供,则使用 cls_name 选择一个,并使用 resample_id 作为种子。

cls_namestr, 默认 = None

用于编写结果的分类器名称。如果没有指定,名称将从分类器中获取。

resample_idint, 默认值=0

重采样的种子。如果设置为0,则使用文件中的默认训练/测试分割。也用于输出文件名。

覆盖bool, 默认=False

如果设置为 False,只有在没有结果文件的情况下才会构建结果。如果设置为 True,则会覆盖已有的任何内容。

build_trainbool, 默认=False

是否生成训练文件。如果为真,它对训练数据执行10折交叉验证并保存。如果分类器可以生成自己的估计,则使用这些估计。

预定义的重采样bool, 默认=False

从文件中读取预定义的重采样,而不是执行重采样。如果为True,文件格式必须在数据集名称的末尾包含resample_id,即<problem_path>/<dataset>/<dataset>+<resample_id>+”_TRAIN.ts”。