load_and_run_classification_experiment#
- load_and_run_classification_experiment(problem_path, results_path, dataset, classifier, resample_id=0, cls_name=None, overwrite=False, build_train=False, predefined_resample=False)[源代码][源代码]#
加载数据集并运行分类实验。
运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件,如果需要,还可以写入 trainFold<resampleID>.csv。
- 参数:
- 问题路径str
问题文件的位置,完整路径。
- results_pathstr
写入结果的位置。任何需要的目录将被创建。
- 数据集str
问题名称。文件必须位于 <problem_path>/<dataset>/<dataset>+”_TRAIN.ts”,”_TEST” 同理。
- 分类器BaseClassifier
实验中使用的分类器,如果没有提供,则使用 cls_name 选择一个,并使用 resample_id 作为种子。
- cls_namestr, 默认 = None
用于编写结果的分类器名称。如果没有指定,名称将从分类器中获取。
- resample_idint, 默认值=0
重采样的种子。如果设置为0,则使用文件中的默认训练/测试分割。也用于输出文件名。
- 覆盖bool, 默认=False
如果设置为 False,只有在没有结果文件的情况下才会构建结果。如果设置为 True,则会覆盖已有的任何内容。
- build_trainbool, 默认=False
是否生成训练文件。如果为真,它对训练数据执行10折交叉验证并保存。如果分类器可以生成自己的估计,则使用这些估计。
- 预定义的重采样bool, 默认=False
从文件中读取预定义的重采样,而不是执行重采样。如果为True,文件格式必须在数据集名称的末尾包含resample_id,即<problem_path>/<dataset>/<dataset>+<resample_id>+”_TRAIN.ts”。