load_and_run_classification_experiment#

load_and_run_classification_experiment(problem_path, results_path, dataset, classifier, resample_id=0, cls_name=None, overwrite=False, build_train=False, predefined_resample=False)[源代码][源代码]#

加载数据集并运行分类实验。

运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件，如果需要，还可以写入 trainFold<resampleID>.csv。

参数:

问题路径str: 问题文件的位置，完整路径。
results_pathstr: 写入结果的位置。任何需要的目录将被创建。
数据集str: 问题名称。文件必须位于 <problem_path>/<dataset>/<dataset>+”_TRAIN.ts”，”_TEST” 同理。
分类器BaseClassifier: 实验中使用的分类器，如果没有提供，则使用 cls_name 选择一个，并使用 resample_id 作为种子。
cls_namestr, 默认 = None: 用于编写结果的分类器名称。如果没有指定，名称将从分类器中获取。
resample_idint, 默认值=0: 重采样的种子。如果设置为0，则使用文件中的默认训练/测试分割。也用于输出文件名。
覆盖bool, 默认=False: 如果设置为 False，只有在没有结果文件的情况下才会构建结果。如果设置为 True，则会覆盖已有的任何内容。
build_trainbool, 默认=False: 是否生成训练文件。如果为真，它对训练数据执行10折交叉验证并保存。如果分类器可以生成自己的估计，则使用这些估计。
预定义的重采样bool, 默认=False: 从文件中读取预定义的重采样，而不是执行重采样。如果为True，文件格式必须在数据集名称的末尾包含resample_id，即<problem_path>/<dataset>/<dataset>+<resample_id>+”_TRAIN.ts”。