TabularPredictor.predict_proba_multi

TabularPredictor.predict_proba_multi(data: DataFrame = None, models: List[str] = None, as_pandas: bool = True, as_multiclass: bool = True, transform_features: bool = True, inverse_transform: bool = True) dict[str, DataFrame] | dict[str, Series] | dict[str, ndarray][source]

返回一个预测概率的字典,其中键是模型名称,值是模型对数据的预测概率。

等效输出为: ``` predict_proba_dict = {} for m in models:

predict_proba_dict[m] = predictor.predict_proba(data, model=m)

```

请注意,这通常比单独为每个模型调用 TabularPredictor.predict_proba() 要快得多,因为此方法利用模型依赖图来避免冗余计算。

Parameters:
  • data (strDataFrame, 默认 = None) –

    用于预测的数据。 如果为None:

    如果self.has_val,则使用验证数据。 否则,跳过预测并返回折叠外(OOF)预测概率,相当于: ``` predict_proba_dict = {} for m in models:

    predict_proba_dict[m] = predictor.predict_proba_oof(model=m)

    ```

  • models (List[str], default = None) – The list of models to get predictions for. If None, all models that can infer are used.

  • as_pandas (bool, default = True) – 是否将每个模型的输出作为pandas对象(True)或numpy数组(False)返回。 如果这是一个多类问题或as_multiclass=True,则pandas对象是pd.DataFrame,否则是pd.Series。 如果输出是pd.DataFrame,列顺序将等同于predictor.classes_

  • as_multiclass (bool, default = True) –

    是否将二分类概率返回为多分类概率。

    输出将包含两列,如果 as_pandas=True,列名将对应于二分类标签。 列的顺序将与 predictor.class_labels 相同。

    如果为 False,输出将仅包含一列,表示正类(通过 predictor.positive_class 获取正类名称)。 仅影响二分类问题的输出。

  • transform_features (bool, default = True) –

    If True, preprocesses data before predicting with models. If False, skips global feature preprocessing.

    This is useful to save on inference time if you have already called data = predictor.transform_features(data).

  • inverse_transform (bool, default = True) – 如果为True,将返回原始格式的预测概率。 如果为False(高级),将返回AutoGluon内部格式的预测概率。

Returns:

以模型名称为键,模型预测概率为值的字典。

Return type:

字典