TabularPredictor.predict_from_proba

TabularPredictor.predict_from_proba(y_pred_proba: pd.DataFrame | np.ndarray, decision_threshold: float | None = None) pd.Series | np.array[source]

给定预测概率,转换为预测结果。

Parameters:
  • y_pred_proba (pd.DataFramenp.ndarray) – 要转换为预测的预测概率。 可通过 predictor.predict_proba 的输出获得。

  • decision_threshold (float, default = None) – 用于将预测概率转换为预测的决策阈值。 仅适用于二分类问题,否则忽略。 如果为None,则默认为predictor.decision_threshold。 有效值范围为[0.0, 1.0]。 您可以通过首先调用predictor.calibrate_decision_threshold()来获得优化的decision_threshold。 对于诸如balanced_accuracyf1等指标,设置此值非常有用,因为0.5通常不是最佳阈值。 正类的预测通过以下逻辑计算:1 if pred > decision_threshold else 0

Return type:

预测数组,每个数组对应给定数据集中的每一行。根据y_pred_proba的数据类型,可能是np.ndarraypd.Series

示例

>>> from autogluon.tabular import TabularPredictor
>>> predictor = TabularPredictor(label='class').fit('train.csv', label='class')
>>> y_pred_proba = predictor.predict_proba('test.csv')
>>>
>>> # y_pred and y_pred_from_proba are identical
>>> y_pred = predictor.predict('test.csv')
>>> y_pred_from_proba = predictor.predict_from_proba(y_pred_proba=y_pred_proba)