TabularPredictor.predict_from_proba¶
- TabularPredictor.predict_from_proba(y_pred_proba: pd.DataFrame | np.ndarray, decision_threshold: float | None = None) pd.Series | np.array[source]¶
给定预测概率,转换为预测结果。
- Parameters:
y_pred_proba (
pd.DataFrame或np.ndarray) – 要转换为预测的预测概率。 可通过 predictor.predict_proba 的输出获得。decision_threshold (float, default = None) – 用于将预测概率转换为预测的决策阈值。 仅适用于二分类问题,否则忽略。 如果为None,则默认为predictor.decision_threshold。 有效值范围为[0.0, 1.0]。 您可以通过首先调用predictor.calibrate_decision_threshold()来获得优化的decision_threshold。 对于诸如balanced_accuracy和f1等指标,设置此值非常有用,因为0.5通常不是最佳阈值。 正类的预测通过以下逻辑计算:1 if pred > decision_threshold else 0
- Return type:
预测数组,每个数组对应给定数据集中的每一行。根据y_pred_proba的数据类型,可能是
np.ndarray或pd.Series。
示例
>>> from autogluon.tabular import TabularPredictor >>> predictor = TabularPredictor(label='class').fit('train.csv', label='class') >>> y_pred_proba = predictor.predict_proba('test.csv') >>> >>> # y_pred and y_pred_from_proba are identical >>> y_pred = predictor.predict('test.csv') >>> y_pred_from_proba = predictor.predict_from_proba(y_pred_proba=y_pred_proba)