TabularPredictor.predict_from_proba¶

TabularPredictor.predict_from_proba(y_pred_proba: pd.DataFrame | np.ndarray, decision_threshold: float | None = None) → pd.Series | np.array[source]¶

给定预测概率，转换为预测结果。

Parameters:

y_pred_proba (pd.DataFrame 或 np.ndarray) – 要转换为预测的预测概率。可通过 predictor.predict_proba 的输出获得。
decision_threshold (float, default = None) – 用于将预测概率转换为预测的决策阈值。仅适用于二分类问题，否则忽略。如果为None，则默认为predictor.decision_threshold。有效值范围为[0.0, 1.0]。您可以通过首先调用predictor.calibrate_decision_threshold()来获得优化的decision_threshold。对于诸如balanced_accuracy和f1等指标，设置此值非常有用，因为0.5通常不是最佳阈值。正类的预测通过以下逻辑计算：1 if pred > decision_threshold else 0

Return type:

预测数组，每个数组对应给定数据集中的每一行。根据y_pred_proba的数据类型，可能是np.ndarray或pd.Series。

示例

>>> from autogluon.tabular import TabularPredictor
>>> predictor = TabularPredictor(label='class').fit('train.csv', label='class')
>>> y_pred_proba = predictor.predict_proba('test.csv')
>>>
>>> # y_pred and y_pred_from_proba are identical
>>> y_pred = predictor.predict('test.csv')
>>> y_pred_from_proba = predictor.predict_from_proba(y_pred_proba=y_pred_proba)