基础#

评估指标的抽象基类。

BaseEvaluator(*args, **kwargs)

EvaluationResult(avg_score[, ...])

评估结果。

class EvaluationResult(avg_score: float, per_item_scores: List[float] | None = None, additional_info: dict | None = None)[source]#

基础类:object

评估结果。

avg_score: float#
per_item_scores: List[float] | None = None#
additional_info: dict | None = None#
class BaseEvaluator(*args, **kwargs)[source]#

基础类:object

compute_single_item(*args, **kwargs) float[source]#

计算单个项目的分数。

compute(*args, **kwargs) Any[source]#

评估预测值和真实值的列表,并返回总体分数和每个项目的分数。