基础# 评估指标的抽象基类。 类 BaseEvaluator(*args, **kwargs) EvaluationResult(avg_score[, ...]) 评估结果。 class EvaluationResult(avg_score: float, per_item_scores: List[float] | None = None, additional_info: dict | None = None)[source]# 基础类:object 评估结果。 avg_score: float# per_item_scores: List[float] | None = None# additional_info: dict | None = None# class BaseEvaluator(*args, **kwargs)[source]# 基础类:object compute_single_item(*args, **kwargs) → float[source]# 计算单个项目的分数。 compute(*args, **kwargs) → Any[source]# 评估预测值和真实值的列表,并返回总体分数和每个项目的分数。