Shortcuts

功能指标

聚合指标

auc

使用梯形法则计算曲线下面积(AUC)。

mean

计算加权平均值。

sum

计算加权和。

throughput

计算吞吐量值,即每秒处理的元素数量。

分类指标

binary_accuracy

计算二进制准确率分数,即输入与目标匹配的频率。

binary_auprc

计算AUPRC,也称为平均精度,这是二分类中精确率-召回率曲线下的面积。

binary_auroc

计算AUROC,即ROC曲线下的面积,用于二分类。

binary_binned_auroc

计算AUROC,即ROC曲线下的面积,用于二分类。

binary_binned_precision_recall_curve

使用给定的阈值计算精确率召回曲线。

binary_confusion_matrix

计算二元混淆矩阵,一个2乘2的张量,包含计数((真正例,假反例),(假正例,真反例))

binary_f1_score

计算二进制的f1分数,即精确率和召回率的调和平均数。

binary_normalized_entropy

计算预测输入与真实二元目标之间的归一化二元交叉熵。

binary_precision

计算二分类类别的精确率分数,该分数计算为真正例(TP)的数量与预测为正例的总数(TP + FP)之间的比率。

binary_precision_recall_curve

返回用于二分类任务的精确率-召回率对及其对应的阈值。

binary_recall

计算二分类类别的召回率分数,该分数计算为真正例(TP)的数量与实际正例总数(TP + FN)之间的比率。

binary_recall_at_fixed_precision

返回在二元分类任务中给定最小精度时的最高可能召回值。

multiclass_accuracy

计算准确率分数,即输入与目标匹配的频率。

multiclass_auprc

计算AUPRC,也称为平均精度,这是多类分类中精确率-召回率曲线下的面积。

multiclass_auroc

计算AUROC,即ROC曲线下的面积,用于多类分类。

multiclass_binned_auroc

计算AUROC,即ROC曲线下的面积,用于多类分类。

multiclass_binned_precision_recall_curve

使用给定的阈值计算精确率召回曲线。

multiclass_confusion_matrix

计算多类混淆矩阵,这是一个维度为num_classes x num_classes的矩阵,其中位置(i,j)处的元素表示真实类别为i但被预测为类别j的样本数量。

multiclass_f1_score

计算f1分数,它被定义为精确率和召回率的调和平均数。

multiclass_precision

计算精确度分数,即真正例(TP)与分类为正例的总点数(TP + FP)的比率。

multiclass_precision_recall_curve

返回多类分类任务的精确率-召回率对及其对应的阈值。

multiclass_recall

计算召回率得分,它是通过真正例(TP)的数量与实际正例总数(TP + FN)的比率来计算的。

multilabel_accuracy

计算多标签准确率分数,这是输入与目标匹配的频率。

multilabel_auprc

计算AUPRC,也称为平均精度,这是多标签分类中精确率-召回率曲线下的面积。

multilabel_precision_recall_curve

返回多标签分类任务的精确率-召回率对及其对应的阈值。

multilabel_recall_at_fixed_precision

返回多标签分类任务中每个标签在给定最小精度下的最高可能召回值及其对应的阈值。

topk_multilabel_accuracy

计算多标签准确率分数,即预测的前k个标签与目标匹配的频率。

排名指标

click_through_rate

计算给定点击事件的点击率。

frequency_at_k

给定频率列表和阈值k,计算频率。

hit_rate

计算在预测的前几类中正确类别的命中率。

num_collisions

计算给定输入列表(ids)中的碰撞次数。

reciprocal_rank

计算正确类别在预测类别中的倒数排名。

weighted_calibration

计算加权校准指标。

回归指标

mean_squared_error

计算均方误差,即inputtarget的误差平方的平均值。其类版本为torcheval.metrics.MeanSquaredError

r2_score

计算R平方分数,这是因变量中可由自变量解释的方差比例。

文本指标

bleu_score

计算给定翻译和每个翻译的参考的BLEU分数。

perplexity

困惑度衡量模型预测样本数据的能力。

word_error_rate

计算预测单词序列与参考单词序列的词错误率。

word_information_preserved

计算预测词序列相对于参考词序列的单词信息保留分数。

word_information_lost

单词信息丢失率是自动语音识别系统性能的一个指标。