Shortcuts

指标

聚合指标

AUC

使用梯形法则计算曲线下面积(AUC)。

沿维度 dim 连接所有输入张量。

Max

计算所有输入张量中所有元素的最大值。

Mean

计算所有输入张量中所有元素的加权平均值。

Min

计算所有输入张量中所有元素的最小值。

Sum

计算所有输入张量中所有元素的加权和值。

吞吐量

计算吞吐量值,即每秒处理的元素数量。

分类指标

BinaryAccuracy

计算二进制准确率分数,即输入与目标匹配的频率。

BinaryAUPRC

计算AUPRC,也称为平均精度,这是二分类中精确率-召回率曲线下的面积。

BinaryAUROC

计算AUROC,即ROC曲线下的面积,用于二分类。

BinaryBinnedAUROC

计算AUROC,即ROC曲线下的面积,用于二分类。

BinaryBinnedPrecisionRecallCurve

使用给定的阈值计算精确率召回曲线。

BinaryConfusionMatrix

计算二元混淆矩阵,一个2乘2的张量,包含计数((真正例,假反例),(假正例,真反例))

BinaryF1Score

计算二进制的f1分数,它被定义为精确率和召回率的调和平均数。

BinaryNormalizedEntropy

计算预测输入与真实二元目标之间的归一化二元交叉熵。

BinaryPrecision

计算二分类任务的精确率,精确率计算为真正例与真正例和假正例之和的比率。

BinaryPrecisionRecallCurve

返回二分类任务的精确率-召回率对及其对应的阈值。

BinaryRecall

计算二分类任务的召回率,召回率计算公式为真正例与真正例和假反例之和的比值。

BinaryRecallAtFixedPrecision

返回在二元分类任务中给定最小精度时的最高可能召回值。

MulticlassAccuracy

计算准确率分数,即输入与目标匹配的频率。

MulticlassAUPRC

计算AUPRC,也称为平均精度,它是多类分类中精确率-召回率曲线下的面积。

MulticlassAUROC

计算AUROC,即ROC曲线下的面积,用于多类分类的一对多方式。

MulticlassBinnedAUROC

计算AUROC,即ROC曲线下的面积,用于多类分类。

MulticlassBinnedPrecisionRecallCurve

使用给定的阈值计算精确率召回曲线。

MulticlassConfusionMatrix

计算多类混淆矩阵,这是一个维度为num_classes x num_classes的矩阵,其中位置(i,j)处的元素表示真实类别为i但被预测为类别j的样本数量。

MulticlassF1Score

计算f1分数,它被定义为精确率和召回率的调和平均值。

MulticlassPrecision

计算精确率,即真正例与真正例和假正例之和的比率。

MulticlassPrecisionRecallCurve

返回多类分类任务的精确率-召回率对及其对应的阈值。

多类召回率

计算召回率,即真正例与真正例和假反例之和的比率。

MultilabelAccuracy

计算多标签准确率分数,这是输入与目标匹配的频率。

MultilabelAUPRC

计算AUPRC,也称为平均精度,这是多标签分类中精确率-召回率曲线下的面积。

MultilabelPrecisionRecallCurve

返回多标签分类任务的精确率-召回率对及其对应的阈值。

MultilabelRecallAtFixedPrecision

返回在多标签分类任务中,给定每个标签的最小精度及其对应阈值时的最高可能召回值。

TopKMultilabelAccuracy

计算多标签准确率分数,即预测的前k个标签与目标匹配的频率。

排名指标

点击率

计算点击事件的点击率。

HitRate

计算在预测的前几个类别中正确类别的命中率。

ReciprocalRank

计算正确类别在预测类别中的倒数排名。

WeightedCalibration

计算加权校准指标。

回归指标

MeanSquaredError

计算均方误差,即inputtarget的误差平方的均值。

R2Score

计算R平方分数,这是因变量中可由自变量解释的方差比例。

文本指标

BLEUScore

计算给定翻译和参考的BLEU分数(https://en.wikipedia.org/wiki/BLEU)。

困惑度

困惑度衡量模型预测样本数据的能力。

WordErrorRate

计算预测词序列与参考词序列的词错误率。

WordInformationLost

单词信息丢失(WIL)是自动语音识别系统性能的一个度量标准。

WordInformationPreserved

计算预测词序列与参考词序列之间保留的单词信息。

窗口指标

WindowedBinaryAUROC

BinaryAUROC的窗口版本。

WindowedBinaryNormalizedEntropy

提供窗口化和生命周期值的BinaryNormalizedEntropy的窗口化版本。

WindowedClickThroughRate

提供窗口期和生命周期值的点击率(ClickThroughRate)的窗口版本。

WindowedMeanSquaredError

提供窗口化和生命周期值的均方误差的窗口化版本。

WindowedWeightedCalibration

计算加权校准指标。