FMClassificationSummary

class pyspark.ml.classification. FMClassificationSummary ( java_obj : Optional [ JavaObject ] = None ) [source]

给定模型的FMClassifier结果的抽象表示。

新增于版本 3.1.0。

方法

fMeasureByLabel ([beta])

返回每个标签(类别)的F值。

weightedFMeasure ([beta])

返回加权平均的F值。

属性

准确率

返回准确率。

areaUnderROC

计算接收者操作特征(ROC)曲线下的面积。

fMeasureByThreshold

返回一个包含两个字段(阈值,F-Measure)的数据框,beta = 1.0。

falsePositiveRateByLabel

返回每个标签(类别)的假正率。

labelCol

“predictions”字段,用于给出每个实例的真实标签。

标签

返回按升序排列的标签序列。

pr

返回精确召回曲线,这是一个包含两个字段 recall 和 precision 的 DataFrame,并在其开头添加了 (0.0, 1.0)。

precisionByLabel

返回每个标签(类别)的精确度。

precisionByThreshold

返回一个包含两个字段(阈值,精度)曲线的数据框。

predictionCol

“predictions”字段,用于给出每个类别的预测结果。

预测

模型 transform 方法输出的数据框。

recallByLabel

返回每个标签(类别)的召回率。

recallByThreshold

返回一个包含两个字段(阈值,召回率)曲线的数据框。

roc

返回接收者操作特征(ROC)曲线,这是一个包含两个字段(FPR,TPR)的DataFrame,并在其开头添加(0.0,0.0)和在末尾添加(1.0,1.0)。

scoreCol

“predictions”字段,提供每个类别的概率或原始预测作为向量。

truePositiveRateByLabel

返回每个标签(类别)的真阳性率。

weightCol

“predictions”字段中,给出每个实例权重作为向量的字段。

加权假正率

返回加权假正率。

加权精度

返回加权平均精度。

加权召回率

返回加权平均召回率。

加权真阳性率

返回加权真阳性率。

方法文档

fMeasureByLabel ( beta : float = 1.0 ) → List [ float ]

返回每个标签(类别)的F值。

新增于版本 3.1.0。

weightedFMeasure ( beta : float = 1.0 ) → float

返回加权平均的F值。

新增于版本 3.1.0。

属性文档

accuracy

返回准确率。 (等于正确分类的实例总数 除以实例总数。)

新增于版本 3.1.0。

areaUnderROC

计算接收者操作特征(ROC)曲线下面积。

新增于版本 3.1.0。

fMeasureByThreshold

返回一个包含两个字段(阈值,F-Measure)曲线的数据框,其中beta = 1.0。

新增于版本 3.1.0。

falsePositiveRateByLabel

返回每个标签(类别)的假正率。

新增于版本 3.1.0。

labelCol

“predictions”字段中给出每个实例的真实标签。

新增于版本 3.1.0。

labels

返回按升序排列的标签序列。此顺序与以标签数组形式指定的度量标准中使用的顺序相匹配,例如 truePositiveRateByLabel。

新增于版本 3.1.0。

注释

在大多数情况下,它将是值 {0.0, 1.0, …, numClasses-1}。然而,如果训练集缺少一个标签,那么所有基于标签的数组(例如,来自 truePositiveRateByLabel)的长度将是 numClasses-1,而不是预期的 numClasses。

pr

返回精确召回曲线,这是一个包含两个字段 recall、precision 的 Dataframe,并在其开头添加了 (0.0, 1.0)。

新增于版本 3.1.0。

precisionByLabel

返回每个标签(类别)的精确度。

新增于版本 3.1.0。

precisionByThreshold

返回一个包含两个字段(阈值, 精度)曲线的数据框。 在转换数据集时获得的所有可能概率都用作计算精度的阈值。

新增于版本 3.1.0。

predictionCol

“predictions”字段,用于给出每个类别的预测结果。

新增于版本 3.1.0。

predictions

模型 transform 方法输出的数据框。

新增于版本 3.1.0。

recallByLabel

返回每个标签(类别)的召回率。

新增于版本 3.1.0。

recallByThreshold

返回一个包含两个字段(阈值,召回率)曲线的数据框。 在转换数据集时获得的所有可能概率都用作计算召回率的阈值。

新增于版本 3.1.0。

roc

返回接收者操作特征(ROC)曲线,这是一个包含两个字段(FPR, TPR)的DataFrame,并在其开头添加(0.0, 0.0),在末尾添加(1.0, 1.0)。

新增于版本 3.1.0。

注释

维基百科参考

scoreCol

“predictions”字段,提供每个类别的概率或原始预测作为向量。

新增于版本 3.1.0。

truePositiveRateByLabel

返回每个标签(类别)的真阳性率。

新增于版本 3.1.0。

weightCol

“predictions”字段中,给出每个实例权重作为向量的字段。

新增于版本 3.1.0。

weightedFalsePositiveRate

返回加权假正率。

新增于版本 3.1.0。

weightedPrecision

返回加权平均精度。

新增于版本 3.1.0。

weightedRecall

返回加权平均召回率。 (等于精确率、召回率和F值)

新增于版本 3.1.0。

weightedTruePositiveRate

返回加权真阳性率。 (等于精确率、召回率和F值)

新增于版本 3.1.0。