FMClassificationSummary ¶
-
class
pyspark.ml.classification.
FMClassificationSummary
( java_obj : Optional [ JavaObject ] = None ) [source] ¶ -
给定模型的FMClassifier结果的抽象表示。
新增于版本 3.1.0。
方法
fMeasureByLabel
([beta])返回每个标签(类别)的F值。
weightedFMeasure
([beta])返回加权平均的F值。
属性
返回准确率。
计算接收者操作特征(ROC)曲线下的面积。
返回一个包含两个字段(阈值,F-Measure)的数据框,beta = 1.0。
返回每个标签(类别)的假正率。
“predictions”字段,用于给出每个实例的真实标签。
返回按升序排列的标签序列。
返回精确召回曲线,这是一个包含两个字段 recall 和 precision 的 DataFrame,并在其开头添加了 (0.0, 1.0)。
返回每个标签(类别)的精确度。
返回一个包含两个字段(阈值,精度)曲线的数据框。
“predictions”字段,用于给出每个类别的预测结果。
模型 transform 方法输出的数据框。
返回每个标签(类别)的召回率。
返回一个包含两个字段(阈值,召回率)曲线的数据框。
返回接收者操作特征(ROC)曲线,这是一个包含两个字段(FPR,TPR)的DataFrame,并在其开头添加(0.0,0.0)和在末尾添加(1.0,1.0)。
“predictions”字段,提供每个类别的概率或原始预测作为向量。
返回每个标签(类别)的真阳性率。
“predictions”字段中,给出每个实例权重作为向量的字段。
返回加权假正率。
返回加权平均精度。
返回加权平均召回率。
返回加权真阳性率。
方法文档
-
fMeasureByLabel
( beta : float = 1.0 ) → List [ float ] ¶ -
返回每个标签(类别)的F值。
新增于版本 3.1.0。
-
weightedFMeasure
( beta : float = 1.0 ) → float ¶ -
返回加权平均的F值。
新增于版本 3.1.0。
属性文档
-
accuracy
¶ -
返回准确率。 (等于正确分类的实例总数 除以实例总数。)
新增于版本 3.1.0。
-
areaUnderROC
¶ -
计算接收者操作特征(ROC)曲线下面积。
新增于版本 3.1.0。
-
fMeasureByThreshold
¶ -
返回一个包含两个字段(阈值,F-Measure)曲线的数据框,其中beta = 1.0。
新增于版本 3.1.0。
-
falsePositiveRateByLabel
¶ -
返回每个标签(类别)的假正率。
新增于版本 3.1.0。
-
labelCol
¶ -
“predictions”字段中给出每个实例的真实标签。
新增于版本 3.1.0。
-
labels
¶ -
返回按升序排列的标签序列。此顺序与以标签数组形式指定的度量标准中使用的顺序相匹配,例如 truePositiveRateByLabel。
新增于版本 3.1.0。
注释
在大多数情况下,它将是值 {0.0, 1.0, …, numClasses-1}。然而,如果训练集缺少一个标签,那么所有基于标签的数组(例如,来自 truePositiveRateByLabel)的长度将是 numClasses-1,而不是预期的 numClasses。
-
pr
¶ -
返回精确召回曲线,这是一个包含两个字段 recall、precision 的 Dataframe,并在其开头添加了 (0.0, 1.0)。
新增于版本 3.1.0。
-
precisionByLabel
¶ -
返回每个标签(类别)的精确度。
新增于版本 3.1.0。
-
precisionByThreshold
¶ -
返回一个包含两个字段(阈值, 精度)曲线的数据框。 在转换数据集时获得的所有可能概率都用作计算精度的阈值。
新增于版本 3.1.0。
-
predictionCol
¶ -
“predictions”字段,用于给出每个类别的预测结果。
新增于版本 3.1.0。
-
predictions
¶ -
模型 transform 方法输出的数据框。
新增于版本 3.1.0。
-
recallByLabel
¶ -
返回每个标签(类别)的召回率。
新增于版本 3.1.0。
-
recallByThreshold
¶ -
返回一个包含两个字段(阈值,召回率)曲线的数据框。 在转换数据集时获得的所有可能概率都用作计算召回率的阈值。
新增于版本 3.1.0。
-
roc
¶ -
返回接收者操作特征(ROC)曲线,这是一个包含两个字段(FPR, TPR)的DataFrame,并在其开头添加(0.0, 0.0),在末尾添加(1.0, 1.0)。
新增于版本 3.1.0。
注释
-
scoreCol
¶ -
“predictions”字段,提供每个类别的概率或原始预测作为向量。
新增于版本 3.1.0。
-
truePositiveRateByLabel
¶ -
返回每个标签(类别)的真阳性率。
新增于版本 3.1.0。
-
weightCol
¶ -
“predictions”字段中,给出每个实例权重作为向量的字段。
新增于版本 3.1.0。
-
weightedFalsePositiveRate
¶ -
返回加权假正率。
新增于版本 3.1.0。
-
weightedPrecision
¶ -
返回加权平均精度。
新增于版本 3.1.0。
-
weightedRecall
¶ -
返回加权平均召回率。 (等于精确率、召回率和F值)
新增于版本 3.1.0。
-
weightedTruePositiveRate
¶ -
返回加权真阳性率。 (等于精确率、召回率和F值)
新增于版本 3.1.0。
-