statsmodels.stats.inter_rater.cohens_kappa

statsmodels.stats.inter_rater.cohens_kappa(table, weights=None, return_results=True, wt=None)[source]

计算Cohen’s kappa及其方差,并进行等于零的检验

Parameters:
tablearray_like, 2-Dim

带有两位评分者结果的方阵,一位评分者在行中,第二位评分者在列中

weightsarray_like

权重的解释取决于 wt 参数。 如果两者都为 None,则计算简单 kappa。 参见 wt 以了解当 wt 不为 None 时的情况 如果 weights 是二维的,则它直接用作权重矩阵。 在计算 kappa 的方差时,假设权重的最大值小于或等于 1。 TODO: 修复 2-Dim 情况下的定义冲突

wt{None, str}

如果 wt 和 weights 都为 None,则计算简单的 kappa。 如果给出了 wt,但 weights 为 None,则权重设置为 [0, 1, 2, …, k]。 如果 weights 是一维数组,则根据以下选项使用它来构造权重矩阵。

wt in [‘linear’, ‘ca’ or None]use linear weights, Cicchetti-Allison

实际权重与得分“权重”差异呈线性关系

wt in [‘quadratic’, ‘fc’]use linear weights, Fleiss-Cohen

实际权重在得分“权重”差异中被平方

wt = ‘toeplitz’weight matrix is constructed as a toeplitz matrix

从一维权重中。

return_resultsbool

如果为真(默认),则返回一个 KappaResults 实例。 如果为假,则仅计算并返回 kappa。

Returns:
results or kappa

如果 return_results 为 True(默认),则返回一个包含所有统计信息的结果实例。 如果 return_results 为 False,则仅计算并返回 kappa。

注释

关于权重矩阵,维基百科和SAS手册有两种不同的定义。然而,计算结果对权重矩阵的重新缩放是不变的,因此结果没有区别。

对于‘linear’和‘quadratic’的权重被解释为类别的分数,计算中的权重基于分数之间的成对差异。 对于‘toeplitz’的权重被解释为加权距离。距离仅取决于表格中两个条目之间相差的级别数,而不取决于级别本身。

示例:

weights = ‘0, 1, 2, 3’ 和 wt 是线性或 toeplitz 意味着权重仅取决于级别的简单距离。

weights = ‘0, 0, 1, 1’ 和 wt = ‘linear’ 意味着前两个级别之间的距离为零,最后两个级别也是如此。这与通过分别合并前两个和最后两个级别来形成两个聚合级别的情况相同。

weights = [0, 1, 2, 3] 和 wt = ‘quadratic’ 与将这些权重平方并使用 wt = ‘toeplitz’ 是相同的。

参考文献

维基百科 SAS手册


Last update: Oct 16, 2024