statsmodels.stats.proportion.multinomial_proportions_confint

statsmodels.stats.proportion.multinomial_proportions_confint(counts, alpha=0.05, method='goodman')[source]

多项式比例的置信区间。

Parameters:
countsarray_like of int, 1-D

每个类别中的观察数量。

alphafloat in (0, 1), optional

显著性水平,默认为 0.05。

method{‘goodman’, ‘sison-glaz’}, optional

用于计算置信区间的方法;可用方法包括:

  • goodman: 基于卡方近似,如果counts中的所有值都大于或等于5,则有效 [2]

  • sison-glaz: 比 goodman 更不保守,但仅在 counts 有 7 个或更多类别时有效(len(counts) >= 7[3]

Returns:
confintndarray, 2-D

每个类别的[下限, 上限]置信水平数组,使得总体覆盖率(大约)为1-alpha

Raises:
ValueError

如果 alpha 不在 (0, 1)(边界不包括),或者如果 counts 中的值不全为正或为零。

NotImplementedError

如果方法未知。

Exception

method == 'sison-glaz' 时,如果由于某种原因无法计算 c;这表明存在一个错误,应报告此问题。

注释

The goodman method [2] 是基于将多项式统计量近似为卡方随机变量的方法。通常的建议是,如果counts中的所有值都大于或等于5,则此方法是有效的。此方法对类别的数量没有限制。

The sison-glaz method [3] 近似于多项式概率,并通过最大似然估计器进行评估。第一个近似是当类别数量趋向于无穷大时的Edgeworth展开,而最大似然估计器在观测数量(sum(counts))趋向于无穷大时收敛。在他们的论文中,Sison & Glaz 使用至少7个类别演示了他们的方法,因此len(counts) >= 7counts中的所有值都大于或等于5可以作为该方法有效性的一条经验法则。这种方法比goodman方法更不保守(即它将产生更接近所需显著性水平的置信区间),但它为所有类别生成了统一宽度的置信区间(除非区间达到0或1,在这种情况下它们被截断),这使得它在比例大小相似时最为有用。

除了原始来源([1][2][3]),该实现使用了[4][5]中提出的公式(尽管不是代码)。

参考文献

[1]

莱文, 布鲁斯, “多项式累积分布函数的表示方法,” 《统计学年鉴》, 第9卷, 第5期, 1981年, 第1123-1126页.

[2] (1,2,3)

古德曼, L.A., “关于多项式比例的联合置信区间,” 技术计量学, 第7卷, 第2期, 1965年, 第247-254页.

[3] (1,2,3)

西森, 克里斯蒂娜·P., 和 约瑟夫·格拉兹, “多项式比例的同时置信区间和样本量确定,” 美国统计协会杂志, 第90卷, 第429期, 1995年, 第366-369页.

[4]

May, Warren L., 和 William D. Johnson, “用于构建多项比例的同时置信区间的SAS®宏,” 计算机方法和生物医学中的程序, 第53卷, 第3期, 1997年, 第153-162页.

[5]

梅, 沃伦 L., 和 威廉 D. 约翰逊, “构建双侧同时置信区间用于多类别比例的小计数在大量单元格中,” 统计软件杂志, 第5卷, 第6期, 2000年, 第1-24页.


Last update: Oct 16, 2024