statsmodels.stats.proportion.multinomial_proportions_confint¶
-
statsmodels.stats.proportion.multinomial_proportions_confint(counts, alpha=
0.05, method='goodman')[source]¶ 多项式比例的置信区间。
- Parameters:¶
- countsarray_like
ofint, 1-D 每个类别中的观察数量。
- alpha
floatin(0, 1),optional 显著性水平,默认为 0.05。
- method{‘goodman’, ‘sison-glaz’},
optional 用于计算置信区间的方法;可用方法包括:
- countsarray_like
- Returns:¶
- confint
ndarray, 2-D 每个类别的[下限, 上限]置信水平数组,使得总体覆盖率(大约)为1-alpha。
- confint
- Raises:¶
ValueError如果 alpha 不在 (0, 1)(边界不包括),或者如果 counts 中的值不全为正或为零。
NotImplementedError如果方法未知。
Exception当
method == 'sison-glaz'时,如果由于某种原因无法计算 c;这表明存在一个错误,应报告此问题。
注释
The goodman method [2] 是基于将多项式统计量近似为卡方随机变量的方法。通常的建议是,如果counts中的所有值都大于或等于5,则此方法是有效的。此方法对类别的数量没有限制。
The sison-glaz method [3] 近似于多项式概率,并通过最大似然估计器进行评估。第一个近似是当类别数量趋向于无穷大时的Edgeworth展开,而最大似然估计器在观测数量(
sum(counts))趋向于无穷大时收敛。在他们的论文中,Sison & Glaz 使用至少7个类别演示了他们的方法,因此len(counts) >= 7且counts中的所有值都大于或等于5可以作为该方法有效性的一条经验法则。这种方法比goodman方法更不保守(即它将产生更接近所需显著性水平的置信区间),但它为所有类别生成了统一宽度的置信区间(除非区间达到0或1,在这种情况下它们被截断),这使得它在比例大小相似时最为有用。除了原始来源([1]、[2] 和 [3]),该实现使用了[4] 和 [5]中提出的公式(尽管不是代码)。
参考文献
Last update:
Oct 16, 2024