statsmodels.stats.weightstats.DescrStatsW¶
-
class statsmodels.stats.weightstats.DescrStatsW(data, weights=
None, ddof=0)[source]¶ 描述性统计和带案例权重的检验
假设数据是1维或2维的,具有(nobs, nvars)的观测值在行中,变量在列中,并且每列应用相同的权重。
如果使用自由度校正,那么权重应总计为观测值的数量。ttest 还假设权重的总和对应于样本大小。
这本质上与根据权重复制每个观测值相同,如果权重是整数,通常称为案例或频率权重。
- Parameters:¶
- dataarray_like, 1-D or 2-D
数据集
- weights
Noneor 1-Dndarray 每个观测值的权重,长度与数据的零轴相同
- ddof
int 默认 ddof=0,用于二阶矩(如方差、标准差、协方差、相关系数)的自由度修正。 然而,统计检验与 ddof 无关,基于标准公式。
- Attributes:¶
- corrcoef
带默认ddof的加权相关性
假设变量在列中,观测值在行中
- cov
如果数据是二维的,则数据的加权协方差
假设变量在列中,观测值在行中 使用默认的ddof
- demeaned
减去加权平均值的数据
- mean
数据的加权平均值
- nobs
观测值/案例数的别名,等于权重的总和
- std
使用默认自由度校正的标准差
- std_mean
加权平均的标准差
- sum
数据的加权和
- sum_weights
权重之和
- sumsquares
去均值数据加权平方和
- var
使用默认自由度校正的方差
示例
>>> import numpy as np >>> np.random.seed(0) >>> x1_2d = 1.0 + np.random.randn(20, 3) >>> w1 = np.random.randint(1, 4, 20) >>> d1 = DescrStatsW(x1_2d, weights=w1) >>> d1.mean array([ 1.42739844, 1.23174284, 1.083753 ]) >>> d1.var array([ 0.94855633, 0.52074626, 1.12309325]) >>> d1.std_mean array([ 0.14682676, 0.10878944, 0.15976497])>>> tstat, pval, df = d1.ttest_mean(0) >>> tstat; pval; df array([ 9.72165021, 11.32226471, 6.78342055]) array([ 1.58414212e-12, 1.26536887e-14, 2.37623126e-08]) 44.0>>> tstat, pval, df = d1.ttest_mean([0, 1, 1]) >>> tstat; pval; df array([ 9.72165021, 2.13019609, 0.52422632]) array([ 1.58414212e-12, 3.87842808e-02, 6.02752170e-01]) 44.0# 如果权重是整数,则可以使用asrepeats
>>> x1r = d1.asrepeats() >>> x1r.shape ... >>> stats.ttest_1samp(x1r, [0, 1, 1]) ...方法
获取一个数组,该数组具有由 floor(weights) 给出的重复项
get_compare(other[, weights])返回一个包含自身和其他对象的CompareMeans实例
quantile(probs[, return_pandas])计算加权样本的分位数。
std_ddof([ddof])给定ddof的数据的标准差
tconfint_mean([alpha, alternative])数据加权平均值的双侧置信区间
ttest_mean([value, alternative])检验原假设,即均值等于给定值。
ttost_mean(low, upp)单样本的(非)等价性检验
var_ddof([ddof])给定ddof的数据方差
zconfint_mean([alpha, alternative])数据加权平均值的双侧置信区间
ztest_mean([value, alternative])零假设的z检验,假设均值等于给定值。
ztost_mean(low, upp)基于z检验的单样本(非)等价性检验
属性
带默认ddof的加权相关性
如果数据是二维的,则数据的加权协方差
减去加权平均值的数据
数据的加权平均值
观测值/案例数的别名,等于权重的总和
使用默认自由度校正的标准差
加权平均的标准差
数据的加权和
权重之和
去均值数据加权平方和
使用默认自由度校正的方差