statsmodels.stats.weightstats.DescrStatsW

class statsmodels.stats.weightstats.DescrStatsW(data, weights=None, ddof=0)[source]

描述性统计和带案例权重的检验

假设数据是1维或2维的,具有(nobs, nvars)的观测值在行中,变量在列中,并且每列应用相同的权重。

如果使用自由度校正,那么权重应总计为观测值的数量。ttest 还假设权重的总和对应于样本大小。

这本质上与根据权重复制每个观测值相同,如果权重是整数,通常称为案例或频率权重。

Parameters:
dataarray_like, 1-D or 2-D

数据集

weightsNone or 1-D ndarray

每个观测值的权重,长度与数据的零轴相同

ddofint

默认 ddof=0,用于二阶矩(如方差、标准差、协方差、相关系数)的自由度修正。 然而,统计检验与 ddof 无关,基于标准公式。

Attributes:
corrcoef

带默认ddof的加权相关性

假设变量在列中,观测值在行中

cov

如果数据是二维的,则数据的加权协方差

假设变量在列中,观测值在行中 使用默认的ddof

demeaned

减去加权平均值的数据

mean

数据的加权平均值

nobs

观测值/案例数的别名,等于权重的总和

std

使用默认自由度校正的标准差

std_mean

加权平均的标准差

sum

数据的加权和

sum_weights

权重之和

sumsquares

去均值数据加权平方和

var

使用默认自由度校正的方差

示例

>>> import numpy as np
>>> np.random.seed(0)
>>> x1_2d = 1.0 + np.random.randn(20, 3)
>>> w1 = np.random.randint(1, 4, 20)
>>> d1 = DescrStatsW(x1_2d, weights=w1)
>>> d1.mean
array([ 1.42739844,  1.23174284,  1.083753  ])
>>> d1.var
array([ 0.94855633,  0.52074626,  1.12309325])
>>> d1.std_mean
array([ 0.14682676,  0.10878944,  0.15976497])
>>> tstat, pval, df = d1.ttest_mean(0)
>>> tstat; pval; df
array([  9.72165021,  11.32226471,   6.78342055])
array([  1.58414212e-12,   1.26536887e-14,   2.37623126e-08])
44.0
>>> tstat, pval, df = d1.ttest_mean([0, 1, 1])
>>> tstat; pval; df
array([ 9.72165021,  2.13019609,  0.52422632])
array([  1.58414212e-12,   3.87842808e-02,   6.02752170e-01])
44.0

# 如果权重是整数,则可以使用asrepeats

>>> x1r = d1.asrepeats()
>>> x1r.shape
...
>>> stats.ttest_1samp(x1r, [0, 1, 1])
...

方法

asrepeats()

获取一个数组,该数组具有由 floor(weights) 给出的重复项

get_compare(other[, weights])

返回一个包含自身和其他对象的CompareMeans实例

quantile(probs[, return_pandas])

计算加权样本的分位数。

std_ddof([ddof])

给定ddof的数据的标准差

tconfint_mean([alpha, alternative])

数据加权平均值的双侧置信区间

ttest_mean([value, alternative])

检验原假设,即均值等于给定值。

ttost_mean(low, upp)

单样本的(非)等价性检验

var_ddof([ddof])

给定ddof的数据方差

zconfint_mean([alpha, alternative])

数据加权平均值的双侧置信区间

ztest_mean([value, alternative])

零假设的z检验,假设均值等于给定值。

ztost_mean(low, upp)

基于z检验的单样本(非)等价性检验

属性

corrcoef

带默认ddof的加权相关性

cov

如果数据是二维的,则数据的加权协方差

demeaned

减去加权平均值的数据

mean

数据的加权平均值

nobs

观测值/案例数的别名,等于权重的总和

std

使用默认自由度校正的标准差

std_mean

加权平均的标准差

sum

数据的加权和

sum_weights

权重之和

sumsquares

去均值数据加权平方和

var

使用默认自由度校正的方差


Last update: Oct 16, 2024