statsmodels.stats.dist_dependence_measures.距离协方差检验¶
-
statsmodels.stats.dist_dependence_measures.distance_covariance_test(x, y, B=
None, method='auto')[source]¶ 距离协方差 (dCov) 检验
将距离协方差(dCov)独立性检验应用于x和y。 该检验在[1]中引入,并基于距离协方差统计量。该检验适用于任意长度的随机向量 (详见注释部分)。
- Parameters:¶
- xarray_like, 1-D or 2-D
如果x是1维的,则假设它是一个单一随机变量的观测值向量。如果x是2维的,则行应为观测值,列被视为随机向量的组成部分,即每一列代表随机向量x的不同组成部分。
- yarray_like, 1-D or 2-D
与x相同,但只需要观测的数量与x匹配。如果y是二维的,请注意y的列数(即随机向量中的分量数量)不需要与x中的列数匹配。
- B
int,optional, default=`None` 当应用emp方法评估检验统计量的零分布时,要执行的迭代次数(见下文)。如果B为None,则在[1]中,我们设置B为
B = 200 + 5000/n,其中n是观测值的数量。- method{‘auto’, ‘emp’, ‘asym’},
optional, default=auto 获取测试的p值的方法。
自动 : 默认方法。将使用观察的数量来确定方法。
emp : 使用y行的排列来获得零分布,对p值进行经验评估。
asym : 使用检验统计量分布的渐近近似来找到p值。
- Returns:¶
注释
该测试适用于任意维度的随机向量,即x可以是一个随机变量的1维观测向量,而y可以是一个k行n列的2维数组(其中k > 1)。换句话说,x和y也可以都是2维数组,并且具有相同的行数(观测值),但在列数上有所不同。
如[1]所述,统计数据对所有类型的独立性偏离都很敏感,包括非线性或非单调的依赖结构。
参考文献
示例
>>> from statsmodels.stats.dist_dependence_measures import ... distance_covariance_test >>> data = np.random.rand(1000, 10) >>> x, y = data[:, :3], data[:, 3:] >>> x.shape (1000, 3) >>> y.shape (1000, 7) >>> distance_covariance_test(x, y) (1.0426404792714983, 0.2971148340813543, 'asym') # (test_statistic, pval, chosen_method)
Last update:
Oct 16, 2024