statsmodels.stats.dist_dependence_measures.距离协方差检验

statsmodels.stats.dist_dependence_measures.distance_covariance_test(x, y, B=None, method='auto')[source]

距离协方差 (dCov) 检验

将距离协方差(dCov)独立性检验应用于xy。 该检验在[1]中引入,并基于距离协方差统计量。该检验适用于任意长度的随机向量 (详见注释部分)。

Parameters:
xarray_like, 1-D or 2-D

如果x是1维的,则假设它是一个单一随机变量的观测值向量。如果x是2维的,则行应为观测值,列被视为随机向量的组成部分,即每一列代表随机向量x的不同组成部分。

yarray_like, 1-D or 2-D

x相同,但只需要观测的数量与x匹配。如果y是二维的,请注意y的列数(即随机向量中的分量数量)不需要与x中的列数匹配。

Bint, optional, default=`None`

当应用emp方法评估检验统计量的零分布时,要执行的迭代次数(见下文)。如果BNone,则在[1]中,我们设置BB = 200 + 5000/n,其中n是观测值的数量。

method{‘auto’, ‘emp’, ‘asym’}, optional, default=auto

获取测试的p值的方法。

  • 自动 : 默认方法。将使用观察的数量来确定方法。

  • emp : 使用y行的排列来获得零分布,对p值进行经验评估。

  • asym : 使用检验统计量分布的渐近近似来找到p值。

Returns:
test_statisticfloat

测试中使用的检验统计量的值。

pvalfloat

p值。

chosen_methodstr

用于获取p值的方法。当函数调用时使用method=’auto’时,这通常是相关的。

注释

该测试适用于任意维度的随机向量,即x可以是一个随机变量的1维观测向量,而y可以是一个kn列的2维数组(其中k > 1)。换句话说,xy也可以都是2维数组,并且具有相同的行数(观测值),但在列数上有所不同。

[1]所述,统计数据对所有类型的独立性偏离都很敏感,包括非线性或非单调的依赖结构。

参考文献

[1] (1,2,3)

Szekely, G.J., Rizzo, M.L., 和 Bakirov, N.K. (2007) “通过距离的相关性进行测量和测试”。 统计学年鉴, 第35卷 第6期, 第2769-2794页。

示例

>>> from statsmodels.stats.dist_dependence_measures import
... distance_covariance_test
>>> data = np.random.rand(1000, 10)
>>> x, y = data[:, :3], data[:, 3:]
>>> x.shape
(1000, 3)
>>> y.shape
(1000, 7)
>>> distance_covariance_test(x, y)
(1.0426404792714983, 0.2971148340813543, 'asym')
# (test_statistic, pval, chosen_method)

Last update: Oct 16, 2024