statsmodels.stats.dist_dependence_measures.distance_correlation

statsmodels.stats.dist_dependence_measures.distance_correlation(x, y)[source]

距离相关性。

计算经验距离相关性,如[1]中所述。 该统计量类似于积矩相关性,描述了xy之间的依赖关系,它们是任意长度的随机向量。统计量的值介于0(表示独立)和1(表示完全依赖)之间。

Parameters:
xarray_like, 1-D or 2-D

如果x是1维的,则假设它是一个单一随机变量的观测值向量。如果x是2维的,则行应为观测值,列被视为随机向量的组成部分,即每一列代表随机向量x的不同组成部分。

yarray_like, 1-D or 2-D

x相同,但只需要观测的数量与x匹配。如果y是二维的,请注意y的列数(即随机向量中的分量数量)不需要与x中的列数匹配。

Returns:
float

变量xy之间的经验距离相关性。

参考文献

[1]

Szekely, G.J., Rizzo, M.L., 和 Bakirov, N.K. (2007) “通过距离的相关性来测量和测试依赖性”。 统计学年鉴, 第35卷 第6期, 页码2769-2794。

示例

>>> from statsmodels.stats.dist_dependence_measures import
... distance_correlation
>>> distance_correlation(np.random.random(1000), np.random.random(1000))
0.04060497840149489

Last update: Oct 16, 2024