statsmodels.stats.dist_dependence_measures.距离统计

statsmodels.stats.dist_dependence_measures.distance_statistics(x, y, x_dist=None, y_dist=None)[source]

计算各种距离依赖统计量。

计算如[1]所述的几种距离依赖性统计量。

Parameters:
xarray_like, 1-D or 2-D

如果x是1维的,则假设它是一个单一随机变量的观测值向量。如果x是2维的,则行应为观测值,列被视为随机向量的组成部分,即每一列代表随机向量x的不同组成部分。

yarray_like, 1-D or 2-D

x相同,但只需要观测的数量与x匹配。如果y是二维的,请注意y的列数(即随机向量中的分量数量)不需要与x中的列数匹配。

x_distarray_like, 2-D, optional

一个方形二维数组对象,其值为x行之间的欧几里得距离。

y_distarray_like, 2-D, optional

一个方形二维类数组对象,其值为y行之间的欧几里得距离。

Returns:
collections.namedtuple

一个包含距离依赖统计量(DistDependStat)的命名元组,具有以下值:

  • test_statistic : float - “基本”检验统计量(即,在调用distance_covariance_test()时选择emp方法时使用的统计量)

  • distance_correlation : float - xy 之间的距离相关性。

  • distance_covariance : float - xy 的距离协方差。

  • dvar_x : float - x的距离方差。

  • dvar_y : float - y的距离方差。

  • S : float - xy 的欧几里得距离均值的乘积。主要用于内部使用。

参考文献

[1]

Szekely, G.J., Rizzo, M.L., 和 Bakirov, N.K. (2007) “通过距离的相关性来测量和测试依赖性”。 统计学年鉴, 第35卷 第6期, 页码2769-2794。

示例

>>> from statsmodels.stats.dist_dependence_measures import
... distance_statistics
>>> distance_statistics(np.random.random(1000), np.random.random(1000))
DistDependStat(test_statistic=0.07948284320205831,
distance_correlation=0.04269511890990793,
distance_covariance=0.008915315092696293,
dvar_x=0.20719027438266704, dvar_y=0.21044934264957588,
S=0.10892061635588891)

Last update: Oct 16, 2024