statsmodels.stats.dist_dependence_measures.距离统计¶
-
statsmodels.stats.dist_dependence_measures.distance_statistics(x, y, x_dist=
None, y_dist=None)[source]¶ 计算各种距离依赖统计量。
计算如[1]所述的几种距离依赖性统计量。
- Parameters:¶
- xarray_like, 1-D or 2-D
如果x是1维的,则假设它是一个单一随机变量的观测值向量。如果x是2维的,则行应为观测值,列被视为随机向量的组成部分,即每一列代表随机向量x的不同组成部分。
- yarray_like, 1-D or 2-D
与x相同,但只需要观测的数量与x匹配。如果y是二维的,请注意y的列数(即随机向量中的分量数量)不需要与x中的列数匹配。
- x_distarray_like, 2-D,
optional 一个方形二维数组对象,其值为x行之间的欧几里得距离。
- y_distarray_like, 2-D,
optional 一个方形二维类数组对象,其值为y行之间的欧几里得距离。
- Returns:¶
collections.namedtuple一个包含距离依赖统计量(DistDependStat)的命名元组,具有以下值:
test_statistic : float - “基本”检验统计量(即,在调用
distance_covariance_test()时选择emp方法时使用的统计量)distance_correlation : float - x 和 y 之间的距离相关性。
distance_covariance : float - x 和 y 的距离协方差。
dvar_x : float - x的距离方差。
dvar_y : float - y的距离方差。
S : float - x 和 y 的欧几里得距离均值的乘积。主要用于内部使用。
参考文献
[1]Szekely, G.J., Rizzo, M.L., 和 Bakirov, N.K. (2007) “通过距离的相关性来测量和测试依赖性”。 统计学年鉴, 第35卷 第6期, 页码2769-2794。
示例
>>> from statsmodels.stats.dist_dependence_measures import ... distance_statistics >>> distance_statistics(np.random.random(1000), np.random.random(1000)) DistDependStat(test_statistic=0.07948284320205831, distance_correlation=0.04269511890990793, distance_covariance=0.008915315092696293, dvar_x=0.20719027438266704, dvar_y=0.21044934264957588, S=0.10892061635588891)
Last update:
Oct 16, 2024