statsmodels.graphics.functional.banddepth

statsmodels.graphics.functional.banddepth(data, method='MBD')[source]

计算一组函数曲线的带深度。

带深度是函数数据的一种顺序统计量(参见fboxplot),带深度越高表示“中心性”越大。类似于标量数据,具有最高带深度的函数曲线称为中位曲线,由前N/2条曲线组成的带称为50%中心区域。

Parameters:
datandarray

用于创建功能箱线图的函数向量。 第一个轴是函数索引,第二个轴是函数定义的轴。 因此 data[0, :] 是第一个功能曲线。

method{‘MBD’, ‘BD2’}, optional

使用原始带深度(J=2)还是修改后的带深度。详情请参见注释。

Returns:
ndarray

功能曲线的深度值。

注释

功能带深度作为功能数据的一种顺序统计量,在[1]中提出,并应用于功能箱线图和袋线图在[2]中。

方法‘BD2’检查每条曲线是否完全位于由两条曲线构建的带内。所有曲线集合中两条曲线的排列组合都被使用,并且带深度被归一化为1。由于曲线必须完全落在带内,这种方法会产生很多并列情况。

方法‘MBD’类似于‘BD2’,但检查曲线落在带内的部分。因此,它生成的并列情况非常少。

该算法使用了[3]中提出的高效实现。

参考文献

[1] (1,2)

S. Lopez-Pintado 和 J. Romo,“关于函数数据深度的概念”,《美国统计协会杂志》,第104卷,第718-734页,2009年。

[2]

Y. Sun 和 M.G. Genton,“功能箱线图”,《计算与图形统计杂志》,第20卷,第1-19页,2011年。

[3]

Y. Sun, M. G. Gentonb 和 D. W. Nychkac, “大规模函数数据集的带深度精确快速计算:一百万条曲线能多快排序?”, 《统计研究快速传播杂志》, 第1卷, 第68-74页, 2012年.


Last update: Oct 16, 2024