statsmodels.nonparametric.kernel_density.KDEMultivariateConditional.imse

KDEMultivariateConditional.imse(bw)[source]

条件核密度估计的积分均方误差。

Parameters:
bwarray_like

带宽参数。

Returns:
CVfloat

交叉验证目标函数。

注释

更多详情请参见[1]的第156-166页。关于如何处理混合变量类型的详细信息,请参见[2]

混合变量类型的交叉验证目标函数的公式是:

\[CV(h,\lambda)=\frac{1}{n}\sum_{l=1}^{n} \frac{G_{-l}(X_{l})}{\left[\mu_{-l}(X_{l})\right]^{2}}- \frac{2}{n}\sum_{l=1}^{n}\frac{f_{-l}(X_{l},Y_{l})}{\mu_{-l}(X_{l})}\]

哪里

\[G_{-l}(X_{l}) = n^{-2}\sum_{i\neq l}\sum_{j\neq l} K_{X_{i},X_{l}} K_{X_{j},X_{l}}K_{Y_{i},Y_{j}}^{(2)}\]

其中 \(K_{X_{i},X_{l}}\) 是多元乘积核, \(\mu_{-l}(X_{l})\) 是pdf的留一法估计量。

\(K_{Y_{i},Y_{j}}^{(2)}\) 是卷积核。

通过 GenericKDE 类的 _cv_ls 方法最小化函数值,以返回最小化估计概率密度与“真实”概率密度之间距离的带宽估计值。

参考文献

[1]

拉辛, J., 李, Q. 非参数计量经济学: 理论与实践. 普林斯顿大学出版社. (2007)

[2]

Racine, J., Li, Q. “非参数估计具有分类和连续数据的分布。” 工作论文。(2000)


Last update: Oct 16, 2024