statsmodels.非参数.核回归.KernelReg

class statsmodels.nonparametric.kernel_regression.KernelReg(endog, exog, var_type, reg_type='ll', bw='cv_ls', ckertype='gaussian', okertype='wangryzin', ukertype='aitchisonaitken', defaults=None)[source]

非参数核回归类。

计算条件均值 E[y|X] 其中 y = g(X) + e。 请注意,这里提供的“局部常数”类型的回归也称为Nadaraya-Watson核回归;“局部线性”是其扩展,在支持边缘的偏差问题上表现更好。请注意,指定自定义核仅适用于“局部线性”核回归。例如,自定义 tricube 核会产生LOESS回归。

Parameters:
endogarray_like

这是因变量。

exogarray_like

自变量的训练数据 列表中的每个元素都是一个单独的变量

var_typestr

变量的类型,每个变量一个字符:

  • c: 连续

  • u: 无序(离散)

  • o: 有序 (离散)

reg_type{‘lc’, ‘ll’}, optional

回归估计器的类型。‘lc’ 表示局部常数,‘ll’ 表示局部线性估计器。默认是 ‘ll’

bwstr or array_like, optional

用户指定的带宽或带宽选择方法。如果是字符串,有效值为‘cv_ls’(最小二乘交叉验证)和‘aic’(AIC Hurvich带宽估计)。默认值为‘cv_ls’。用户指定的带宽必须与变量数量相同。

ckertypestr, optional

用于连续变量的核函数。

okertypestr, optional

用于有序离散变量的核函数。

ukertypestr, optional

用于无序离散变量的核函数。

defaultsEstimatorSettings instance, optional

高效带宽估计的默认值。

Attributes:
bwarray_like

带宽参数。

方法

aic_hurvich(bw[, func])

计算用于带宽估计的AIC Hurvich准则。

cv_loo(bw, func)

使用留一法估计的交叉验证函数。

fit([data_predict])

返回在data_predict点处的均值和边际效应。

loo_likelihood()

r_squared()

返回非参数回归的R平方值。

sig_test(var_pos[, nboot, nested_res, pivot])

回归中变量的显著性检验。


Last update: Oct 16, 2024