statsmodels.非参数.核密度.估计器设置

class statsmodels.nonparametric.kernel_density.EstimatorSettings(efficient=False, randomize=False, n_res=25, n_sub=50, return_median=True, return_only_bw=False, n_jobs=-1)[source]

用于指定密度估计或回归设置的对象。

EstimatorSettings 有几个属性与 KDEMultivariateKDEMultivariateConditionalKernelRegCensoredKernelReg 类的带宽估计行为相关。

Parameters:
efficientbool, optional

如果为真,带宽估计将高效进行——通过取较小的子样本并估计每个子样本的缩放因子。这对于大样本(nobs >> 300)和/或多变量(k_vars > 3)非常有用。如果为假(默认),则同时使用所有数据。

randomizebool, optional

如果为True,则通过从完整样本中随机抽取(有放回)大小为n_subn_res个子样本进行带宽估计。如果设置为False(默认值),则通过将完整样本切片为大小为n_sub的子样本进行估计,以确保所有样本都被使用一次。

n_subint, optional

子样本的大小。默认值为50。

n_resint, optional

用于估计带宽的随机重采样次数。 仅在 randomize == True 时生效。默认值为 25。

return_medianbool, optional

如果为 True(默认),估计器使用每个子样本的所有缩放因子的中位数来估计全样本的带宽。如果为 False,估计器使用均值。

return_only_bwbool, optional

如果为真,估计器将使用带宽而不是缩放因子。这在理论上没有依据。应仅用于实验。

n_jobsint, optional

用于并行估计的作业数量 joblib.Parallel。默认值为 -1,表示 n_cores - 1,其中 n_cores 是可用 CPU 核心的数量。 有关更多详细信息,请参阅 joblib 文档

示例

>>> settings = EstimatorSettings(randomize=True, n_jobs=3)
>>> k_dens = KDEMultivariate(data, var_type, defaults=settings)

方法


Last update: Oct 16, 2024