statsmodels.imputation.mice.MICEData.set_imputer¶
-
MICEData.set_imputer(endog_name, formula=
None, model_class=None, init_kwds=None, fit_kwds=None, predict_kwds=None, k_pmm=20, perturbation_method=None, regularized=False)[source]¶ 指定单个变量的插补过程。
- Parameters:¶
- endog_name
str 要插补的变量的名称。
- formula
str 用于插补的条件公式。默认情况下,公式包含数据集中所有其他变量的主效应。公式应仅包含均值结构的表达式,例如使用‘x1 + x2’而不是‘x4 ~ x1 + x2’。
- model_class
statsmodelsmodel 用于插补的条件模型。默认为OLS。更多信息请参见下文。
- init_kwdsdit-like
传递给模型初始化方法的关键字参数。
- fit_kwdsdict-like
传递给模型拟合方法的关键字参数。
- predict_kwdsdict-like
传递给模型预测方法的关键字参数。
- k_pmm
int 确定在使用预测均值匹配时,从多少个邻近观测值中随机抽样。
- perturbation_method
str 可以是‘gaussian’或‘bootstrap’。确定在插补模型中扰动参数的方法。如果为None,则使用在类初始化时指定的默认值。
- regularized
dict 如果 regularized[name]=True,则在为此变量拟合插补模型时,将调用 fit_regularized 而不是 fit。当任何变量的 regularized[name]=True 时,perturbation_method 必须设置为 boot。
- endog_name
注释
- The model class must meet the following conditions:
模型必须有一个‘fit’方法,该方法返回一个对象。
从fit返回的对象必须具有一个params属性,该属性是一个类数组对象。
从fit返回的对象必须有一个cov_params方法,该方法返回一个类似方阵的对象。
模型必须有一个预测方法。
Last update:
Oct 16, 2024