statsmodels.robust.robust_linear_model.RLM¶
-
class statsmodels.robust.robust_linear_model.RLM(endog, exog, M=
None, missing='none', **kwargs)[source]¶ 稳健线性模型
通过迭代加权最小二乘法估计一个稳健的线性模型,给定一个稳健的准则估计器。
- Parameters:¶
- endogarray_like
一个一维的内生响应变量。因变量。
- exogarray_like
一个 nobs x k 的数组,其中 nobs 是观测值的数量,k 是回归变量的数量。默认情况下不包含截距,应由用户添加。请参阅
statsmodels.tools.add_constant。- M
statsmodels.robust.norms.RobustNorm,optional 用于降权异常值的稳健准则函数。 当前选项包括 LeastSquares、HuberT、RamsayE、AndrewWave、 TrimmedMean、Hampel 和 TukeyBiweight。默认值为 HuberT()。 有关更多信息,请参阅 statsmodels.robust.norms。
- missing
str 可用的选项是‘none’、‘drop’和‘raise’。如果选择‘none’,则不进行nan检查。如果选择‘drop’,则会删除任何包含nan的观测值。如果选择‘raise’,则会引发错误。默认值是‘none’。
- Attributes:¶
- df_model
float 模型的自由度。回归变量p的数量减去截距的一个。请注意,报告的模型自由度不将截距计为回归变量,尽管模型假设有一个截距。
- df_resid
float 残差自由度。观测值数量 n 减去回归变量数量 p。请注意,这里 p 包括截距作为一个自由度。
- endog
ndarray 见上文。 请注意,endog是对数据的引用,因此如果数据已经是一个数组并且它发生了变化,那么endog也会随之改变。
- exog
ndarray 见上文。 请注意,endog是对数据的引用,因此如果数据已经是一个数组并且它发生了变化,那么endog也会随之改变。
- M
statsmodels.robust.norms.RobustNorm 见上文。 鲁棒估计器实例已实例化。
- nobs
float 观测值的数量 n
- pinv_wexog
ndarray 设计/外生数据数组的伪逆。请注意,RLM没有白化方法,因此这只是设计的伪逆。
- normalized_cov_params
ndarray 设计/外生数据的相关性归一化协方差。 这大约等于 (X.T X)^(-1)
- df_model
示例
>>> import statsmodels.api as sm >>> data = sm.datasets.stackloss.load() >>> data.exog = sm.add_constant(data.exog) >>> rlm_model = sm.RLM(data.endog, data.exog, M=sm.robust.norms.HuberT())>>> rlm_results = rlm_model.fit() >>> rlm_results.params array([ 0.82938433, 0.92606597, -0.12784672, -41.02649835]) >>> rlm_results.bse array([ 0.11100521, 0.30293016, 0.12864961, 9.79189854]) >>> rlm_results_HC2 = rlm_model.fit(cov="H2") >>> rlm_results_HC2.params array([ 0.82938433, 0.92606597, -0.12784672, -41.02649835]) >>> rlm_results_HC2.bse array([ 0.11945975, 0.32235497, 0.11796313, 9.08950419]) >>> mod = sm.RLM(data.endog, data.exog, M=sm.robust.norms.Hampel()) >>> rlm_hamp_hub = mod.fit(scale_est=sm.robust.scale.HuberScale()) >>> rlm_hamp_hub.params array([ 0.73175452, 1.25082038, -0.14794399, -40.27122257])方法
deviance(tmp_results)返回M估计器的(未归一化的)对数似然值。
fit([maxiter, tol, scale_est, init, cov, ...])使用迭代重加权最小二乘法拟合模型。
from_formula(formula, data[, subset, drop_cols])从公式和数据框创建模型。
hessian(params)模型的海森矩阵。
information(params)模型的费舍尔信息矩阵。
初始化(可能重新初始化)一个模型实例。
loglike(params)模型的对数似然值。
predict(params[, exog])从设计矩阵返回线性预测值。
score(params)模型的得分向量。
属性
内生变量的名称。
外生变量的名称。