statsmodels.robust.robust_linear_model.RLM¶

class statsmodels.robust.robust_linear_model.RLM(endog, exog, M=None, missing='none', **kwargs)[source]¶

稳健线性模型

通过迭代加权最小二乘法估计一个稳健的线性模型，给定一个稳健的准则估计器。

Parameters:¶

endogarray_like: 一个一维的内生响应变量。因变量。
exogarray_like: 一个 nobs x k 的数组，其中 nobs 是观测值的数量，k 是回归变量的数量。默认情况下不包含截距，应由用户添加。请参阅 statsmodels.tools.add_constant。
Mstatsmodels.robust.norms.RobustNorm, optional: 用于降权异常值的稳健准则函数。当前选项包括 LeastSquares、HuberT、RamsayE、AndrewWave、 TrimmedMean、Hampel 和 TukeyBiweight。默认值为 HuberT()。有关更多信息，请参阅 statsmodels.robust.norms。
missingstr: 可用的选项是‘none’、‘drop’和‘raise’。如果选择‘none’，则不进行nan检查。如果选择‘drop’，则会删除任何包含nan的观测值。如果选择‘raise’，则会引发错误。默认值是‘none’。

Attributes:¶

df_modelfloat: 模型的自由度。回归变量p的数量减去截距的一个。请注意，报告的模型自由度不将截距计为回归变量，尽管模型假设有一个截距。
df_residfloat: 残差自由度。观测值数量 n 减去回归变量数量 p。请注意，这里 p 包括截距作为一个自由度。
endogndarray: 见上文。请注意，endog是对数据的引用，因此如果数据已经是一个数组并且它发生了变化，那么endog也会随之改变。
exogndarray: 见上文。请注意，endog是对数据的引用，因此如果数据已经是一个数组并且它发生了变化，那么endog也会随之改变。
Mstatsmodels.robust.norms.RobustNorm: 见上文。鲁棒估计器实例已实例化。
nobsfloat: 观测值的数量 n
pinv_wexogndarray: 设计/外生数据数组的伪逆。请注意，RLM没有白化方法，因此这只是设计的伪逆。
normalized_cov_paramsndarray: 设计/外生数据的相关性归一化协方差。这大约等于 (X.T X)^(-1)

示例

>>> import statsmodels.api as sm
>>> data = sm.datasets.stackloss.load()
>>> data.exog = sm.add_constant(data.exog)
>>> rlm_model = sm.RLM(data.endog, data.exog,                            M=sm.robust.norms.HuberT())

>>> rlm_results = rlm_model.fit()
>>> rlm_results.params
array([  0.82938433,   0.92606597,  -0.12784672, -41.02649835])
>>> rlm_results.bse
array([ 0.11100521,  0.30293016,  0.12864961,  9.79189854])
>>> rlm_results_HC2 = rlm_model.fit(cov="H2")
>>> rlm_results_HC2.params
array([  0.82938433,   0.92606597,  -0.12784672, -41.02649835])
>>> rlm_results_HC2.bse
array([ 0.11945975,  0.32235497,  0.11796313,  9.08950419])
>>> mod = sm.RLM(data.endog, data.exog, M=sm.robust.norms.Hampel())
>>> rlm_hamp_hub = mod.fit(scale_est=sm.robust.scale.HuberScale())
>>> rlm_hamp_hub.params
array([  0.73175452,   1.25082038,  -0.14794399, -40.27122257])

方法

`deviance`(tmp_results)	返回M估计器的（未归一化的）对数似然值。
`fit`([maxiter, tol, scale_est, init, cov, ...])	使用迭代重加权最小二乘法拟合模型。
`from_formula`(formula, data[, subset, drop_cols])	从公式和数据框创建模型。
`hessian`(params)	模型的海森矩阵。
`information`(params)	模型的费舍尔信息矩阵。
`initialize`()	初始化（可能重新初始化）一个模型实例。
`loglike`(params)	模型的对数似然值。
`predict`(params[, exog])	从设计矩阵返回线性预测值。
`score`(params)	模型的得分向量。

属性

`endog_names`	内生变量的名称。
`exog_names`	外生变量的名称。

Last update: Oct 16, 2024