statsmodels.robust.robust_linear_model.RLM

class statsmodels.robust.robust_linear_model.RLM(endog, exog, M=None, missing='none', **kwargs)[source]

稳健线性模型

通过迭代加权最小二乘法估计一个稳健的线性模型,给定一个稳健的准则估计器。

Parameters:
endogarray_like

一个一维的内生响应变量。因变量。

exogarray_like

一个 nobs x k 的数组,其中 nobs 是观测值的数量,k 是回归变量的数量。默认情况下不包含截距,应由用户添加。请参阅 statsmodels.tools.add_constant

Mstatsmodels.robust.norms.RobustNorm, optional

用于降权异常值的稳健准则函数。 当前选项包括 LeastSquares、HuberT、RamsayE、AndrewWave、 TrimmedMean、Hampel 和 TukeyBiweight。默认值为 HuberT()。 有关更多信息,请参阅 statsmodels.robust.norms。

missingstr

可用的选项是‘none’、‘drop’和‘raise’。如果选择‘none’,则不进行nan检查。如果选择‘drop’,则会删除任何包含nan的观测值。如果选择‘raise’,则会引发错误。默认值是‘none’。

Attributes:
df_modelfloat

模型的自由度。回归变量p的数量减去截距的一个。请注意,报告的模型自由度不将截距计为回归变量,尽管模型假设有一个截距。

df_residfloat

残差自由度。观测值数量 n 减去回归变量数量 p。请注意,这里 p 包括截距作为一个自由度。

endogndarray

见上文。 请注意,endog是对数据的引用,因此如果数据已经是一个数组并且它发生了变化,那么endog也会随之改变。

exogndarray

见上文。 请注意,endog是对数据的引用,因此如果数据已经是一个数组并且它发生了变化,那么endog也会随之改变。

Mstatsmodels.robust.norms.RobustNorm

见上文。 鲁棒估计器实例已实例化。

nobsfloat

观测值的数量 n

pinv_wexogndarray

设计/外生数据数组的伪逆。请注意,RLM没有白化方法,因此这只是设计的伪逆。

normalized_cov_paramsndarray

设计/外生数据的相关性归一化协方差。 这大约等于 (X.T X)^(-1)

示例

>>> import statsmodels.api as sm
>>> data = sm.datasets.stackloss.load()
>>> data.exog = sm.add_constant(data.exog)
>>> rlm_model = sm.RLM(data.endog, data.exog,                            M=sm.robust.norms.HuberT())
>>> rlm_results = rlm_model.fit()
>>> rlm_results.params
array([  0.82938433,   0.92606597,  -0.12784672, -41.02649835])
>>> rlm_results.bse
array([ 0.11100521,  0.30293016,  0.12864961,  9.79189854])
>>> rlm_results_HC2 = rlm_model.fit(cov="H2")
>>> rlm_results_HC2.params
array([  0.82938433,   0.92606597,  -0.12784672, -41.02649835])
>>> rlm_results_HC2.bse
array([ 0.11945975,  0.32235497,  0.11796313,  9.08950419])
>>> mod = sm.RLM(data.endog, data.exog, M=sm.robust.norms.Hampel())
>>> rlm_hamp_hub = mod.fit(scale_est=sm.robust.scale.HuberScale())
>>> rlm_hamp_hub.params
array([  0.73175452,   1.25082038,  -0.14794399, -40.27122257])

方法

deviance(tmp_results)

返回M估计器的(未归一化的)对数似然值。

fit([maxiter, tol, scale_est, init, cov, ...])

使用迭代重加权最小二乘法拟合模型。

from_formula(formula, data[, subset, drop_cols])

从公式和数据框创建模型。

hessian(params)

模型的海森矩阵。

information(params)

模型的费舍尔信息矩阵。

initialize()

初始化(可能重新初始化)一个模型实例。

loglike(params)

模型的对数似然值。

predict(params[, exog])

从设计矩阵返回线性预测值。

score(params)

模型的得分向量。

属性

endog_names

内生变量的名称。

exog_names

外生变量的名称。


Last update: Oct 16, 2024