statsmodels.regression.linear_model.OLS¶
-
class statsmodels.regression.linear_model.OLS(endog, exog=
None, missing='none', hasconst=None, **kwargs)[source]¶ 普通最小二乘法
- Parameters:¶
- endogarray_like
一个一维的内生响应变量。因变量。
- exogarray_like
一个 nobs x k 的数组,其中 nobs 是观测值的数量,k 是回归变量的数量。默认情况下不包含截距,应由用户添加。请参阅
statsmodels.tools.add_constant。- missing
str 可用的选项是‘none’、‘drop’和‘raise’。如果选择‘none’,则不进行nan检查。如果选择‘drop’,则会删除任何包含nan的观测值。如果选择‘raise’,则会引发错误。默认值是‘none’。
- hasconst
Noneor bool 指示RHS是否包含用户提供的常数。如果为True,则不检查常数,k_constant设置为1,所有结果统计量都计算为存在常数。如果为False,则不检查常数,k_constant设置为0。
- **kwargs
在使用公式接口时,用于设置模型属性的额外参数。
- Attributes:¶
- weightsscalar
由于继承自WLS,具有属性 weights = array(1.0)。
注释
除非您使用公式,否则模型不会添加常数。
示例
>>> import statsmodels.api as sm >>> import numpy as np >>> duncan_prestige = sm.datasets.get_rdataset("Duncan", "carData") >>> Y = duncan_prestige.data['income'] >>> X = duncan_prestige.data['education'] >>> X = sm.add_constant(X) >>> model = sm.OLS(Y,X) >>> results = model.fit() >>> results.params const 10.603498 education 0.594859 dtype: float64>>> results.tvalues const 2.039813 education 6.892802 dtype: float64>>> print(results.t_test([1, 0])) Test for Constraints ============================================================================== coef std err t P>|t| [0.025 0.975] ------------------------------------------------------------------------------ c0 10.6035 5.198 2.040 0.048 0.120 21.087 ==============================================================================>>> print(results.f_test(np.identity(2))) <F test: F=array([[159.63031026]]), p=1.2607168903696672e-20, df_denom=43, df_num=2>方法
fit([method, cov_type, cov_kwds, use_t])模型的完整拟合。
fit_regularized([方法, alpha, L1_wt, ...])返回一个正则化的线性回归模型的拟合结果。
from_formula(formula, data[, subset, drop_cols])从公式和数据框创建模型。
get_distribution(params, scale[, exog, ...])构建预测分布的随机数生成器。
hessian(params[, scale])在给定点评估Hessian函数。
hessian_factor(params[, scale, observed])计算Hessian的权重。
information(params)模型的费舍尔信息矩阵。
初始化模型组件。
loglike(params[, scale])OLS模型的似然函数。
predict(params[, exog])从设计矩阵返回线性预测值。
score(params[, scale])在给定点评估分数函数。
whiten(x)OLS模型白化器不执行任何操作。
属性
模型的自由度。
残余自由度。
内生变量的名称。
外生变量的名称。