statsmodels.regression.linear_model.OLS

class statsmodels.regression.linear_model.OLS(endog, exog=None, missing='none', hasconst=None, **kwargs)[source]

普通最小二乘法

Parameters:
endogarray_like

一个一维的内生响应变量。因变量。

exogarray_like

一个 nobs x k 的数组,其中 nobs 是观测值的数量,k 是回归变量的数量。默认情况下不包含截距,应由用户添加。请参阅 statsmodels.tools.add_constant

missingstr

可用的选项是‘none’、‘drop’和‘raise’。如果选择‘none’,则不进行nan检查。如果选择‘drop’,则会删除任何包含nan的观测值。如果选择‘raise’,则会引发错误。默认值是‘none’。

hasconstNone or bool

指示RHS是否包含用户提供的常数。如果为True,则不检查常数,k_constant设置为1,所有结果统计量都计算为存在常数。如果为False,则不检查常数,k_constant设置为0。

**kwargs

在使用公式接口时,用于设置模型属性的额外参数。

Attributes:
weightsscalar

由于继承自WLS,具有属性 weights = array(1.0)。

另请参阅

WLS

使用加权最小二乘法拟合线性模型。

GLS

使用广义最小二乘法拟合线性模型。

注释

除非您使用公式,否则模型不会添加常数。

示例

>>> import statsmodels.api as sm
>>> import numpy as np
>>> duncan_prestige = sm.datasets.get_rdataset("Duncan", "carData")
>>> Y = duncan_prestige.data['income']
>>> X = duncan_prestige.data['education']
>>> X = sm.add_constant(X)
>>> model = sm.OLS(Y,X)
>>> results = model.fit()
>>> results.params
const        10.603498
education     0.594859
dtype: float64
>>> results.tvalues
const        2.039813
education    6.892802
dtype: float64
>>> print(results.t_test([1, 0]))
                             Test for Constraints
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
c0            10.6035      5.198      2.040      0.048       0.120      21.087
==============================================================================
>>> print(results.f_test(np.identity(2)))
<F test: F=array([[159.63031026]]), p=1.2607168903696672e-20,
 df_denom=43, df_num=2>

方法

fit([method, cov_type, cov_kwds, use_t])

模型的完整拟合。

fit_regularized([方法, alpha, L1_wt, ...])

返回一个正则化的线性回归模型的拟合结果。

from_formula(formula, data[, subset, drop_cols])

从公式和数据框创建模型。

get_distribution(params, scale[, exog, ...])

构建预测分布的随机数生成器。

hessian(params[, scale])

在给定点评估Hessian函数。

hessian_factor(params[, scale, observed])

计算Hessian的权重。

information(params)

模型的费舍尔信息矩阵。

initialize()

初始化模型组件。

loglike(params[, scale])

OLS模型的似然函数。

predict(params[, exog])

从设计矩阵返回线性预测值。

score(params[, scale])

在给定点评估分数函数。

whiten(x)

OLS模型白化器不执行任何操作。

属性

df_model

模型的自由度。

df_resid

残余自由度。

endog_names

内生变量的名称。

exog_names

外生变量的名称。


Last update: Oct 16, 2024