线性回归¶
具有独立同分布误差的线性模型,以及具有异方差性或自相关性的误差。该模块允许通过普通最小二乘法(OLS)、加权最小二乘法(WLS)、广义最小二乘法(GLS)以及具有自相关AR(p)误差的可行广义最小二乘法进行估计。
查看模块参考以获取命令和参数。
示例¶
# Load modules and data
In [1]: import numpy as np
In [2]: import statsmodels.api as sm
In [3]: spector_data = sm.datasets.spector.load()
In [4]: spector_data.exog = sm.add_constant(spector_data.exog, prepend=False)
# Fit and summarize OLS model
In [5]: mod = sm.OLS(spector_data.endog, spector_data.exog)
In [6]: res = mod.fit()
In [7]: print(res.summary())
OLS Regression Results
==============================================================================
Dep. Variable: GRADE R-squared: 0.416
Model: OLS Adj. R-squared: 0.353
Method: Least Squares F-statistic: 6.646
Date: 三, 16 10 2024 Prob (F-statistic): 0.00157
Time: 18:43:13 Log-Likelihood: -12.978
No. Observations: 32 AIC: 33.96
Df Residuals: 28 BIC: 39.82
Df Model: 3
Covariance Type: nonrobust
==============================================================================
coef std err t P>|t| [0.025 0.975]
------------------------------------------------------------------------------
GPA 0.4639 0.162 2.864 0.008 0.132 0.796
TUCE 0.0105 0.019 0.539 0.594 -0.029 0.050
PSI 0.3786 0.139 2.720 0.011 0.093 0.664
const -1.4980 0.524 -2.859 0.008 -2.571 -0.425
==============================================================================
Omnibus: 0.176 Durbin-Watson: 2.346
Prob(Omnibus): 0.916 Jarque-Bera (JB): 0.167
Skew: 0.141 Prob(JB): 0.920
Kurtosis: 2.786 Cond. No. 176.
==============================================================================
Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
详细的示例可以在这里找到:
技术文档¶
假设统计模型为
\(Y = X\beta + \epsilon\), 其中 \(\epsilon\sim N\left(0,\Sigma\right).\)
根据\(\Sigma\)的属性,我们目前有四个类别可用:
GLS : 广义最小二乘法用于任意协方差 \(\Sigma\)
OLS : 普通最小二乘法用于独立同分布误差 \(\Sigma=\textbf{I}\)
WLS : 异方差误差的加权最小二乘法 \(\text{diag}\left (\Sigma\right)\)
GLSAR : 具有自相关AR(p)误差的可行广义最小二乘法 \(\Sigma=\Sigma\left(\rho\right)\)
所有回归模型定义了相同的方法并遵循相同的结构,可以以相似的方式使用。其中一些模型包含额外的特定于模型的方法和属性。
GLS 是其他回归类的超类,除了 RecursiveLS、RollingWLS 和 RollingOLS。
参考文献¶
回归模型的通用参考:
D.C. Montgomery 和 E.A. Peck. “线性回归分析导论”。第2版,Wiley,1992年。
回归模型的计量经济学参考资料:
R.Davidson 和 J.G. MacKinnon。《计量经济学理论与方法》,牛津,2004年。
W.格林。 “计量经济学分析”,第5版,培生教育,2003年。
属性¶
以下是对属性更为详细的描述,这些属性大多适用于所有回归类
- pinv_wexogarray
白化设计矩阵的 p x n Moore-Penrose 伪逆。 它近似等于 \(\left(X^{T}\Sigma^{-1}X\right)^{-1}X^{T}\Psi\),其中 \(\Psi\) 定义为 \(\Psi\Psi^{T}=\Sigma^{-1}\)。
- cholsimgainvarray
满足 \(\Psi\Psi^{T}=\Sigma^{-1}\) 的 n x n 上三角矩阵 \(\Psi^{T}\)。
- df_modelfloat
模型的自由度。这等于p - 1,其中p是回归变量的数量。请注意,截距在这里不被视为使用了一个自由度。
- df_residfloat
残差的自由度。这等于n - p,其中n是观测值的数量,p是参数的数量。请注意,截距在这里被视为使用了一个自由度。
- llffloat
拟合模型的似然函数值。
- nobsfloat
观测值的数量 n
- normalized_cov_paramsarray
一个 p x p 的数组,等于 \((X^{T}\Sigma^{-1}X)^{-1}\)。
- sigmaarray
误差项的 n x n 协方差矩阵: \(\epsilon\sim N\left(0,\Sigma\right)\)。
- wexogarray
白化的设计矩阵 \(\Psi^{T}X\)。
- wendogarray
白化的响应变量 \(\Psi^{T}Y\)。
模块参考¶
模型类¶
|
普通最小二乘法 |
|
广义最小二乘法 |
|
加权最小二乘法 |
|
具有AR协方差结构的一般最小二乘法 |
|
使用Yule-Walker方程从序列中估计AR(p)参数。 |
|
计算Burg的AP(p)参数估计量。 |
|
分位数回归 |
|
递归最小二乘法 |
|
滚动加权最小二乘法 |
|
滚动普通最小二乘法 |
使用高斯核的ProcessCovariance实现。 |
|
|
拟合一个高斯均值/方差回归模型。 |
|
切片逆回归 (SIR) |
|
主海森方向 (PHD) |
|
切片平均方差估计(SAVE) |
结果类¶
拟合线性回归模型会返回一个结果类。OLS有一个特定的结果类,相比于其他线性模型的结果类,它具有一些额外的方法。
|
此类总结了线性回归模型的拟合情况。 |
|
OLS模型的结果类。 |
|
预测结果的类。 |
|
使用正则化估计模型的结果 |
|
QuantReg模型的结果实例 |
|
用于保存递归最小二乘模型拟合结果的类。 |
|
滚动回归的结果 |
|
高斯过程回归模型的结果类。 |
|
用于降维回归的结果类。 |