statsmodels.stats.outliers_influence.OLSInfluence¶
- class statsmodels.stats.outliers_influence.OLSInfluence(results)[source]¶
类用于计算OLS结果的异常值和影响度量
- Parameters:¶
- results
RegressionResults 目前假设结果来自OLS回归
- results
- Attributes:¶
- cooks_distance
库克距离
使用原始结果,无nobs循环
- cov_ratio
LOOO 与原始数据之间的协方差比率
这使用了从留一法估计中得到的参数协方差估计的行列式。 需要为观测值进行留一法循环
det_cov_params_not_obsi所有LOOO回归的cov_params的行列式
- dfbeta
dfbetas
使用留一观测法循环的结果
- dfbetas
dfbetas
使用留一观测法循环的结果
- dffits
观察值影响力的dffits度量
基于resid_studentized_external, 使用来自留一观测法循环的结果
建议对dffits大于阈值2 sqrt{k / n}的观测值进行调查,其中k是参数的数量。
dffits : 浮点数 dffits_threshold : 浮点数
- dffits_internal
观察值影响力的dffits度量
基于 resid_studentized_internal 使用原始结果,无 nobs 循环
- ess_press
PRESS残差的误差平方和
- hat_diag_factor
用于影响分析的帽子矩阵对角线的因子
这可能对内部重用有用 h / (1 - h)
- hat_matrix_diag
OLS的hat_matrix的对角线
暂时在这里计算,这应该放到模型类中
- influence
影响度量
匹配gretl报告的影响度量 u * h / (1 - h) 其中u是残差,h是hat_matrix的对角线
params_not_obsi所有LOOO回归的参数估计
- resid_press
PRESS 残差
- resid_std
残差标准差的估计
残差方差
- resid_studentized
使用OLS方差的学生化残差
为了与MLEInfluence兼容,resid_studentized_internal的别名使用了原始估计中的sigma,并且不需要进行留一法循环
- resid_studentized_external
使用LOOO方差的学生化残差
这使用了来自留一法估计的sigma
需要为观测值进行留一法循环
- resid_studentized_internal
使用OLS方差的学生化残差
这使用来自原始估计的sigma 不需要留一出的循环
- resid_var
残差方差的估计
sigma2 = sigma2_OLS * (1 - hii)其中 hii 是帽子矩阵的对角线
- sigma2_not_obsi
所有LOOO回归的误差方差
这是每个辅助回归中的‘mse_resid’。
使用留一观测法循环的结果
注释
结果的一部分可以在没有任何辅助回归的情况下计算(其中一些在名称中带有_internal后缀。其他统计数据需要留一观测法(LOOO)辅助回归,并且会更慢(主要是名称中带有_external后缀的结果)。辅助LOOO回归仅存储所需的结果。
使用LOO度量目前仅建议在数据集不太大的情况下使用。一种可能的LOOO度量方法是通过内部度量识别可能的问题观测值,然后仅对可能是异常值的观测值运行留一观测法。(然而,这尚未以自动化的方式实现。)
这应该扩展到一般的最小二乘法。
目前不使用留一变量法(LOVO)辅助回归。
方法
get_resid_studentized_external([sigma])计算学生化残差
plot_index([y_var, 阈值, 标题, 轴, 索引])影响属性的索引图
plot_influence([external, alpha, criterion, ...])回归中的影响图。
创建一个包含所有可用影响结果的DataFrame。
summary_table([float_fmt])创建一个包含所有影响和异常值度量的汇总表
属性
库克距离
LOOO 与原始数据之间的协方差比率
所有LOOO回归的cov_params的行列式
dfbetas
使用留一观测法循环的结果
观察值影响力的dffits度量
观察值影响力的dffits度量
PRESS残差的误差平方和
用于影响分析的帽子矩阵对角线的因子
OLS的hat_matrix的对角线
影响度量
所有LOOO回归的参数估计
PRESS 残差
残差标准差的估计
使用OLS方差的学生化残差
使用LOOO方差的学生化残差
使用OLS方差的学生化残差
残差方差的估计
所有LOOO回归的误差方差