statsmodels.stats.outliers_influence.OLSInfluence

class statsmodels.stats.outliers_influence.OLSInfluence(results)[source]

类用于计算OLS结果的异常值和影响度量

Parameters:
resultsRegressionResults

目前假设结果来自OLS回归

Attributes:
cooks_distance

库克距离

使用原始结果,无nobs循环

cov_ratio

LOOO 与原始数据之间的协方差比率

这使用了从留一法估计中得到的参数协方差估计的行列式。 需要为观测值进行留一法循环

det_cov_params_not_obsi

所有LOOO回归的cov_params的行列式

dfbeta

dfbetas

使用留一观测法循环的结果

dfbetas

dfbetas

使用留一观测法循环的结果

dffits

观察值影响力的dffits度量

基于resid_studentized_external, 使用来自留一观测法循环的结果

建议对dffits大于阈值2 sqrt{k / n}的观测值进行调查,其中k是参数的数量。

dffits : 浮点数 dffits_threshold : 浮点数

维基百科

dffits_internal

观察值影响力的dffits度量

基于 resid_studentized_internal 使用原始结果,无 nobs 循环

ess_press

PRESS残差的误差平方和

hat_diag_factor

用于影响分析的帽子矩阵对角线的因子

这可能对内部重用有用 h / (1 - h)

hat_matrix_diag

OLS的hat_matrix的对角线

暂时在这里计算,这应该放到模型类中

influence

影响度量

匹配gretl报告的影响度量 u * h / (1 - h) 其中u是残差,h是hat_matrix的对角线

params_not_obsi

所有LOOO回归的参数估计

resid_press

PRESS 残差

resid_std

残差标准差的估计

残差方差

resid_studentized

使用OLS方差的学生化残差

为了与MLEInfluence兼容,resid_studentized_internal的别名使用了原始估计中的sigma,并且不需要进行留一法循环

resid_studentized_external

使用LOOO方差的学生化残差

这使用了来自留一法估计的sigma

需要为观测值进行留一法循环

resid_studentized_internal

使用OLS方差的学生化残差

这使用来自原始估计的sigma 不需要留一出的循环

resid_var

残差方差的估计

sigma2 = sigma2_OLS * (1 - hii)

其中 hii 是帽子矩阵的对角线

sigma2_not_obsi

所有LOOO回归的误差方差

这是每个辅助回归中的‘mse_resid’。

使用留一观测法循环的结果

注释

结果的一部分可以在没有任何辅助回归的情况下计算(其中一些在名称中带有_internal后缀。其他统计数据需要留一观测法(LOOO)辅助回归,并且会更慢(主要是名称中带有_external后缀的结果)。辅助LOOO回归仅存储所需的结果。

使用LOO度量目前仅建议在数据集不太大的情况下使用。一种可能的LOOO度量方法是通过内部度量识别可能的问题观测值,然后仅对可能是异常值的观测值运行留一观测法。(然而,这尚未以自动化的方式实现。)

这应该扩展到一般的最小二乘法。

目前不使用留一变量法(LOVO)辅助回归。

方法

get_resid_studentized_external([sigma])

计算学生化残差

plot_index([y_var, 阈值, 标题, 轴, 索引])

影响属性的索引图

plot_influence([external, alpha, criterion, ...])

回归中的影响图。

summary_frame()

创建一个包含所有可用影响结果的DataFrame。

summary_table([float_fmt])

创建一个包含所有影响和异常值度量的汇总表

属性

cooks_distance

库克距离

cov_ratio

LOOO 与原始数据之间的协方差比率

det_cov_params_not_obsi

所有LOOO回归的cov_params的行列式

dfbeta

dfbetas

dfbetas

使用留一观测法循环的结果

dffits

观察值影响力的dffits度量

dffits_internal

观察值影响力的dffits度量

ess_press

PRESS残差的误差平方和

hat_diag_factor

用于影响分析的帽子矩阵对角线的因子

hat_matrix_diag

OLS的hat_matrix的对角线

influence

影响度量

params_not_obsi

所有LOOO回归的参数估计

resid_press

PRESS 残差

resid_std

残差标准差的估计

resid_studentized

使用OLS方差的学生化残差

resid_studentized_external

使用LOOO方差的学生化残差

resid_studentized_internal

使用OLS方差的学生化残差

resid_var

残差方差的估计

sigma2_not_obsi

所有LOOO回归的误差方差


Last update: Oct 16, 2024