statsmodels.stats.outliers_influence.GLMInfluence

class statsmodels.stats.outliers_influence.GLMInfluence(results, resid=None, endog=None, exog=None, hat_matrix_diag=None, cov_params=None, scale=None)[source]

影响和异常值度量(实验性)

这使用了部分特定于GLM的公式,特别是cooks_distance基于hessian,即观察到的或预期的信息矩阵,而不是基于cov_params,这与MLEInfluence相反。参数变化、拟合值变化和线性预测器变化的标准化基于cov_params。

Parameters:
resultsinstance of results class

这仅适用于具有必要辅助方法的模型和结果类。

other arguments are only to override default behavior and are used instead
of the corresponding attribute of the results class.
By default resid_pearson is used as resid.
Attributes:
dbetas

参数变化除以完整模型结果中的参数标准误差,bse

d_fittedvalues_scaled

拟合值的变化量按标准误差缩放。

d_linpred

线性预测的变化

d_linpred_scale

基于cov_params的预测的标准误差缩放的线性预测的局部变化。

注释

当使用偏移或曝光时,尚未对其正确性进行测试,尽管代码应该支持这些功能。

一些GLM特定的度量,如d_deviance,仍然缺失。

计算显式的留一观测法(LOOO)循环是包含在内的,但目前没有从中计算影响度量。

方法

plot_index([y_var, 阈值, 标题, ax, idx])

影响属性的索引图

plot_influence([external, alpha, criterion, ...])

回归中的影响图。

resid_score([joint, index, studentize])

通过逆Hessian缩放的得分观测值。

resid_score_factor()

得分残差除以Hessian因子的平方根。

summary_frame()

创建一个包含影响结果的DataFrame。

属性

cooks_distance

库克距离

d_fittedvalues

预期响应的变化,拟合值。

d_fittedvalues_scaled

拟合值的变化量按标准误差缩放。

d_linpred

线性预测的变化

d_linpred_scaled

线性预测值的变化按标准误差缩放

d_params

参数估计的变化

dfbetas

参数估计的缩放变化。

hat_matrix_diag

广义线性模型(GLM)的帽子矩阵的对角线

hat_matrix_exog_diag

使用仅包含外生变量的hat_matrix的对角线,如在OLS中

params_one

基于一步近似法的参数估计。

resid_studentized

内部学生化皮尔逊残差


Last update: Oct 16, 2024