statsmodels.stats.outliers_influence.MLEInfluence¶
-
class statsmodels.stats.outliers_influence.MLEInfluence(results, resid=
None, endog=None, exog=None, hat_matrix_diag=None, cov_params=None, scale=None)[source]¶ 全球影响力和异常值测量(实验性)
- Parameters:¶
- results
instanceofresultsclass 这仅适用于具有必要辅助方法的模型和结果类。
- other arguments
这些仅用于覆盖默认行为,并用于替代结果类中相应的属性。默认情况下,resid_pearson 用作 resid。
- results
- Attributes:¶
- hat_matrix_diag (hii)
Thisisthegeneralizedleveragecomputedasthe 拟合值(预测均值)对每个观测值的观测响应的局部导数。 由于不可微性,零膨胀模型不可用。
- d_params
ChangeinparameterscomputedwithoneNewtonstepusingthe 通过除以 (1 - hii) 修正的完整 Hessian 矩阵。 如果 hat_matrix_diag 不可用,则不包括除以 (1 - hii) 的操作。
- dbetas
changeinparametersdividedbythestandarderrorofparameters 从完整模型结果中,
bse。- cooks_distance
quadraticformforchangeinparametersweightedby cov_params来自完整模型的除以变量数量。 它包括基于F分布的p值,这些p值仅在线性高斯模型之外是近似的。- resid_studentized
InthegeneralMLEcaseresid_studentizedare 根据由Hessian因子缩放的得分残差和杠杆计算得出。这不会使用
cov_params。- d_fittedvalues
localchangeofexpectedmeangiventhechangeinthe 参数如在
d_params中计算的那样。d_fittedvalues_scaledsameasd_fittedvaluesbutscaledbythestandard拟合值的变化量按标准误差缩放。
- params_one
istheonestepparameterestimatecomputedasparams 从完整样本中减去
d_params。
- hat_matrix_diag (hii)
注释
MLEInfluence 使用基于最大似然模型的通用定义。
MLEInfluence 对于规范链接(已验证适用于 GLM 二项分布、泊松分布和高斯分布)产生与 GLMInfluence 相同的结果。对于非规范链接或使用稳健的 cov_type 时,会有一些差异。例如,在 Probit 情况下,广义杠杆与 GLM 帽子矩阵的定义不同,这对应于具有非规范链接的二项分布族。
扩展到非标准模型,例如多链接模型如BetaModel和零膨胀模型,仍然是实验性的,可能仍会发生变化。 此外,零膨胀模型和一些阈值模型在广义杠杆中存在不可微性。如何处理这种情况也可能发生变化。
警告:这对于目前不支持约束或惩罚模型,例如使用fit_constrained或fit_regularized估计的模型。
当使用偏移或曝光时,尚未对其正确性进行测试,尽管代码应该支持这些功能。
状态: 实验性, 此类将需要更改以支持不同类型的模型,例如 离散.NegativeBinomial中的额外参数或像 ZeroInflatedPoisson这样的两部分模型。
方法
plot_index([y_var, 阈值, 标题, ax, idx])影响属性的索引图
plot_influence([external, alpha, criterion, ...])回归中的影响图。
resid_score([joint, index, studentize])通过逆Hessian缩放的得分观测值。
得分残差除以Hessian因子的平方根。
创建一个包含影响结果的DataFrame。
属性
库克距离和p值。
预期响应的变化,拟合值。
拟合值的变化量按标准误差缩放。
删除观测值时参数估计的近似变化。
参数估计的缩放变化。
广义杠杆的斜对角线
使用仅包含外生变量的hat_matrix的对角线,如在OLS中
基于一步近似法的参数估计。
学生化的默认残差。