statsmodels.graphics.regressionplots.influence_plot¶
-
statsmodels.graphics.regressionplots.influence_plot(results, external=
True, alpha=0.05, criterion='cooks', size=48, plot_alpha=0.75, ax=None, **kwargs)[source]¶ 回归中的影响图。绘制学生化残差与杠杆的对比图。
- Parameters:¶
- results
Results 拟合回归模型的结果。
- externalbool
使用外部或内部学生化残差。建议将外部设置为True。
- alpha
float 用于识别大标准化残差的alpha值。大意味着 abs(resid_studentized) > t.ppf(1-alpha/2, dof=results.df_resid)
- criterion
str{‘DFFITS’, ‘Cooks’} 基于哪个标准来确定点的大小。选项是 DFFITS 或 Cook’s D。
- size
float 范围 criterion 被映射到 10**2 - size**2 点。
- plot_alpha
float 绘制点的alpha值。
- ax
AxesSubplot matplotlib Axes 的一个实例。
- **kwargs
传递给plot的附加参数。
- results
- Returns:¶
Figure包含Axes的matplotlib图形。
注释
观测值的行标签,其中杠杆作用(通过帽子矩阵的对角线测量)高或残差大,因为大残差和高影响值的组合表示一个影响点。大残差的值可以通过alpha参数进行控制。大杠杆点被识别为hat_i > 2 * (df_model + 1)/nobs。
示例
使用从州犯罪数据集构建的模型,绘制回归中的影响。具有高杠杆或大残差的观测值将在图中标注,以显示潜在的影响点。
>>> import statsmodels.api as sm >>> import matplotlib.pyplot as plt >>> import statsmodels.formula.api as smf>>> crime_data = sm.datasets.statecrime.load_pandas() >>> results = smf.ols('murder ~ hs_grad + urban + poverty + single', ... data=crime_data.data).fit() >>> sm.graphics.influence_plot(results) >>> plt.show()
Last update:
Oct 16, 2024