statsmodels.graphics.regressionplots.influence_plot

statsmodels.graphics.regressionplots.influence_plot(results, external=True, alpha=0.05, criterion='cooks', size=48, plot_alpha=0.75, ax=None, **kwargs)[source]

回归中的影响图。绘制学生化残差与杠杆的对比图。

Parameters:
resultsResults

拟合回归模型的结果。

externalbool

使用外部或内部学生化残差。建议将外部设置为True。

alphafloat

用于识别大标准化残差的alpha值。大意味着 abs(resid_studentized) > t.ppf(1-alpha/2, dof=results.df_resid)

criterionstr {‘DFFITS’, ‘Cooks’}

基于哪个标准来确定点的大小。选项是 DFFITS 或 Cook’s D。

sizefloat

范围 criterion 被映射到 10**2 - size**2 点。

plot_alphafloat

绘制点的alpha值。

axAxesSubplot

matplotlib Axes 的一个实例。

**kwargs

传递给plot的附加参数。

Returns:
Figure

包含Axes的matplotlib图形。

注释

观测值的行标签,其中杠杆作用(通过帽子矩阵的对角线测量)高或残差大,因为大残差和高影响值的组合表示一个影响点。大残差的值可以通过alpha参数进行控制。大杠杆点被识别为hat_i > 2 * (df_model + 1)/nobs。

示例

使用从州犯罪数据集构建的模型,绘制回归中的影响。具有高杠杆或大残差的观测值将在图中标注,以显示潜在的影响点。

>>> import statsmodels.api as sm
>>> import matplotlib.pyplot as plt
>>> import statsmodels.formula.api as smf
>>> crime_data = sm.datasets.statecrime.load_pandas()
>>> results = smf.ols('murder ~ hs_grad + urban + poverty + single',
...                   data=crime_data.data).fit()
>>> sm.graphics.influence_plot(results)
>>> plt.show()

(源代码, png, 高分辨率png, pdf)

../_images/graphics_regression_influence.png

Last update: Oct 16, 2024