statsmodels.graphics.regressionplots.plot_ceres_residuals

statsmodels.graphics.regressionplots.plot_ceres_residuals(results, focus_exog, frac=0.66, cond_means=None, ax=None)[source]

条件期望部分残差(CERES)图。

为拟合的回归模型生成一个CERES图。

Parameters:
resultsResults

拟合回归模型的结果实例。

focus_exog{int, str}

结果模型外生变量的列索引,或变量名称,指示在回归中要评估其角色的变量。

fracfloat

用于CERES分析中调整模型的Lowess调优参数。如果提供了cond_means,则不使用。

cond_meansarray_like, optional

如果提供,此数组的列将跨越条件均值 E[exog | focus exog] 的空间,其中 exog 的范围覆盖了 exog 的一些或所有列(不包括 focus exog)。

axmatplotlib.Axes instance, optional

绘制图形的坐标轴。如果未提供,则创建一个新的坐标轴实例。

Returns:
Figure

绘制偏残差图的图形。

注释

cond_means 旨在捕捉 E[x1 | x2] 的行为,其中 x2 是关注的自变量,x1 是所有其他自变量。如果所有条件均值关系都是线性的,则将 cond_means 设置为关注的自变量就足够了。或者,cond_means 可以由一个或多个包含关注自变量的函数变换(例如 x2^2)的列组成,这些变换被认为能够捕捉 E[x1 | x2]。

如果对E[x1 | x2]的形式一无所知或没有怀疑,请将cond_means设置为None,它将通过将每个非焦点自变量与焦点自变量进行平滑处理来估计。frac的值控制这些lowess平滑。

如果 cond_means 仅包含焦点自变量,则结果等同于偏残差图。

如果认为焦点变量与其他外生变量无关,cond_means 可以设置为一个(空的)nx0数组。

参考文献

[1]

RD Cook 和 R Croos-Dabrera (1998)。广义线性模型中的偏残差图。美国统计协会杂志,93:442。

[2]

RD Cook (1993). 偏残差图. Technometrics 35:4.

示例

使用从州犯罪数据集构建的模型,以贫困率为焦点变量绘制CERES图。

>>> import statsmodels.api as sm
>>> import matplotlib.pyplot as plt
>>> import statsmodels.formula.api as smf
>>> from statsmodels.graphics.regressionplots import plot_ceres_residuals
>>> crime_data = sm.datasets.statecrime.load_pandas()
>>> results = smf.ols('murder ~ hs_grad + urban + poverty + single',
...                   data=crime_data.data).fit()
>>> plot_ceres_residuals(results, 'poverty')
>>> plt.show()

(源代码, png, 高分辨率png, pdf)

../_images/graphics_regression_ceres_residuals.png

Last update: Oct 16, 2024