seaborn.regplot#

seaborn.regplot(data=None, *, x=None, y=None, x_estimator=None, x_bins=None, x_ci='ci', scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None, seed=None, order=1, logistic=False, lowess=False, robust=False, logx=False, x_partial=None, y_partial=None, truncate=True, dropna=True, x_jitter=None, y_jitter=None, label=None, color=None, marker='o', scatter_kws=None, line_kws=None, ax=None)[源代码]#

绘制数据和线性回归模型拟合。

估计回归模型有若干互斥的选项。更多信息请参见 教程

参数:
x, y: 字符串, 序列, 或向量数组

输入变量。如果为字符串,这些应与 data 中的列名相对应。当使用 pandas 对象时,轴将被标记为系列名称。

数据DataFrame

整洁(长格式)数据框,其中每一列是一个变量,每一行是一个观测值。

x_estimator映射向量到标量的可调用对象,可选

将此函数应用于 x 的每个唯一值,并绘制结果估计。当 x 是离散变量时,这非常有用。如果给出了 x_ci ,此估计将通过自助法进行,并绘制置信区间。

x_binsint 或 vector,可选

x 变量分箱为离散的箱子,然后估计中心趋势和置信区间。这种分箱仅影响散点图的绘制方式;回归仍然拟合原始数据。此参数被解释为均匀大小(不必等距)的箱子数量或箱子中心的位置。当使用此参数时,它意味着 x_estimator 的默认值为 numpy.mean

x_ci“ci”, “sd”, int 在 [0, 100] 或 None, 可选

在绘制离散 x 值的中心趋势时使用的置信区间大小。如果为 "ci",则采用 ci 参数的值。如果为 "sd",则跳过自助法并显示每个箱中观测值的标准偏差。

散点图bool, 可选

如果 True,则绘制带有基础观测值(或 x_estimator 值)的散点图。

fit_regbool, 可选

如果 True,估计并绘制一个回归模型,该模型关联 xy 变量。

ciint in [0, 100] or None, optional

回归估计的置信区间大小。这将使用围绕回归线的半透明带绘制。置信区间通过自举法估计;对于大型数据集,建议通过将此参数设置为 None 来避免该计算。

n_bootint, 可选

用于估计 ci 的 bootstrap 重采样次数。默认值试图平衡时间和稳定性;对于图形的“最终”版本,您可能希望增加此值。

units : data 中的变量名, 可选变量名在

如果 xy 观测值嵌套在采样单元内,可以在此处指定这些单元。在计算置信区间时,这将通过执行多层次的bootstrap来考虑,该bootstrap会重新采样单元和观测值(在单元内)。这不会以其他方式影响回归的估计或绘制。

种子int, numpy.random.Generator, 或 numpy.random.RandomState, 可选

用于可重复引导的种子或随机数生成器。

顺序int, 可选

如果 order 大于 1,使用 numpy.polyfit 来估计多项式回归。

物流bool, 可选

如果 True,假设 y 是一个二元变量,并使用 statsmodels 来估计一个逻辑回归模型。请注意,这比线性回归在计算上要复杂得多,因此你可能希望减少自助重采样次数 (n_boot) 或设置 ci 为 None。

lowessbool, 可选

如果 True ,使用 statsmodels 来估计一个非参数的 lowess 模型(局部加权线性回归)。请注意,目前无法为这种模型绘制置信区间。

稳健bool, 可选

如果 True,使用 statsmodels 来估计一个稳健的回归。这将减少离群值的权重。请注意,这比标准的线性回归在计算上要复杂得多,因此您可能希望减少引导重采样次数 (n_boot) 或设置 ci 为 None。

logxbool, 可选

如果 True,估计一个形如 y ~ log(x) 的线性回归,但在输入空间中绘制散点图和回归模型。请注意,x 必须为正数才能正常工作。

{x,y}_partial : data 中的字符串或矩阵字符串在

在绘图前需要从 xy 变量中回归掉的混杂变量。

截断bool, 可选

如果 True ,回归线被数据限制所界定。如果 False ,它延伸到 x 轴的限制。

{x,y}_jitter浮动,可选

将此大小的均匀随机噪声添加到 xy 变量中。噪声是在拟合回归后添加到数据副本中的,并且仅影响散点图的外观。在绘制取离散值的变量时,这可能会有所帮助。

标签字符串

应用于散点图或回归线(如果 scatterFalse)的标签,用于图例中。

颜色matplotlib 颜色

应用于所有绘图元素的颜色;将被传递到 scatter_kwsline_kws 中的颜色所覆盖。

标记matplotlib 标记代码

用于散点图图标的标记。

{scatter,line}_kws字典

传递给 plt.scatterplt.plot 的额外关键字参数。

axmatplotlib 轴, 可选

要在其上绘制图形的 Axes 对象,否则使用当前的 Axes。

返回:
axmatplotlib Axes

包含图形的 Axes 对象。

参见

lmplot

结合 regplot()FacetGrid 来绘制数据集中多个线性关系。

jointplot

结合 regplot()JointGrid`(当使用 ``kind="reg"` 时)。

pairplot

结合 regplot()PairGrid`(当使用 ``kind="reg"` 时)。

residplot

绘制线性回归模型的残差。

注释

函数 regplot()lmplot() 密切相关,但前者是轴级函数,而后者是结合了 regplot()FacetGrid 的图级函数。

通过 jointplot()pairplot() 函数,也可以很容易地将 regplot()JointGridPairGrid 结合起来,尽管这些函数并不直接接受 regplot() 的所有参数。

示例