seaborn.regplot#
- seaborn.regplot(data=None, *, x=None, y=None, x_estimator=None, x_bins=None, x_ci='ci', scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None, seed=None, order=1, logistic=False, lowess=False, robust=False, logx=False, x_partial=None, y_partial=None, truncate=True, dropna=True, x_jitter=None, y_jitter=None, label=None, color=None, marker='o', scatter_kws=None, line_kws=None, ax=None)[源代码]#
绘制数据和线性回归模型拟合。
估计回归模型有若干互斥的选项。更多信息请参见 教程。
- 参数:
- x, y: 字符串, 序列, 或向量数组
输入变量。如果为字符串,这些应与
data中的列名相对应。当使用 pandas 对象时,轴将被标记为系列名称。- 数据DataFrame
整洁(长格式)数据框,其中每一列是一个变量,每一行是一个观测值。
- x_estimator映射向量到标量的可调用对象,可选
将此函数应用于
x的每个唯一值,并绘制结果估计。当x是离散变量时,这非常有用。如果给出了x_ci,此估计将通过自助法进行,并绘制置信区间。- x_binsint 或 vector,可选
将
x变量分箱为离散的箱子,然后估计中心趋势和置信区间。这种分箱仅影响散点图的绘制方式;回归仍然拟合原始数据。此参数被解释为均匀大小(不必等距)的箱子数量或箱子中心的位置。当使用此参数时,它意味着x_estimator的默认值为numpy.mean。- x_ci“ci”, “sd”, int 在 [0, 100] 或 None, 可选
在绘制离散
x值的中心趋势时使用的置信区间大小。如果为"ci",则采用ci参数的值。如果为"sd",则跳过自助法并显示每个箱中观测值的标准偏差。- 散点图bool, 可选
如果
True,则绘制带有基础观测值(或x_estimator值)的散点图。- fit_regbool, 可选
如果
True,估计并绘制一个回归模型,该模型关联x和y变量。- ciint in [0, 100] or None, optional
回归估计的置信区间大小。这将使用围绕回归线的半透明带绘制。置信区间通过自举法估计;对于大型数据集,建议通过将此参数设置为 None 来避免该计算。
- n_bootint, 可选
用于估计
ci的 bootstrap 重采样次数。默认值试图平衡时间和稳定性;对于图形的“最终”版本,您可能希望增加此值。- units :
data中的变量名, 可选变量名在 如果
x和y观测值嵌套在采样单元内,可以在此处指定这些单元。在计算置信区间时,这将通过执行多层次的bootstrap来考虑,该bootstrap会重新采样单元和观测值(在单元内)。这不会以其他方式影响回归的估计或绘制。- 种子int, numpy.random.Generator, 或 numpy.random.RandomState, 可选
用于可重复引导的种子或随机数生成器。
- 顺序int, 可选
如果
order大于 1,使用numpy.polyfit来估计多项式回归。- 物流bool, 可选
如果
True,假设y是一个二元变量,并使用statsmodels来估计一个逻辑回归模型。请注意,这比线性回归在计算上要复杂得多,因此你可能希望减少自助重采样次数 (n_boot) 或设置ci为 None。- lowessbool, 可选
如果
True,使用statsmodels来估计一个非参数的 lowess 模型(局部加权线性回归)。请注意,目前无法为这种模型绘制置信区间。- 稳健bool, 可选
如果
True,使用statsmodels来估计一个稳健的回归。这将减少离群值的权重。请注意,这比标准的线性回归在计算上要复杂得多,因此您可能希望减少引导重采样次数 (n_boot) 或设置ci为 None。- logxbool, 可选
如果
True,估计一个形如 y ~ log(x) 的线性回归,但在输入空间中绘制散点图和回归模型。请注意,x必须为正数才能正常工作。- {x,y}_partial :
data中的字符串或矩阵字符串在 在绘图前需要从
x或y变量中回归掉的混杂变量。- 截断bool, 可选
如果
True,回归线被数据限制所界定。如果False,它延伸到x轴的限制。- {x,y}_jitter浮动,可选
将此大小的均匀随机噪声添加到
x或y变量中。噪声是在拟合回归后添加到数据副本中的,并且仅影响散点图的外观。在绘制取离散值的变量时,这可能会有所帮助。- 标签字符串
应用于散点图或回归线(如果
scatter为False)的标签,用于图例中。- 颜色matplotlib 颜色
应用于所有绘图元素的颜色;将被传递到
scatter_kws或line_kws中的颜色所覆盖。- 标记matplotlib 标记代码
用于散点图图标的标记。
- {scatter,line}_kws字典
传递给
plt.scatter和plt.plot的额外关键字参数。- axmatplotlib 轴, 可选
要在其上绘制图形的 Axes 对象,否则使用当前的 Axes。
- 返回:
- axmatplotlib Axes
包含图形的 Axes 对象。
参见
注释
函数
regplot()和lmplot()密切相关,但前者是轴级函数,而后者是结合了regplot()和FacetGrid的图级函数。通过
jointplot()和pairplot()函数,也可以很容易地将regplot()与JointGrid或PairGrid结合起来,尽管这些函数并不直接接受regplot()的所有参数。示例