seaborn.lmplot#

seaborn.lmplot(data, *, x=None, y=None, hue=None, col=None, row=None, palette=None, col_wrap=None, height=5, aspect=1, markers='o', sharex=None, sharey=None, hue_order=None, col_order=None, row_order=None, legend=True, legend_out=None, x_estimator=None, x_bins=None, x_ci='ci', scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None, seed=None, order=1, logistic=False, lowess=False, robust=False, logx=False, x_partial=None, y_partial=None, truncate=True, x_jitter=None, y_jitter=None, scatter_kws=None, line_kws=None, facet_kws=None)[源代码]#

在 FacetGrid 上绘制数据和回归模型拟合。

此函数结合了 regplot()FacetGrid。它旨在作为在数据集的条件子集上拟合回归模型的便捷接口。

在考虑如何将变量分配给不同的方面时,一般规则是使用 hue 进行最重要的比较,其次是 colrow。然而,始终要考虑您的特定数据集以及您正在创建的可视化的目标。

估计回归模型有若干互斥的选项。更多信息请参见 教程

此函数的参数涵盖了 FacetGrid 中的大多数选项,尽管在某些情况下,您可能希望直接使用该类和 regplot()

参数:
数据DataFrame

整洁(长格式)数据框,其中每一列是一个变量,每一行是一个观测值。

x, y字符串,可选

输入变量;这些应该是 data 中的列名。

色调, 列, 行字符串

定义数据子集的变量,这些子集将在网格中的单独面中绘制。请参阅 *_order 参数以控制此变量级别的顺序。

调色板调色板名称、列表或字典

用于 hue 变量不同级别的颜色。应该是可以被 color_palette() 解释的内容,或者是一个将色调级别映射到 matplotlib 颜色的字典。

col_wrap整数

在此宽度处“包裹”列变量,以便列分面跨越多行。与 row 分面不兼容。

高度标量

每个分面的高度(以英寸为单位)。另见:aspect

方面标量

每个面的宽高比,使得 aspect * height 给出每个面在英寸中的宽度。

标记matplotlib 标记代码或标记代码列表,可选

散点图的标记。如果是一个列表,列表中的每个标记将用于 hue 变量的每个级别。

share{x,y}布尔值, ‘列’, 或 ‘行’ 可选

如果为真,面将共享列之间的y轴和/或行之间的x轴。

自 0.12.0 版本弃用: 通过 facet_kws 字典传递。

{hue,col,row}_order列表,可选

分面变量的级别顺序。默认情况下,这将是级别在 data 中出现的顺序,或者如果变量是 pandas 分类变量,则是分类顺序。

图例bool, 可选

如果 True 并且存在 hue 变量,则添加图例。

legend_out布尔

如果 True ,图形尺寸将被扩展,图例将在图的右中位置绘制在图外。

自 0.12.0 版本弃用: 通过 facet_kws 字典传递。

x_estimator映射向量到标量的可调用对象,可选

将此函数应用于 x 的每个唯一值,并绘制结果估计。当 x 是离散变量时,这非常有用。如果给出了 x_ci ,此估计将通过自助法进行,并绘制置信区间。

x_binsint 或 vector,可选

x 变量分箱为离散的箱子,然后估计中心趋势和置信区间。这种分箱仅影响散点图的绘制方式;回归仍然拟合原始数据。此参数被解释为均匀大小(不必等距)的箱子数量或箱子中心的位置。当使用此参数时,它意味着 x_estimator 的默认值为 numpy.mean

x_ci“ci”, “sd”, int 在 [0, 100] 或 None, 可选

在绘制离散 x 值的中心趋势时使用的置信区间大小。如果为 "ci",则采用 ci 参数的值。如果为 "sd",则跳过自助法并显示每个箱中观测值的标准偏差。

散点图bool, 可选

如果 True,则绘制带有基础观测值(或 x_estimator 值)的散点图。

fit_regbool, 可选

如果 True,估计并绘制一个回归模型,该模型关联 xy 变量。

ciint in [0, 100] or None, optional

回归估计的置信区间大小。这将使用围绕回归线的半透明带绘制。置信区间通过自举法估计;对于大型数据集,建议通过将此参数设置为 None 来避免该计算。

n_bootint, 可选

用于估计 ci 的 bootstrap 重采样次数。默认值试图平衡时间和稳定性;对于图形的“最终”版本,您可能希望增加此值。

units : data 中的变量名,可选变量名在

如果 xy 观测值嵌套在采样单元内,可以在此处指定这些单元。在计算置信区间时,这将通过执行多层次的bootstrap来考虑,该bootstrap会重新采样单元和观测值(在单元内)。这不会以其他方式影响回归的估计或绘制方式。

种子int, numpy.random.Generator, 或 numpy.random.RandomState, 可选

用于可重复引导的种子或随机数生成器。

顺序int, 可选

如果 order 大于 1,使用 numpy.polyfit 来估计多项式回归。

物流bool, 可选

如果 True,假设 y 是一个二元变量,并使用 statsmodels 来估计一个逻辑回归模型。请注意,这比线性回归在计算上要复杂得多,因此你可能希望减少自助抽样次数 (n_boot) 或设置 ci 为 None。

lowessbool, 可选

如果 True,使用 statsmodels 来估计一个非参数的 lowess 模型(局部加权线性回归)。注意,目前无法为这种模型绘制置信区间。

稳健bool, 可选

如果 True ,使用 statsmodels 来估计稳健回归。这将减少异常值的权重。请注意,这比标准线性回归在计算上要昂贵得多,因此您可能希望减少引导重采样次数 (n_boot) 或设置 ci 为 None。

logxbool, 可选

如果 True,估计一个形式为 y ~ log(x) 的线性回归,但在输入空间中绘制散点图和回归模型。请注意,x 必须为正数才能正常工作。

{x,y}_partial : data 中的字符串或矩阵字符串在

在绘图前需要从 xy 变量中回归的混杂变量。

截断bool, 可选

如果 True ,回归线被数据限制所界定。如果 False ,它延伸到 x 轴的限制。

{x,y}_jitter浮动,可选

将此大小的均匀随机噪声添加到 xy 变量中。噪声是在拟合回归后添加到数据副本中的,并且仅影响散点图的外观。在绘制取离散值的变量时,这可能会有所帮助。

{scatter,line}_kws字典

传递给 plt.scatterplt.plot 的额外关键字参数。

facet_kwsdict

用于 FacetGrid 的关键字参数字典。

参见

regplot

绘制数据和条件模型拟合。

FacetGrid

用于绘制条件关系的子图网格。

pairplot

结合 regplot()PairGrid`(当使用 ``kind="reg"` 时)。

注释

函数 regplot()lmplot() 密切相关,但前者是轴级函数,而后者是结合了 regplot()FacetGrid 的图级函数。

示例