seaborn.lmplot#

seaborn.lmplot(data, *, x=None, y=None, hue=None, col=None, row=None, palette=None, col_wrap=None, height=5, aspect=1, markers='o', sharex=None, sharey=None, hue_order=None, col_order=None, row_order=None, legend=True, legend_out=None, x_estimator=None, x_bins=None, x_ci='ci', scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None, seed=None, order=1, logistic=False, lowess=False, robust=False, logx=False, x_partial=None, y_partial=None, truncate=True, x_jitter=None, y_jitter=None, scatter_kws=None, line_kws=None, facet_kws=None)[源代码]#

在 FacetGrid 上绘制数据和回归模型拟合。

此函数结合了 regplot() 和 FacetGrid。它旨在作为在数据集的条件子集上拟合回归模型的便捷接口。

在考虑如何将变量分配给不同的方面时，一般规则是使用 hue 进行最重要的比较，其次是 col 和 row。然而，始终要考虑您的特定数据集以及您正在创建的可视化的目标。

估计回归模型有若干互斥的选项。更多信息请参见教程。

此函数的参数涵盖了 FacetGrid 中的大多数选项，尽管在某些情况下，您可能希望直接使用该类和 regplot()。

参数:

数据DataFrame: 整洁（长格式）数据框，其中每一列是一个变量，每一行是一个观测值。
x, y字符串，可选: 输入变量；这些应该是 data 中的列名。
色调, 列, 行字符串: 定义数据子集的变量，这些子集将在网格中的单独面中绘制。请参阅 *_order 参数以控制此变量级别的顺序。
调色板调色板名称、列表或字典: 用于 hue 变量不同级别的颜色。应该是可以被 color_palette() 解释的内容，或者是一个将色调级别映射到 matplotlib 颜色的字典。
col_wrap整数: 在此宽度处“包裹”列变量，以便列分面跨越多行。与 row 分面不兼容。
高度标量: 每个分面的高度（以英寸为单位）。另见：aspect。
方面标量: 每个面的宽高比，使得 aspect * height 给出每个面在英寸中的宽度。
标记matplotlib 标记代码或标记代码列表，可选: 散点图的标记。如果是一个列表，列表中的每个标记将用于 hue 变量的每个级别。
share{x,y}布尔值, ‘列’, 或 ‘行’ 可选: 如果为真，面将共享列之间的y轴和/或行之间的x轴。

自 0.12.0 版本弃用: 通过 facet_kws 字典传递。
{hue,col,row}_order列表，可选: 分面变量的级别顺序。默认情况下，这将是级别在 data 中出现的顺序，或者如果变量是 pandas 分类变量，则是分类顺序。
图例bool, 可选: 如果 True 并且存在 hue 变量，则添加图例。
legend_out布尔: 如果 True ，图形尺寸将被扩展，图例将在图的右中位置绘制在图外。

自 0.12.0 版本弃用: 通过 facet_kws 字典传递。
x_estimator映射向量到标量的可调用对象，可选: 将此函数应用于 x 的每个唯一值，并绘制结果估计。当 x 是离散变量时，这非常有用。如果给出了 x_ci ，此估计将通过自助法进行，并绘制置信区间。
x_binsint 或 vector，可选: 将 x 变量分箱为离散的箱子，然后估计中心趋势和置信区间。这种分箱仅影响散点图的绘制方式；回归仍然拟合原始数据。此参数被解释为均匀大小（不必等距）的箱子数量或箱子中心的位置。当使用此参数时，它意味着 x_estimator 的默认值为 numpy.mean。
x_ci“ci”, “sd”, int 在 [0, 100] 或 None, 可选: 在绘制离散 x 值的中心趋势时使用的置信区间大小。如果为 "ci"，则采用 ci 参数的值。如果为 "sd"，则跳过自助法并显示每个箱中观测值的标准偏差。
散点图bool, 可选: 如果 True，则绘制带有基础观测值（或 x_estimator 值）的散点图。
fit_regbool, 可选: 如果 True，估计并绘制一个回归模型，该模型关联 x 和 y 变量。
ciint in [0, 100] or None, optional: 回归估计的置信区间大小。这将使用围绕回归线的半透明带绘制。置信区间通过自举法估计；对于大型数据集，建议通过将此参数设置为 None 来避免该计算。
n_bootint, 可选: 用于估计 ci 的 bootstrap 重采样次数。默认值试图平衡时间和稳定性；对于图形的“最终”版本，您可能希望增加此值。
units : data 中的变量名，可选变量名在: 如果 x 和 y 观测值嵌套在采样单元内，可以在此处指定这些单元。在计算置信区间时，这将通过执行多层次的bootstrap来考虑，该bootstrap会重新采样单元和观测值（在单元内）。这不会以其他方式影响回归的估计或绘制方式。
种子int, numpy.random.Generator, 或 numpy.random.RandomState, 可选: 用于可重复引导的种子或随机数生成器。
顺序int, 可选: 如果 order 大于 1，使用 numpy.polyfit 来估计多项式回归。
物流bool, 可选: 如果 True，假设 y 是一个二元变量，并使用 statsmodels 来估计一个逻辑回归模型。请注意，这比线性回归在计算上要复杂得多，因此你可能希望减少自助抽样次数 (n_boot) 或设置 ci 为 None。
lowessbool, 可选: 如果 True，使用 statsmodels 来估计一个非参数的 lowess 模型（局部加权线性回归）。注意，目前无法为这种模型绘制置信区间。
稳健bool, 可选: 如果 True ，使用 statsmodels 来估计稳健回归。这将减少异常值的权重。请注意，这比标准线性回归在计算上要昂贵得多，因此您可能希望减少引导重采样次数 (n_boot) 或设置 ci 为 None。
logxbool, 可选: 如果 True，估计一个形式为 y ~ log(x) 的线性回归，但在输入空间中绘制散点图和回归模型。请注意，x 必须为正数才能正常工作。
{x,y}_partial : data 中的字符串或矩阵字符串在: 在绘图前需要从 x 或 y 变量中回归的混杂变量。
截断bool, 可选: 如果 True ，回归线被数据限制所界定。如果 False ，它延伸到 x 轴的限制。
{x,y}_jitter浮动，可选: 将此大小的均匀随机噪声添加到 x 或 y 变量中。噪声是在拟合回归后添加到数据副本中的，并且仅影响散点图的外观。在绘制取离散值的变量时，这可能会有所帮助。
{scatter,line}_kws字典: 传递给 plt.scatter 和 plt.plot 的额外关键字参数。
facet_kwsdict: 用于 FacetGrid 的关键字参数字典。

参见

regplot: 绘制数据和条件模型拟合。
FacetGrid: 用于绘制条件关系的子图网格。
pairplot: 结合 regplot() 和 PairGrid`（当使用 ``kind="reg"` 时）。

注释

函数 regplot() 和 lmplot() 密切相关，但前者是轴级函数，而后者是结合了 regplot() 和 FacetGrid 的图级函数。

示例