seaborn.lmplot#
- seaborn.lmplot(data, *, x=None, y=None, hue=None, col=None, row=None, palette=None, col_wrap=None, height=5, aspect=1, markers='o', sharex=None, sharey=None, hue_order=None, col_order=None, row_order=None, legend=True, legend_out=None, x_estimator=None, x_bins=None, x_ci='ci', scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None, seed=None, order=1, logistic=False, lowess=False, robust=False, logx=False, x_partial=None, y_partial=None, truncate=True, x_jitter=None, y_jitter=None, scatter_kws=None, line_kws=None, facet_kws=None)[源代码]#
在 FacetGrid 上绘制数据和回归模型拟合。
此函数结合了
regplot()和FacetGrid。它旨在作为在数据集的条件子集上拟合回归模型的便捷接口。在考虑如何将变量分配给不同的方面时,一般规则是使用
hue进行最重要的比较,其次是col和row。然而,始终要考虑您的特定数据集以及您正在创建的可视化的目标。估计回归模型有若干互斥的选项。更多信息请参见 教程。
此函数的参数涵盖了
FacetGrid中的大多数选项,尽管在某些情况下,您可能希望直接使用该类和regplot()。- 参数:
- 数据DataFrame
整洁(长格式)数据框,其中每一列是一个变量,每一行是一个观测值。
- x, y字符串,可选
输入变量;这些应该是
data中的列名。- 色调, 列, 行字符串
定义数据子集的变量,这些子集将在网格中的单独面中绘制。请参阅
*_order参数以控制此变量级别的顺序。- 调色板调色板名称、列表或字典
用于
hue变量不同级别的颜色。应该是可以被color_palette()解释的内容,或者是一个将色调级别映射到 matplotlib 颜色的字典。- col_wrap整数
在此宽度处“包裹”列变量,以便列分面跨越多行。与
row分面不兼容。- 高度标量
每个分面的高度(以英寸为单位)。另见:
aspect。- 方面标量
每个面的宽高比,使得
aspect * height给出每个面在英寸中的宽度。- 标记matplotlib 标记代码或标记代码列表,可选
散点图的标记。如果是一个列表,列表中的每个标记将用于
hue变量的每个级别。- share{x,y}布尔值, ‘列’, 或 ‘行’ 可选
如果为真,面将共享列之间的y轴和/或行之间的x轴。
自 0.12.0 版本弃用: 通过
facet_kws字典传递。- {hue,col,row}_order列表,可选
分面变量的级别顺序。默认情况下,这将是级别在
data中出现的顺序,或者如果变量是 pandas 分类变量,则是分类顺序。- 图例bool, 可选
如果
True并且存在hue变量,则添加图例。- legend_out布尔
如果
True,图形尺寸将被扩展,图例将在图的右中位置绘制在图外。自 0.12.0 版本弃用: 通过
facet_kws字典传递。- x_estimator映射向量到标量的可调用对象,可选
将此函数应用于
x的每个唯一值,并绘制结果估计。当x是离散变量时,这非常有用。如果给出了x_ci,此估计将通过自助法进行,并绘制置信区间。- x_binsint 或 vector,可选
将
x变量分箱为离散的箱子,然后估计中心趋势和置信区间。这种分箱仅影响散点图的绘制方式;回归仍然拟合原始数据。此参数被解释为均匀大小(不必等距)的箱子数量或箱子中心的位置。当使用此参数时,它意味着x_estimator的默认值为numpy.mean。- x_ci“ci”, “sd”, int 在 [0, 100] 或 None, 可选
在绘制离散
x值的中心趋势时使用的置信区间大小。如果为"ci",则采用ci参数的值。如果为"sd",则跳过自助法并显示每个箱中观测值的标准偏差。- 散点图bool, 可选
如果
True,则绘制带有基础观测值(或x_estimator值)的散点图。- fit_regbool, 可选
如果
True,估计并绘制一个回归模型,该模型关联x和y变量。- ciint in [0, 100] or None, optional
回归估计的置信区间大小。这将使用围绕回归线的半透明带绘制。置信区间通过自举法估计;对于大型数据集,建议通过将此参数设置为 None 来避免该计算。
- n_bootint, 可选
用于估计
ci的 bootstrap 重采样次数。默认值试图平衡时间和稳定性;对于图形的“最终”版本,您可能希望增加此值。- units :
data中的变量名,可选变量名在 如果
x和y观测值嵌套在采样单元内,可以在此处指定这些单元。在计算置信区间时,这将通过执行多层次的bootstrap来考虑,该bootstrap会重新采样单元和观测值(在单元内)。这不会以其他方式影响回归的估计或绘制方式。- 种子int, numpy.random.Generator, 或 numpy.random.RandomState, 可选
用于可重复引导的种子或随机数生成器。
- 顺序int, 可选
如果
order大于 1,使用numpy.polyfit来估计多项式回归。- 物流bool, 可选
如果
True,假设y是一个二元变量,并使用statsmodels来估计一个逻辑回归模型。请注意,这比线性回归在计算上要复杂得多,因此你可能希望减少自助抽样次数 (n_boot) 或设置ci为 None。- lowessbool, 可选
如果
True,使用statsmodels来估计一个非参数的 lowess 模型(局部加权线性回归)。注意,目前无法为这种模型绘制置信区间。- 稳健bool, 可选
如果
True,使用statsmodels来估计稳健回归。这将减少异常值的权重。请注意,这比标准线性回归在计算上要昂贵得多,因此您可能希望减少引导重采样次数 (n_boot) 或设置ci为 None。- logxbool, 可选
如果
True,估计一个形式为 y ~ log(x) 的线性回归,但在输入空间中绘制散点图和回归模型。请注意,x必须为正数才能正常工作。- {x,y}_partial :
data中的字符串或矩阵字符串在 在绘图前需要从
x或y变量中回归的混杂变量。- 截断bool, 可选
如果
True,回归线被数据限制所界定。如果False,它延伸到x轴的限制。- {x,y}_jitter浮动,可选
将此大小的均匀随机噪声添加到
x或y变量中。噪声是在拟合回归后添加到数据副本中的,并且仅影响散点图的外观。在绘制取离散值的变量时,这可能会有所帮助。- {scatter,line}_kws字典
传递给
plt.scatter和plt.plot的额外关键字参数。- facet_kwsdict
用于
FacetGrid的关键字参数字典。
参见
注释
函数
regplot()和lmplot()密切相关,但前者是轴级函数,而后者是结合了regplot()和FacetGrid的图级函数。示例