seaborn.objects.Hist#

class seaborn.objects.Hist(stat='count', bins='auto', binwidth=None, binrange=None, common_norm=True, common_bins=True, cumulative=False, discrete=False)[源代码]#

分箱观察值,计数,并可选择归一化或累积。

参数:
统计str

每个区间内要计算的汇总统计量:

  • count: 观察的数量

  • density: 归一化使得直方图的总面积等于1

  • percent: 标准化使得条形高度总和为100

  • 概率比例:标准化使得条形高度总和为1

  • frequency: 将观察次数除以区间宽度

binsstr, int, 或 ArrayLike

通用参数,可以是引用规则的名称、箱数或箱的断点。传递给 numpy.histogram_bin_edges()

binwidth浮动

每个箱子的宽度;覆盖 bins 但可以与 binrange 一起使用。请注意,如果 binwidth 不能均匀地分割箱子范围,实际使用的箱子宽度将仅近似等于参数值。

binrange(最小值,最大值)

分箱边缘的最小值和最大值;可以与 bins`(当为数字时)或 `binwidth 一起使用。默认为数据极值。

common_norm布尔值或变量列表

当不为 False 时,归一化应用于各组之间。使用 True 对所有组进行归一化,或传递定义归一化组的变量名称。

常用二进制文件布尔值或变量列表

当不为 False 时,所有组使用相同的箱子。使用 True 在所有组之间共享箱子,或者传递变量名以在内部共享。

累积布尔

如果为真,累加 bin 值。

离散布尔

如果为真,设置 binwidthbinrange 以便箱子具有单位宽度并且以整数值为中心。

注释

计算和绘制直方图时选择的箱子(bins)可以对从可视化中获得的洞察产生重大影响。如果箱子太大,它们可能会抹去重要的特征。另一方面,太小的箱子可能会被随机变异性所主导,掩盖了真实基础分布的形状。默认的箱子大小是根据依赖于样本大小和方差的参考规则确定的。这在许多情况下(即,对于“行为良好”的数据)效果很好,但在其他情况下则不然。尝试不同的箱子大小总是一个好主意,以确保你没有遗漏重要的东西。此函数允许你以几种不同的方式指定箱子,例如通过设置要使用的箱子总数、每个箱子的宽度,或箱子应该断开的具体位置。

示例