seaborn.objects.Hist#
- class seaborn.objects.Hist(stat='count', bins='auto', binwidth=None, binrange=None, common_norm=True, common_bins=True, cumulative=False, discrete=False)[源代码]#
分箱观察值,计数,并可选择归一化或累积。
- 参数:
- 统计str
每个区间内要计算的汇总统计量:
count: 观察的数量density: 归一化使得直方图的总面积等于1percent: 标准化使得条形高度总和为100概率或比例:标准化使得条形高度总和为1frequency: 将观察次数除以区间宽度
- binsstr, int, 或 ArrayLike
通用参数,可以是引用规则的名称、箱数或箱的断点。传递给
numpy.histogram_bin_edges()。- binwidth浮动
每个箱子的宽度;覆盖
bins但可以与binrange一起使用。请注意,如果binwidth不能均匀地分割箱子范围,实际使用的箱子宽度将仅近似等于参数值。- binrange(最小值,最大值)
分箱边缘的最小值和最大值;可以与
bins`(当为数字时)或 `binwidth一起使用。默认为数据极值。- common_norm布尔值或变量列表
当不为
False时,归一化应用于各组之间。使用True对所有组进行归一化,或传递定义归一化组的变量名称。- 常用二进制文件布尔值或变量列表
当不为
False时,所有组使用相同的箱子。使用True在所有组之间共享箱子,或者传递变量名以在内部共享。- 累积布尔
如果为真,累加 bin 值。
- 离散布尔
如果为真,设置
binwidth和binrange以便箱子具有单位宽度并且以整数值为中心。
注释
计算和绘制直方图时选择的箱子(bins)可以对从可视化中获得的洞察产生重大影响。如果箱子太大,它们可能会抹去重要的特征。另一方面,太小的箱子可能会被随机变异性所主导,掩盖了真实基础分布的形状。默认的箱子大小是根据依赖于样本大小和方差的参考规则确定的。这在许多情况下(即,对于“行为良好”的数据)效果很好,但在其他情况下则不然。尝试不同的箱子大小总是一个好主意,以确保你没有遗漏重要的东西。此函数允许你以几种不同的方式指定箱子,例如通过设置要使用的箱子总数、每个箱子的宽度,或箱子应该断开的具体位置。
示例