seaborn.objects.Hist#

class seaborn.objects.Hist(stat='count', bins='auto', binwidth=None, binrange=None, common_norm=True, common_bins=True, cumulative=False, discrete=False)[源代码]#

分箱观察值，计数，并可选择归一化或累积。

参数:

统计str

每个区间内要计算的汇总统计量：

count: 观察的数量
density: 归一化使得直方图的总面积等于1
percent: 标准化使得条形高度总和为100
概率 或 比例：标准化使得条形高度总和为1
frequency: 将观察次数除以区间宽度

binsstr, int, 或 ArrayLike

通用参数，可以是引用规则的名称、箱数或箱的断点。传递给 numpy.histogram_bin_edges()。

binwidth浮动

每个箱子的宽度；覆盖 bins 但可以与 binrange 一起使用。请注意，如果 binwidth 不能均匀地分割箱子范围，实际使用的箱子宽度将仅近似等于参数值。

binrange（最小值，最大值）

分箱边缘的最小值和最大值；可以与 bins`（当为数字时）或 `binwidth 一起使用。默认为数据极值。

common_norm布尔值或变量列表

当不为 False 时，归一化应用于各组之间。使用 True 对所有组进行归一化，或传递定义归一化组的变量名称。

常用二进制文件布尔值或变量列表

当不为 False 时，所有组使用相同的箱子。使用 True 在所有组之间共享箱子，或者传递变量名以在内部共享。

累积布尔

如果为真，累加 bin 值。

离散布尔

如果为真，设置 binwidth 和 binrange 以便箱子具有单位宽度并且以整数值为中心。

注释

计算和绘制直方图时选择的箱子（bins）可以对从可视化中获得的洞察产生重大影响。如果箱子太大，它们可能会抹去重要的特征。另一方面，太小的箱子可能会被随机变异性所主导，掩盖了真实基础分布的形状。默认的箱子大小是根据依赖于样本大小和方差的参考规则确定的。这在许多情况下（即，对于“行为良好”的数据）效果很好，但在其他情况下则不然。尝试不同的箱子大小总是一个好主意，以确保你没有遗漏重要的东西。此函数允许你以几种不同的方式指定箱子，例如通过设置要使用的箱子总数、每个箱子的宽度，或箱子应该断开的具体位置。

示例