分组#
GroupBy 对象由 groupby 调用返回:cudf.DataFrame.groupby(), cudf.Series.groupby(), 等。
索引,迭代#
返回一个字典,将组键映射到行标签。 |
|
函数应用#
|
对分组后的数据块应用一个Python转换函数。 |
|
对分组应用聚合操作。 |
|
对组应用聚合操作。 |
|
对组应用聚合操作。 |
|
应用带有参数的函数 func 到这个 GroupBy 对象,并返回函数的结果。 |
|
应用聚合操作,然后将结果广播到组的大小。 |
计算 / 描述性统计#
|
向后填充NA值。 |
|
计算每列中的值的数量。 |
|
返回每个组中键的累积计数。 |
|
每个组的累积最大值。 |
|
每个组的累积最小值。 |
|
每个组的累计和。 |
|
获取每个组中值之间的差异。 |
|
向前填充NA值。 |
|
计算组值的第一个。 |
|
从具有提供名称的组中构造DataFrame。 |
返回一个将组键映射到行标签的字典。 |
|
|
计算组值的idxmax。 |
|
计算组值的idxmin。 |
|
计算组值的最后一个。 |
|
计算组值的最大值。 |
|
计算组值的平均值。 |
|
计算组值的中位数。 |
|
计算组值的最小值。 |
|
将每个组从0到组数-1进行编号。 |
|
返回每个组的第n行。 |
|
返回组中唯一元素的数量。 |
|
计算组值的乘积。 |
|
将每个组移动 |
返回每个组的大小。 |
|
|
计算每组值的列标准差。 |
|
计算组值的总和。 |
|
计算每组值的列方差。 |
|
计算DataFrame中各列的成对协方差,排除NA/空值。 |
以下方法在SeriesGroupBy和DataFrameGroupBy对象中都可用,但可能略有不同,通常在于DataFrameGroupBy版本通常允许指定一个轴参数,并且经常有一个参数指示是否限制应用于特定数据类型的列。
|
向后填充NA值。 |
|
计算列的成对相关性,排除NA/空值。 |
|
计算每列中的值的数量。 |
|
返回每个组中键的累积计数。 |
|
每个组的累积最大值。 |
|
每个组的累积最小值。 |
|
每个组的累计和。 |
|
生成描述性统计信息,总结数据集分布的中心趋势、离散度和形状,不包括NaN值。 |
|
获取每组中值之间的差异。 |
|
向前填充NA值。 |
|
使用指定的方法填充NA值。 |
|
计算组值的idxmax。 |
|
计算组值的idxmin。 |
|
返回组中唯一元素的数量。 |
|
计算每组值的列方向分位数。 |
|
将每个组移动 |
返回每个组的大小。 |
以下方法仅适用于SeriesGroupBy对象。
|
|
|
返回组中唯一元素的数量。 |
获取每个组中每列的唯一值列表。 |