tdigest#

group tdigest
class tdigest_column_view : private cudf::column_view#
#include <tdigest_column_view.hpp>

给定一个包含tdigest数据的column_view,此类的实例为tdigest操作提供了一个复合列的包装器。

tdigest 是一组“压缩”的输入标量,表示为排序后的质心集合 (https://arxiv.org/pdf/1902.04023.pdf)。可以查询此数据以获取分位数信息。tdigest 列中的每一行代表一个完整的 tdigest。

该列具有以下结构:

结构体 { // 用于摘要列表的质心 { 结构体 { double // 平均值 double // 权重 } } // 这些来自输入流,而不是质心。它们在百分位数近似计算期间使用,接近分位数的开始或结束 double // 最小值 double // 最大值 }

公共类型

using offset_iterator = size_type const*#

遍历偏移量。

公共函数

tdigest_column_view(column_view const&)#

column_view构造tdigest_column_view

tdigest_column_view(tdigest_column_view&&) = default#

移动构造函数。

tdigest_column_view(tdigest_column_view const&) = default#

复制构造函数。

tdigest_column_view &operator=(tdigest_column_view const&) = default#

复制赋值运算符。

Returns:

复制其他对象内容后的此对象(复制)

tdigest_column_view &operator=(tdigest_column_view&&) = default#

移动赋值运算符。

Returns:

此对象在移动另一个对象的内容后(转移所有权)

column_view parent() const#

返回父列。

Returns:

父列

lists_column_view centroids() const#

返回质心的列。

Returns:

质心列表列

column_view means() const#

返回均值的内列。

Returns:

平均值的内部列

column_view weights() const#

返回权重值的内部列。

Returns:

权重值的内部列

double const *min_begin() const#

返回该列的第一个最小值。每一行对应于伴随摘要的最小值。

Returns:

指向列的第一个最小值的常量指针

double const *max_begin() const#

返回该列的第一个最大值。每行对应于伴随摘要的最大值。

Returns:

指向列的第一个最大值的常量指针

公共静态属性

static constexpr size_type mean_column_index = {0}#

平均列索引。

static constexpr size_type weight_column_index = {1}#

权重列索引。

static constexpr size_type centroid_column_index = {0}#

质心列索引。

static constexpr size_type min_column_index = {1}#

最小列索引。

static constexpr size_type max_column_index = {2}#

最大列索引。