分位数#

pylibcudf.quantiles.quantile(Column input, vector[double] q, interpolation interp=interpolation.LINEAR, Column ordered_indices=None, bool exact=True) Column#

使用插值计算分位数。

通过插值计算指定的分位数,使用在interp中指定的插值策略。

详情请参见 quantile()

Parameters:
input: Column

用于计算分位数的列。

q: array-like that implements buffer-protocol

要计算的分位数范围在 [0,1] 之间

interp: Interpolation, default Interpolation.LINEAR

用于在指定分位数附近的值之间进行选择的策略。

ordered_indices: Column, default empty column

包含输入排序顺序的列。

如果为空,则按现有顺序使用所有输入值。 索引必须在范围 [0, input.size()) 内,但不要求唯一。 未由此列索引的值将被忽略。

exact: bool, default True

如果为True,则返回双精度浮点数。否则,返回与输入相同的类型

For details, see :cpp:func:`quantile`.
Returns:
Column

包含指定分位数的列,对于无法确定的值显示为null

pylibcudf.quantiles.quantiles(Table input, vector[double] q, interpolation interp=interpolation.NEAREST, sorted is_input_sorted=sorted.NO, list column_order=None, list null_precedence=None) Table#

计算带有插值的行分位数。

通过检索与指定分位数对应的行来计算指定的分位数。如果分位数位于行之间,则使用指定的插值策略在行之间进行选择。

详情请参见 quantiles()

Parameters:
input: Table

用于计算行分位数的表。

q: array-like

要计算的分位数范围在 [0,1] 之间

interp: Interpolation, default Interpolation.NEAREST

用于在指定分位数附近的值之间进行选择的策略。

必须是一个非算术插值策略 (即其中之一 {Interpolation.HIGHER, Interpolation.LOWER, Interpolation.NEAREST})

is_input_sorted: Sorted, default Sorted.NO

输入表是否已预先排序。

column_order: list, default None

一个Order枚举的列表,表示每列所需的排序顺序。默认情况下,所有列将按升序排序。

如果is_input_sortedSorted.YES,则忽略

null_precedence: list, default None

一个NullOrder枚举的列表,指示应如何排序空值。默认情况下,将排序所有列,以便空值出现在所有其他元素之前。

如果is_input_sortedSorted.YES,则忽略

For details, see :cpp:func:`quantiles`.
Returns:
Column

包含指定分位数的列,对于无法确定的值显示为null