分位数#
- pylibcudf.quantiles.quantile(Column input, vector[double] q, interpolation interp=interpolation.LINEAR, Column ordered_indices=None, bool exact=True) Column#
使用插值计算分位数。
通过插值计算指定的分位数,使用在interp中指定的插值策略。
详情请参见
quantile()。- Parameters:
- input: Column
用于计算分位数的列。
- q: array-like that implements buffer-protocol
要计算的分位数范围在 [0,1] 之间
- interp: Interpolation, default Interpolation.LINEAR
用于在指定分位数附近的值之间进行选择的策略。
- ordered_indices: Column, default empty column
包含输入排序顺序的列。
如果为空,则按现有顺序使用所有输入值。 索引必须在范围 [0, input.size()) 内,但不要求唯一。 未由此列索引的值将被忽略。
- exact: bool, default True
如果为True,则返回双精度浮点数。否则,返回与输入相同的类型
- For details, see :cpp:func:`quantile`.
- Returns:
- Column
包含指定分位数的列,对于无法确定的值显示为null
- pylibcudf.quantiles.quantiles(Table input, vector[double] q, interpolation interp=interpolation.NEAREST, sorted is_input_sorted=sorted.NO, list column_order=None, list null_precedence=None) Table#
计算带有插值的行分位数。
通过检索与指定分位数对应的行来计算指定的分位数。如果分位数位于行之间,则使用指定的插值策略在行之间进行选择。
详情请参见
quantiles()。- Parameters:
- input: Table
用于计算行分位数的表。
- q: array-like
要计算的分位数范围在 [0,1] 之间
- interp: Interpolation, default Interpolation.NEAREST
用于在指定分位数附近的值之间进行选择的策略。
必须是一个非算术插值策略 (即其中之一 {Interpolation.HIGHER, Interpolation.LOWER, Interpolation.NEAREST})
- is_input_sorted: Sorted, default Sorted.NO
输入表是否已预先排序。
- column_order: list, default None
一个Order枚举的列表,表示每列所需的排序顺序。默认情况下,所有列将按升序排序。
如果is_input_sorted是Sorted.YES,则忽略
- null_precedence: list, default None
一个NullOrder枚举的列表,指示应如何排序空值。默认情况下,将排序所有列,以便空值出现在所有其他元素之前。
如果is_input_sorted是Sorted.YES,则忽略
- For details, see :cpp:func:`quantiles`.
- Returns:
- Column
包含指定分位数的列,对于无法确定的值显示为null