列表#

pylibcudf.lists.ConcatenateNullPolicy#

另请参阅 cudf::concatenate_null_policy。

枚举成员

IGNORE
NULLIFY_OUTPUT_ROW

pylibcudf.lists.DuplicateFindOption#

另请参阅 cudf::duplicate_find_option。

枚举成员

FIND_FIRST
FIND_LAST

pylibcudf.lists.apply_boolean_mask(Column input, Column boolean_mask) → Column#

使用布尔掩码过滤输入列表列中每行的元素

详情请参见 apply_boolean_mask()。

Parameters:

inputColumn: 输入列。
boolean_maskColumn: 布尔掩码。

Returns:

Column: 基于布尔掩码的过滤元素列。

pylibcudf.lists.concatenate_list_elements(Column input, concatenate_null_policy null_policy) → Column#

将同一行上的多个列表连接成一个单一列表。

详情请参见 concatenate_list_elements()。

Parameters:

inputColumn: 输入列
null_policyConcatenateNullPolicy: 如何处理空列表元素。

Returns:

Column: 一个新的列，包含连接后的列表元素

pylibcudf.lists.concatenate_rows(Table input) → Column#

将多个列表列按行连接成单个列表列。

详情请参阅 concatenate_list_elements()。

Parameters:

inputTable: 输入表

Returns:

Table: 一个新的连接行的列

pylibcudf.lists.contains(signatures, args, kwargs, defaults, _fused_sigindex={})#

创建一个布尔值列，指示输入中是否包含 search_key。

search_key 可能是一个 Column 或一个 Scalar。

详情请参见contains()。

Parameters:

inputColumn: 输入列。
search_keyUnion[Column, Scalar]: 搜索键。

Returns:

Column: 一个新的布尔列，指示是否在列表列中找到了search_key。

pylibcudf.lists.contains_nulls(Column input) → Column#

创建一个布尔值列，指示列表列中的每一行是否包含空值。

详情请参见contains_nulls()。

Parameters:

inputColumn: 输入列。

Returns:

Column: 一个新的布尔列，指示列表列是否包含空值。

pylibcudf.lists.count_elements(Column input) → Column#

计算给定列表列中每个列表元素的行数。有关详细信息，请参阅 count_elements()。

详情请参阅 count_elements()。

Parameters:

inputColumn: 输入列

Returns:

Column: 每个列表元素长度的新列

pylibcudf.lists.difference_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) → Column#

创建一个索引值列，指示搜索键行在列表列中对应列表行中的位置。

详情请参阅 difference_distinct()。

Parameters:

lhsColumn: 输入列表列可能包含的元素。
rhsColumn: 输入列表中的列以排除元素。
nulls_equalNullEquality, default EQUAL: 空值是否被视为相等。
nans_equalNanEquality, default ALL_EQUAL: NaN 是否被视为相等。

Returns:

Column: 包含差异结果的列表列。

pylibcudf.lists.distinct(Column input, null_equality nulls_equal, nan_equality nans_equal) → Column#

创建一个新的列表列，其中每个列表中没有重复的元素。

详情请参见 distinct()。

Parameters:

inputColumn: 输入列。
nulls_equalNullEquality: 空值是否被视为相等。
nans_equalNanEquality: NaN 是否被视为相等。

Returns:

Column: 一个新的列表列，其中每个列表中没有重复元素。

pylibcudf.lists.explode_outer(Table input, size_type explode_column_idx) → Table#

将列表列展开为行。

所有其他列将为列表中的每个元素复制。

详情请参见explode_outer()。

Parameters:

inputTable: 输入表
explode_column_idxint: 要展开的列的索引

Returns:

Table: 一个带有展开列的新表

pylibcudf.lists.extract_list_element(signatures, args, kwargs, defaults, _fused_sigindex={})#

创建一个提取列表元素的列。

详情请参见 extract_list_element()。

Parameters:

inputColumn: 输入列。
indexUnion[Column, size_type]: 选择索引或索引。

Returns:

Column: 一个新的列，其中包含提取的元素。

pylibcudf.lists.have_overlap(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) → Column#

检查给定列表列中每行的列表是否重叠。

详情请参见 have_overlap()。

Parameters:

lhsColumn: 输入列表列为一侧。
rhsColumn: 输入列表列用于另一方。
nulls_equalNullEquality, default EQUAL: 空值是否被视为相等。
nans_equalNanEquality, default ALL_EQUAL: NaN 是否被视为相等。

Returns:

Column: 包含检查结果的列。

pylibcudf.lists.index_of(signatures, args, kwargs, defaults, _fused_sigindex={})#

创建一个索引值列，指示搜索键行在列表列中对应列表行中的位置。

search_key 可能是一个 Column 或一个 Scalar。

详情请参见 index_of()。

Parameters:

inputColumn: 输入列。
search_keyUnion[Column, Scalar]: 搜索键。
find_optionDuplicateFindOption: 如果有重复项，返回哪个匹配项。

Returns:

Column: 一个新的索引值列，指示在列表列中找到search_key的位置。索引值为-1表示未找到search_key。

pylibcudf.lists.intersect_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) → Column#

创建一个包含两个输入列表列中共同的不同元素的列表列。

详情请参见 intersect_distinct()。

Parameters:

lhsColumn: 输入列表列可能包含的元素。
rhsColumn: 输入列表中的列以排除元素。
nulls_equalNullEquality, default EQUAL: 空值是否被视为相等。
nans_equalNanEquality, default ALL_EQUAL: NaN 是否被视为相等。

Returns:

Column: 包含交集结果的列表列。

pylibcudf.lists.reverse(Column input) → Column#

反转输入列中每个列表的元素顺序。

详情请参见 reverse()。

Parameters:

inputColumn: 输入列。

Returns:

Column: 一个新的列，包含反转的列表。

pylibcudf.lists.segmented_gather(Column input, Column gather_map_list) → Column#

创建一个列，其中的元素是根据gather_map_list中的索引收集的

详情请参见segmented_gather()。

Parameters:

inputColumn: 输入列。
gather_map_listColumn: 要收集的列表列的索引。

Returns:

Column: 一个新的列，其中的元素是基于gather_map_list从行列表中收集的

pylibcudf.lists.sequences(Column starts, Column sizes, Column steps=None) → Column#

创建一个列表列，其中每行包含由 (start, step, size) 参数元组指定的值序列。

详情请参阅sequences()。

Parameters:

startsColumn: 结果序列中的第一个值。
sizesColumn: 结果序列中的值的数量。
stepsOptional[Column]: 增加结果序列的值。

Returns:

Column: 包含生成序列的结果列。

pylibcudf.lists.sort_lists(Column input, order sort_order, null_order na_position, bool stable=False) → Column#

对列表列中每一行的列表元素进行排序。

详情请参见 sort_lists()。

Parameters:

inputColumn: 输入列。
ascendingOrder: 列表中的排序顺序。
na_positionNullOrder: 如果na_position等于NullOrder.FIRST，则输出列中的空值将放在前面。否则，它们将放在后面。
stable: bool: 如果为真，则使用stable_sort_lists()，否则使用sort_lists()。

Returns:

Column: 一个新的列，其中每个列表中的元素已排序。

pylibcudf.lists.union_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) → Column#

创建一个包含在两个输入列表列中找到的不同元素的列表列。

详情请参见 union_distinct()。

Parameters:

lhsColumn: 输入列表列可能包含的元素。
rhsColumn: 输入列表中的列以排除元素。
nulls_equalNullEquality, default EQUAL: 空值是否被视为相等。
nans_equalNanEquality, default ALL_EQUAL: NaN 是否被视为相等。

Returns:

Column: 包含联合结果的列表列。