列表#

pylibcudf.lists.ConcatenateNullPolicy#

另请参阅 cudf::concatenate_null_policy

枚举成员

  • IGNORE

  • NULLIFY_OUTPUT_ROW

pylibcudf.lists.DuplicateFindOption#

另请参阅 cudf::duplicate_find_option

枚举成员

  • FIND_FIRST

  • FIND_LAST

pylibcudf.lists.apply_boolean_mask(Column input, Column boolean_mask) Column#

使用布尔掩码过滤输入列表列中每行的元素

详情请参见 apply_boolean_mask()

Parameters:
inputColumn

输入列。

boolean_maskColumn

布尔掩码。

Returns:
Column

基于布尔掩码的过滤元素列。

pylibcudf.lists.concatenate_list_elements(Column input, concatenate_null_policy null_policy) Column#

将同一行上的多个列表连接成一个单一列表。

详情请参见 concatenate_list_elements()

Parameters:
inputColumn

输入列

null_policyConcatenateNullPolicy

如何处理空列表元素。

Returns:
Column

一个新的列,包含连接后的列表元素

pylibcudf.lists.concatenate_rows(Table input) Column#

将多个列表列按行连接成单个列表列。

详情请参阅 concatenate_list_elements()

Parameters:
inputTable

输入表

Returns:
Table

一个新的连接行的列

pylibcudf.lists.contains(signatures, args, kwargs, defaults, _fused_sigindex={})#

创建一个布尔值列,指示输入中是否包含 search_key。

search_key 可能是一个 Column 或一个 Scalar

详情请参见contains()

Parameters:
inputColumn

输入列。

search_keyUnion[Column, Scalar]

搜索键。

Returns:
Column

一个新的布尔列,指示是否在列表列中找到了search_key。

pylibcudf.lists.contains_nulls(Column input) Column#

创建一个布尔值列,指示列表列中的每一行是否包含空值。

详情请参见contains_nulls()

Parameters:
inputColumn

输入列。

Returns:
Column

一个新的布尔列,指示列表列是否包含空值。

pylibcudf.lists.count_elements(Column input) Column#

计算给定列表列中每个列表元素的行数。 有关详细信息,请参阅 count_elements()

详情请参阅 count_elements()

Parameters:
inputColumn

输入列

Returns:
Column

每个列表元素长度的新列

pylibcudf.lists.difference_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column#

创建一个索引值列,指示搜索键行在列表列中对应列表行中的位置。

详情请参阅 difference_distinct()

Parameters:
lhsColumn

输入列表列可能包含的元素。

rhsColumn

输入列表中的列以排除元素。

nulls_equalNullEquality, default EQUAL

空值是否被视为相等。

nans_equalNanEquality, default ALL_EQUAL

NaN 是否被视为相等。

Returns:
Column

包含差异结果的列表列。

pylibcudf.lists.distinct(Column input, null_equality nulls_equal, nan_equality nans_equal) Column#

创建一个新的列表列,其中每个列表中没有重复的元素。

详情请参见 distinct()

Parameters:
inputColumn

输入列。

nulls_equalNullEquality

空值是否被视为相等。

nans_equalNanEquality

NaN 是否被视为相等。

Returns:
Column

一个新的列表列,其中每个列表中没有重复元素。

pylibcudf.lists.explode_outer(Table input, size_type explode_column_idx) Table#

将列表列展开为行。

所有其他列将为列表中的每个元素复制。

详情请参见explode_outer()

Parameters:
inputTable

输入表

explode_column_idxint

要展开的列的索引

Returns:
Table

一个带有展开列的新表

pylibcudf.lists.extract_list_element(signatures, args, kwargs, defaults, _fused_sigindex={})#

创建一个提取列表元素的列。

详情请参见 extract_list_element()

Parameters:
inputColumn

输入列。

indexUnion[Column, size_type]

选择索引或索引。

Returns:
Column

一个新的列,其中包含提取的元素。

pylibcudf.lists.have_overlap(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column#

检查给定列表列中每行的列表是否重叠。

详情请参见 have_overlap()

Parameters:
lhsColumn

输入列表列为一侧。

rhsColumn

输入列表列用于另一方。

nulls_equalNullEquality, default EQUAL

空值是否被视为相等。

nans_equalNanEquality, default ALL_EQUAL

NaN 是否被视为相等。

Returns:
Column

包含检查结果的列。

pylibcudf.lists.index_of(signatures, args, kwargs, defaults, _fused_sigindex={})#

创建一个索引值列,指示搜索键行在列表列中对应列表行中的位置。

search_key 可能是一个 Column 或一个 Scalar

详情请参见 index_of()

Parameters:
inputColumn

输入列。

search_keyUnion[Column, Scalar]

搜索键。

find_optionDuplicateFindOption

如果有重复项,返回哪个匹配项。

Returns:
Column

一个新的索引值列,指示在列表列中找到search_key的位置。索引值为-1表示未找到search_key。

pylibcudf.lists.intersect_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column#

创建一个包含两个输入列表列中共同的不同元素的列表列。

详情请参见 intersect_distinct()

Parameters:
lhsColumn

输入列表列可能包含的元素。

rhsColumn

输入列表中的列以排除元素。

nulls_equalNullEquality, default EQUAL

空值是否被视为相等。

nans_equalNanEquality, default ALL_EQUAL

NaN 是否被视为相等。

Returns:
Column

包含交集结果的列表列。

pylibcudf.lists.reverse(Column input) Column#

反转输入列中每个列表的元素顺序。

详情请参见 reverse()

Parameters:
inputColumn

输入列。

Returns:
Column

一个新的列,包含反转的列表。

pylibcudf.lists.segmented_gather(Column input, Column gather_map_list) Column#

创建一个列,其中的元素是根据gather_map_list中的索引收集的

详情请参见segmented_gather()

Parameters:
inputColumn

输入列。

gather_map_listColumn

要收集的列表列的索引。

Returns:
Column

一个新的列,其中的元素是基于gather_map_list从行列表中收集的

pylibcudf.lists.sequences(Column starts, Column sizes, Column steps=None) Column#

创建一个列表列,其中每行包含由 (start, step, size) 参数元组指定的值序列。

详情请参阅sequences()

Parameters:
startsColumn

结果序列中的第一个值。

sizesColumn

结果序列中的值的数量。

stepsOptional[Column]

增加结果序列的值。

Returns:
Column

包含生成序列的结果列。

pylibcudf.lists.sort_lists(Column input, order sort_order, null_order na_position, bool stable=False) Column#

对列表列中每一行的列表元素进行排序。

详情请参见 sort_lists()

Parameters:
inputColumn

输入列。

ascendingOrder

列表中的排序顺序。

na_positionNullOrder

如果na_position等于NullOrder.FIRST,则输出列中的空值将放在前面。否则,它们将放在后面。

stable: bool

如果为真,则使用stable_sort_lists(),否则使用sort_lists()

Returns:
Column

一个新的列,其中每个列表中的元素已排序。

pylibcudf.lists.union_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column#

创建一个包含在两个输入列表列中找到的不同元素的列表列。

详情请参见 union_distinct()

Parameters:
lhsColumn

输入列表列可能包含的元素。

rhsColumn

输入列表中的列以排除元素。

nulls_equalNullEquality, default EQUAL

空值是否被视为相等。

nans_equalNanEquality, default ALL_EQUAL

NaN 是否被视为相等。

Returns:
Column

包含联合结果的列表列。