列表#
- pylibcudf.lists.ConcatenateNullPolicy#
另请参阅
cudf::concatenate_null_policy。枚举成员
IGNORENULLIFY_OUTPUT_ROW
- pylibcudf.lists.DuplicateFindOption#
另请参阅
cudf::duplicate_find_option。枚举成员
FIND_FIRSTFIND_LAST
- pylibcudf.lists.apply_boolean_mask(Column input, Column boolean_mask) Column#
使用布尔掩码过滤输入列表列中每行的元素
详情请参见
apply_boolean_mask()。- Parameters:
- inputColumn
输入列。
- boolean_maskColumn
布尔掩码。
- Returns:
- Column
基于布尔掩码的过滤元素列。
- pylibcudf.lists.concatenate_list_elements(Column input, concatenate_null_policy null_policy) Column#
将同一行上的多个列表连接成一个单一列表。
详情请参见
concatenate_list_elements()。- Parameters:
- inputColumn
输入列
- null_policyConcatenateNullPolicy
如何处理空列表元素。
- Returns:
- Column
一个新的列,包含连接后的列表元素
- pylibcudf.lists.concatenate_rows(Table input) Column#
将多个列表列按行连接成单个列表列。
详情请参阅
concatenate_list_elements()。- Parameters:
- inputTable
输入表
- Returns:
- Table
一个新的连接行的列
- pylibcudf.lists.contains(signatures, args, kwargs, defaults, _fused_sigindex={})#
创建一个布尔值列,指示输入中是否包含 search_key。
search_key可能是一个Column或一个Scalar。详情请参见
contains()。- Parameters:
- inputColumn
输入列。
- search_keyUnion[Column, Scalar]
搜索键。
- Returns:
- Column
一个新的布尔列,指示是否在列表列中找到了search_key。
- pylibcudf.lists.contains_nulls(Column input) Column#
创建一个布尔值列,指示列表列中的每一行是否包含空值。
详情请参见
contains_nulls()。- Parameters:
- inputColumn
输入列。
- Returns:
- Column
一个新的布尔列,指示列表列是否包含空值。
- pylibcudf.lists.count_elements(Column input) Column#
计算给定列表列中每个列表元素的行数。 有关详细信息,请参阅
count_elements()。详情请参阅
count_elements()。- Parameters:
- inputColumn
输入列
- Returns:
- Column
每个列表元素长度的新列
- pylibcudf.lists.difference_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column#
创建一个索引值列,指示搜索键行在列表列中对应列表行中的位置。
详情请参阅
difference_distinct()。- Parameters:
- lhsColumn
输入列表列可能包含的元素。
- rhsColumn
输入列表中的列以排除元素。
- nulls_equalNullEquality, default EQUAL
空值是否被视为相等。
- nans_equalNanEquality, default ALL_EQUAL
NaN 是否被视为相等。
- Returns:
- Column
包含差异结果的列表列。
- pylibcudf.lists.distinct(Column input, null_equality nulls_equal, nan_equality nans_equal) Column#
创建一个新的列表列,其中每个列表中没有重复的元素。
详情请参见
distinct()。- Parameters:
- inputColumn
输入列。
- nulls_equalNullEquality
空值是否被视为相等。
- nans_equalNanEquality
NaN 是否被视为相等。
- Returns:
- Column
一个新的列表列,其中每个列表中没有重复元素。
- pylibcudf.lists.explode_outer(Table input, size_type explode_column_idx) Table#
将列表列展开为行。
所有其他列将为列表中的每个元素复制。
详情请参见
explode_outer()。- Parameters:
- inputTable
输入表
- explode_column_idxint
要展开的列的索引
- Returns:
- Table
一个带有展开列的新表
- pylibcudf.lists.extract_list_element(signatures, args, kwargs, defaults, _fused_sigindex={})#
创建一个提取列表元素的列。
详情请参见
extract_list_element()。- Parameters:
- inputColumn
输入列。
- indexUnion[Column, size_type]
选择索引或索引。
- Returns:
- Column
一个新的列,其中包含提取的元素。
- pylibcudf.lists.have_overlap(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column#
检查给定列表列中每行的列表是否重叠。
详情请参见
have_overlap()。- Parameters:
- lhsColumn
输入列表列为一侧。
- rhsColumn
输入列表列用于另一方。
- nulls_equalNullEquality, default EQUAL
空值是否被视为相等。
- nans_equalNanEquality, default ALL_EQUAL
NaN 是否被视为相等。
- Returns:
- Column
包含检查结果的列。
- pylibcudf.lists.index_of(signatures, args, kwargs, defaults, _fused_sigindex={})#
创建一个索引值列,指示搜索键行在列表列中对应列表行中的位置。
search_key可能是一个Column或一个Scalar。详情请参见
index_of()。- Parameters:
- inputColumn
输入列。
- search_keyUnion[Column, Scalar]
搜索键。
- find_optionDuplicateFindOption
如果有重复项,返回哪个匹配项。
- Returns:
- Column
一个新的索引值列,指示在列表列中找到search_key的位置。索引值为-1表示未找到search_key。
- pylibcudf.lists.intersect_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column#
创建一个包含两个输入列表列中共同的不同元素的列表列。
详情请参见
intersect_distinct()。- Parameters:
- lhsColumn
输入列表列可能包含的元素。
- rhsColumn
输入列表中的列以排除元素。
- nulls_equalNullEquality, default EQUAL
空值是否被视为相等。
- nans_equalNanEquality, default ALL_EQUAL
NaN 是否被视为相等。
- Returns:
- Column
包含交集结果的列表列。
- pylibcudf.lists.reverse(Column input) Column#
反转输入列中每个列表的元素顺序。
详情请参见
reverse()。- Parameters:
- inputColumn
输入列。
- Returns:
- Column
一个新的列,包含反转的列表。
- pylibcudf.lists.segmented_gather(Column input, Column gather_map_list) Column#
创建一个列,其中的元素是根据gather_map_list中的索引收集的
详情请参见
segmented_gather()。- Parameters:
- inputColumn
输入列。
- gather_map_listColumn
要收集的列表列的索引。
- Returns:
- Column
一个新的列,其中的元素是基于gather_map_list从行列表中收集的
- pylibcudf.lists.sequences(Column starts, Column sizes, Column steps=None) Column#
创建一个列表列,其中每行包含由 (start, step, size) 参数元组指定的值序列。
详情请参阅
sequences()。- Parameters:
- startsColumn
结果序列中的第一个值。
- sizesColumn
结果序列中的值的数量。
- stepsOptional[Column]
增加结果序列的值。
- Returns:
- Column
包含生成序列的结果列。
- pylibcudf.lists.sort_lists(Column input, order sort_order, null_order na_position, bool stable=False) Column#
对列表列中每一行的列表元素进行排序。
详情请参见
sort_lists()。- Parameters:
- inputColumn
输入列。
- ascendingOrder
列表中的排序顺序。
- na_positionNullOrder
如果na_position等于NullOrder.FIRST,则输出列中的空值将放在前面。否则,它们将放在后面。
- stable: bool
如果为真,则使用
stable_sort_lists(),否则使用sort_lists()。
- Returns:
- Column
一个新的列,其中每个列表中的元素已排序。
- pylibcudf.lists.union_distinct(Column lhs, Column rhs, null_equality nulls_equal=null_equality.EQUAL, nan_equality nans_equal=nan_equality.ALL_EQUAL) Column#
创建一个包含在两个输入列表列中找到的不同元素的列表列。
详情请参见
union_distinct()。- Parameters:
- lhsColumn
输入列表列可能包含的元素。
- rhsColumn
输入列表中的列以排除元素。
- nulls_equalNullEquality, default EQUAL
空值是否被视为相等。
- nans_equalNanEquality, default ALL_EQUAL
NaN 是否被视为相等。
- Returns:
- Column
包含联合结果的列表列。