列#
- class pylibcudf.column.Column(DataType data_type, size_type size, gpumemoryview data, gpumemoryview mask, size_type null_count, size_type offset, list children)#
一个包含可空设备数据的容器,作为一列元素。
该类是Arrow列式数据规范的实现,用于存储在GPU上的数据。它依赖于类似Python memoryview的语义来维护其构造数据的共享所有权,因此任何输入数据也可能由其他数据结构共同拥有。该列设计用于使用由libcudf支持的算法进行操作。
- Parameters:
- data_typeDataType
列中数据的类型。
- sizesize_type
列中的行数。
- datagpumemoryview
该列将引用的数据。
- maskgpumemoryview
该列的空值掩码。
- null_countint
列中空行的数量。
- offsetint
数据缓冲区中列数据开始的偏移量。
- childrenlist
如果这是一个复合列类型,则此列的子列。
方法
all_null_like(Column like, size_type size)从模板创建一个全空列。
child(self, size_type index)获取此列的子列。
children(self)该列的子列。
copy(self)创建列的副本。
data(self)列的数据缓冲区。
从具有CUDA数组接口的对象创建一个列。
from_scalar(Scalar slr, size_type size)从标量创建一个列。
list_view(self)访问特定于列表的列方法的访问器。
null_count(self)列中空元素的数量。
null_mask(self)该列的空值掩码。
num_children(self)此列的子列数量。
offset(self)列的偏移量。
size(self)列中的元素数量。
type(self)列中数据的类型。
with_mask(self, gpumemoryview mask, ...)使用新的空值掩码增强此列。
- static all_null_like(Column like, size_type size)#
从模板创建一个全空列。
- Parameters:
- likeColumn
我们应该模仿其类型的列
- sizeint
结果列中的行数。
- Returns:
- Column
一个全空的列,包含size行,并且类型与like匹配。
- child(self, size_type index) Column#
获取此列的子列。
- Parameters:
- indexsize_type
要获取的子列的索引。
- Returns:
- Column
子列。
- data(self) gpumemoryview#
列的数据缓冲区。
- static from_cuda_array_interface_obj(obj)#
从具有CUDA数组接口的对象创建一个列。
- Parameters:
- objobject
用于创建列的具有CUDA数组接口的对象。
- Returns:
- Column
包含来自CUDA数组接口的数据的列。
注释
创建列时不会复制数据。调用者有责任确保在使用列时数据不会意外更改。
- static from_scalar(Scalar slr, size_type size)#
从标量创建一个列。
- Parameters:
- slrScalar
用于创建列的标量。
- sizesize_type
列中的元素数量。
- Returns:
- Column
一个包含标量重复size次的列。
- list_view(self) ListColumnView#
用于访问特定于列表的列方法的访问器。
- null_count(self) size_type#
列中空元素的数量。
- null_mask(self) gpumemoryview#
列的空掩码。
- num_children(self) size_type#
此列的子项数量。
- offset(self) size_type#
列的偏移量。
- size(self) size_type#
列中的元素数量。