#

class pylibcudf.column.Column(DataType data_type, size_type size, gpumemoryview data, gpumemoryview mask, size_type null_count, size_type offset, list children)#

一个包含可空设备数据的容器,作为一列元素。

该类是Arrow列式数据规范的实现,用于存储在GPU上的数据。它依赖于类似Python memoryview的语义来维护其构造数据的共享所有权,因此任何输入数据也可能由其他数据结构共同拥有。该列设计用于使用由libcudf支持的算法进行操作。

Parameters:
data_typeDataType

列中数据的类型。

sizesize_type

列中的行数。

datagpumemoryview

该列将引用的数据。

maskgpumemoryview

该列的空值掩码。

null_countint

列中空行的数量。

offsetint

数据缓冲区中列数据开始的偏移量。

childrenlist

如果这是一个复合列类型,则此列的子列。

方法

all_null_like(Column like, size_type size)

从模板创建一个全空列。

child(self, size_type index)

获取此列的子列。

children(self)

该列的子列。

copy(self)

创建列的副本。

data(self)

列的数据缓冲区。

from_cuda_array_interface_obj(obj)

从具有CUDA数组接口的对象创建一个列。

from_scalar(Scalar slr, size_type size)

从标量创建一个列。

list_view(self)

访问特定于列表的列方法的访问器。

null_count(self)

列中空元素的数量。

null_mask(self)

该列的空值掩码。

num_children(self)

此列的子列数量。

offset(self)

列的偏移量。

size(self)

列中的元素数量。

type(self)

列中数据的类型。

with_mask(self, gpumemoryview mask, ...)

使用新的空值掩码增强此列。

static all_null_like(Column like, size_type size)#

从模板创建一个全空列。

Parameters:
likeColumn

我们应该模仿其类型的列

sizeint

结果列中的行数。

Returns:
Column

一个全空的列,包含size行,并且类型与like匹配。

child(self, size_type index) Column#

获取此列的子列。

Parameters:
indexsize_type

要获取的子列的索引。

Returns:
Column

子列。

children(self) list#

列的子元素。

copy(self) Column#

创建列的副本。

data(self) gpumemoryview#

列的数据缓冲区。

static from_cuda_array_interface_obj(obj)#

从具有CUDA数组接口的对象创建一个列。

Parameters:
objobject

用于创建列的具有CUDA数组接口的对象。

Returns:
Column

包含来自CUDA数组接口的数据的列。

注释

创建列时不会复制数据。调用者有责任确保在使用列时数据不会意外更改。

static from_scalar(Scalar slr, size_type size)#

从标量创建一个列。

Parameters:
slrScalar

用于创建列的标量。

sizesize_type

列中的元素数量。

Returns:
Column

一个包含标量重复size次的列。

list_view(self) ListColumnView#

用于访问特定于列表的列方法的访问器。

null_count(self) size_type#

列中空元素的数量。

null_mask(self) gpumemoryview#

列的空掩码。

num_children(self) size_type#

此列的子项数量。

offset(self) size_type#

列的偏移量。

size(self) size_type#

列中的元素数量。

type(self) DataType#

列中数据的类型。

with_mask(self, gpumemoryview mask, size_type null_count) Column#

用一个新的空掩码增强此列。

Parameters:
maskgpumemoryview

新掩码(或设置为None以取消掩码)

null_countint

新的空值计数。如果这是不正确的,会发生不好的事情。

Returns:
New Column object sharing data with self (except for the mask which is new).
class pylibcudf.column.ListColumnView(Column col)#

用于访问特定于列表的列方法的访问器。

方法

child(self)

底层列表列的数据列。

offsets(self)

底层列表列的偏移量列。

child(self)#

基础列表列的数据列。

offsets(self)#

基础列表列的偏移量列。

pylibcudf.column.is_c_contiguous(shape: Sequence[int], strides: Sequence[int], int itemsize: int) bool#

确定形状和步幅是否为C连续的

Parameters:
shapeSequence[int]

每个维度中的元素数量。

stridesSequence[int]

每个维度的步幅(以字节为单位)。

itemsizeint

元素的大小,以字节为单位。

Returns:
bool

布尔答案。