扩展数据类型#

cuDF 支持许多扩展数据类型,这些类型建立在 pandas 支持的类型之上。这些数据类型在 pandas 中并不直接可用,pandas 依赖于在 Python 速度而非原生速度下运行的对象数据类型数组。支持以下数据类型:

cudf.CategoricalDtype#

CategoricalDtype([categories, ordered])

用于分类数据的类型,包含类别和有序性。

属性和方法#

CategoricalDtype.categories

一个包含允许的唯一类别的Index

CategoricalDtype.construct_from_string()

从字符串构造此类型。

CategoricalDtype.deserialize(header, frames)

从序列化表示生成对象。

CategoricalDtype.device_deserialize(header, ...)

执行设备端的反序列化任务。

CategoricalDtype.device_serialize()

序列化与设备内存相关的数据和元数据。

CategoricalDtype.from_pandas(dtype)

pandas.CategrocialDtype 转换为 cudf.CategoricalDtype

CategoricalDtype.host_deserialize(header, frames)

执行设备端的反序列化任务。

CategoricalDtype.host_serialize()

序列化与主机内存相关的数据和元数据。

CategoricalDtype.is_dtype(dtype)

检查是否匹配 'dtype'。

CategoricalDtype.name

标识数据类型的字符串。

CategoricalDtype.ordered

类别是否具有有序关系。

CategoricalDtype.serialize()

生成对象的等效可序列化表示。

CategoricalDtype.str

CategoricalDtype.to_pandas()

cudf.CategoricalDtype 转换为 pandas.CategoricalDtype

CategoricalDtype.type

数组的标量类型,例如。

cudf.Decimal32Dtype#

Decimal32Dtype(precision[, scale])

用于表示decimal32数据的类型。

属性和方法#

Decimal32Dtype.ITEMSIZE

Decimal32Dtype.MAX_PRECISION

Decimal32Dtype.deserialize(header, frames)

从序列化表示生成对象。

Decimal32Dtype.device_deserialize(header, frames)

执行设备端的反序列化任务。

Decimal32Dtype.device_serialize()

序列化与设备内存相关的数据和元数据。

Decimal32Dtype.from_arrow(typ)

pyarrow 数据类型构造一个 cudf 十进制数据类型

Decimal32Dtype.host_deserialize(header, frames)

执行设备端的反序列化任务。

Decimal32Dtype.host_serialize()

序列化与主机内存相关的数据和元数据。

Decimal32Dtype.is_dtype(dtype)

检查是否匹配 'dtype'。

Decimal32Dtype.itemsize

一列元素的长度(以字节为单位)。

Decimal32Dtype.precision

十进制精度,以十进制位数表示(一个整数)。

Decimal32Dtype.scale

小数位数(一个整数)。

Decimal32Dtype.serialize()

生成对象的等效可序列化表示。

Decimal32Dtype.str

Decimal32Dtype.to_arrow()

返回等效的 pyarrow 数据类型。

cudf.Decimal64Dtype#

Decimal64Dtype(precision[, scale])

用于表示decimal64数据的类型。

属性和方法#

Decimal64Dtype.ITEMSIZE

Decimal64Dtype.MAX_PRECISION

Decimal64Dtype.deserialize(header, frames)

从序列化表示生成对象。

Decimal64Dtype.device_deserialize(header, frames)

执行设备端的反序列化任务。

Decimal64Dtype.device_serialize()

序列化与设备内存相关的数据和元数据。

Decimal64Dtype.from_arrow(typ)

pyarrow 数据类型构造一个 cudf 十进制数据类型

Decimal64Dtype.host_deserialize(header, frames)

执行设备端的反序列化任务。

Decimal64Dtype.host_serialize()

序列化与主机内存相关的数据和元数据。

Decimal64Dtype.is_dtype(dtype)

检查是否匹配 'dtype'。

Decimal64Dtype.itemsize

一列元素的长度(以字节为单位)。

Decimal64Dtype.precision

十进制精度,以十进制位数表示(一个整数)。

Decimal64Dtype.scale

十进制比例(一个整数)。

Decimal64Dtype.serialize()

生成对象的等效可序列化表示。

Decimal64Dtype.str

Decimal64Dtype.to_arrow()

返回等效的 pyarrow 数据类型。

cudf.Decimal128Dtype#

Decimal128Dtype(precision[, scale])

用于表示decimal128数据的类型。

属性和方法#

Decimal128Dtype.ITEMSIZE

Decimal128Dtype.MAX_PRECISION

Decimal128Dtype.deserialize(header, frames)

从序列化表示生成对象。

Decimal128Dtype.device_deserialize(header, ...)

执行设备端的反序列化任务。

Decimal128Dtype.device_serialize()

序列化与设备内存相关的数据和元数据。

Decimal128Dtype.from_arrow(typ)

pyarrow 数据类型构造一个 cudf 十进制数据类型

Decimal128Dtype.host_deserialize(header, frames)

执行设备端的反序列化任务。

Decimal128Dtype.host_serialize()

序列化与主机内存相关的数据和元数据。

Decimal128Dtype.is_dtype(dtype)

检查是否匹配 'dtype'。

Decimal128Dtype.itemsize

一列元素的长度(以字节为单位)。

Decimal128Dtype.precision

十进制精度,以十进制位数表示(一个整数)。

Decimal128Dtype.scale

十进制比例(一个整数)。

Decimal128Dtype.serialize()

生成对象的等效可序列化表示。

Decimal128Dtype.str

Decimal128Dtype.to_arrow()

返回等效的 pyarrow 数据类型。

cudf.ListDtype#

ListDtype(element_type)

用于表示列表数据的类型。

属性和方法#

ListDtype.deserialize(header, frames)

从序列化表示生成对象。

ListDtype.device_deserialize(header, frames)

执行设备端的反序列化任务。

ListDtype.device_serialize()

序列化与设备内存相关的数据和元数据。

ListDtype.element_type

返回ListDtype的元素类型。

ListDtype.from_arrow(typ)

pyarrow.ListType 创建一个 ListDtype

ListDtype.host_deserialize(header, frames)

执行设备端的反序列化任务。

ListDtype.host_serialize()

序列化与主机内存相关的数据和元数据。

ListDtype.is_dtype(dtype)

检查是否匹配 'dtype'。

ListDtype.leaf_type

返回叶子值的类型。

ListDtype.serialize()

生成对象的等效可序列化表示。

ListDtype.to_arrow()

转换为 pyarrow.ListType

ListDtype.type

数组的标量类型,例如。

cudf.StructDtype#

StructDtype(fields)

用于表示结构体数据的类型。

属性和方法#

StructDtype.deserialize(header, frames)

从序列化表示生成对象。

StructDtype.device_deserialize(header, frames)

执行设备端的反序列化任务。

StructDtype.device_serialize()

序列化与设备内存相关的数据和元数据。

StructDtype.fields

返回列名和数据类型的键值对的有序字典。

StructDtype.from_arrow(typ)

pyarrow.StructType 转换为 StructDtype

StructDtype.host_deserialize(header, frames)

执行设备端的反序列化任务。

StructDtype.host_serialize()

序列化与主机内存相关的数据和元数据。

StructDtype.is_dtype(dtype)

检查是否匹配 'dtype'。

StructDtype.serialize()

生成对象的等效可序列化表示。

StructDtype.to_arrow()

StructDtype 转换为 pyarrow.StructType

StructDtype.type

数组的标量类型,例如。