通用函数#

数据操作#

cudf.concat(objs[, axis, join, ...])

按行连接DataFrames、Series或Indices。

cudf.crosstab(index, columns[, values, ...])

计算两个(或更多)因素的简单交叉表。

cudf.cut(x, bins[, right, labels, retbins, ...])

将值分箱到离散区间。

cudf.factorize(values[, sort, ...])

将输入值编码为整数标签

cudf.get_dummies(data[, prefix, prefix_sep, ...])

返回一个数据框,其列是df中所有列的单热编码

cudf.melt(frame[, id_vars, value_vars, ...])

将DataFrame从宽格式转换为长格式,可选择保留标识符变量。

cudf.merge(left, right, *args, **kwargs)

通过列或索引执行数据库风格的连接操作来合并GPU DataFrame对象。

cudf.pivot(data[, columns, index, values])

返回由给定索引和列值组织的重塑后的DataFrame。

cudf.pivot_table(data[, values, index, ...])

创建一个电子表格样式的数据透视表作为DataFrame。

cudf.unstack(df, level[, fill_value, sort])

将(必须是分层的)索引标签的一个或多个级别进行透视。

顶级转换#

cudf.to_numeric(arg[, errors, downcast, ...])

将参数转换为数值类型。

cudf.from_dataframe(df[, allow_copy])

从支持数据框交换协议的对象构建一个DataFrame

cudf.from_dlpack(pycapsule_obj)

将DLPack张量转换为cuDF对象。

cudf.from_pandas(obj[, nan_as_null])

将某些Pandas对象转换为cudf等效对象。

处理日期时间数据的顶级方法#

cudf.to_datetime(arg[, errors, dayfirst, ...])

将参数转换为日期时间。

cudf.date_range([start, end, periods, freq, ...])

返回一个固定频率的DatetimeIndex。

处理区间数据的顶级方法#

cudf.interval_range([start, end, periods, ...])

返回一个固定频率的IntervalIndex。