数据框#
构造函数#
|
一个GPU数据框对象。 |
属性和基础数据#
坐标轴
返回一个表示DataFrame轴线的列表。 |
|
获取行的标签。 |
|
返回列的元组 |
返回此对象中的数据类型。 |
|
|
打印DataFrame的简明摘要。 |
|
根据列的数据类型返回DataFrame列的子集。 |
返回DataFrame的CuPy表示。 |
|
数据的维度。 |
|
返回基础数据中的元素数量。 |
|
返回一个表示DataFrame维度的元组。 |
|
|
返回对象的内存使用情况。 |
指示DataFrame或Series是否为空。 |
转换#
|
将对象转换为指定的数据类型。 |
|
将列转换为最佳可能的可空数据类型。 |
|
复制此对象的索引和数据。 |
索引,迭代#
|
返回前 n 行。 |
|
|
|
|
通过标签或布尔掩码选择行和列。 |
|
按位置选择值。 |
|
|
在由loc指定的索引处向DataFrame添加一列。 |
遍历列名和系列对 |
|
获取列。 |
|
不支持迭代。 |
|
|
不支持迭代。 |
|
返回一列并将其从DataFrame中删除。 |
|
返回最后n行作为新的DataFrame或Series |
|
DataFrame中的每个元素是否包含在values中。 |
|
将一维轴对象压缩为标量。 |
|
替换条件为False的值。 |
|
替换条件为True的值。 |
|
使用布尔表达式查询,使用Numba编译GPU内核。 |
二元运算符函数#
|
获取DataFrame或Series与其他元素的逐元素加法(二元运算符add)。 |
|
获取DataFrame或Series与其他元素的逐元素减法(二元运算符sub)。 |
|
获取DataFrame或Series与其他元素的逐元素减法(二元运算符sub)。 |
|
获取DataFrame或Series与其他元素的逐元素乘法(二元运算符mul)。 |
|
获取DataFrame或Series与其他元素的逐元素乘法(二元运算符mul)。 |
|
获取DataFrame或Series与其他的浮点除法,逐元素操作(二元运算符truediv)。 |
|
获取DataFrame或Series与其他的浮点除法,逐元素进行(二元运算符truediv)。 |
|
获取DataFrame或Series与其他的浮点除法,逐元素(二元运算符truediv)。 |
|
获取DataFrame或Series与其他的整数除法,逐元素(二元运算符floordiv)。 |
|
获取DataFrame或Series与其他的模,逐元素(二元操作符mod)。 |
|
获取DataFrame或Series与其他的指数,逐元素(二元运算符pow)。 |
|
获取框架与其他的点积(二元运算符 dot)。 |
|
获取DataFrame或Series与其他元素的加法,逐元素(二元运算符radd)。 |
|
获取DataFrame或Series与其他元素的减法,逐元素(二元运算符rsub)。 |
|
获取DataFrame或Series与其他的逐元素乘法(二元运算符rmul)。 |
|
获取DataFrame或Series与其他的浮点除法,逐元素(二元运算符rtruediv)。 |
|
获取DataFrame或Series与其他的浮点除法,逐元素(二元运算符rtruediv)。 |
|
获取DataFrame或Series与其他元素的整数除法,逐元素进行(二元运算符rfloordiv)。 |
|
获取DataFrame或Series与其他的模运算,逐元素进行(二元运算符rmod)。 |
|
获取DataFrame或Series与其他的指数,逐元素(二元运算符rpow)。 |
|
四舍五入到指定的小数位数。 |
|
获取DataFrame或Series与其他元素的逐元素小于比较(二元运算符lt)。 |
|
获取DataFrame或Series与其他元素的逐元素大于比较(二元运算符gt)。 |
|
获取DataFrame或Series与其他元素的逐元素小于或等于(二元运算符le)。 |
|
获取DataFrame或Series与其他元素的逐元素大于或等于(二元运算符ge)。 |
|
获取DataFrame或Series与其他元素的逐元素不等比较(二元运算符ne)。 |
|
获取DataFrame或Series与其他的元素级相等(二元操作符eq)。 |
|
返回DataFrame中值的乘积。 |
函数应用、分组及窗口#
|
使用一个或多个操作在指定的轴上进行聚合。 |
|
沿着DataFrame的轴应用一个函数。 |
|
对Dataframe的每个元素应用一个函数。 |
|
使用用户提供的函数转换用户指定的块。 |
|
应用一个逐行的用户定义函数。 |
|
使用映射器或一系列列进行分组。 |
|
对Dataframe的每个元素应用一个函数。 |
|
应用 |
|
滚动窗口计算。 |
计算 / 描述性统计#
返回一个包含每个元素绝对值的Series/DataFrame。 |
|
|
返回DataFrame中所有元素是否为True。 |
|
返回DataFrame中是否有任何元素为True。 |
|
在输入阈值处修剪值。 |
|
计算DataFrame的相关矩阵。 |
|
计算每列或每行的 |
|
计算DataFrame的协方差矩阵。 |
|
返回IndexedFrame的累积最大值。 |
|
返回IndexedFrame的累积最小值。 |
|
返回IndexedFrame的累积乘积。 |
|
返回IndexedFrame的累积和。 |
|
生成描述性统计信息。 |
|
元素的一阶离散差分。 |
|
评估描述DataFrame列操作的字符串。 |
|
提供指数加权(EW)函数。 |
|
返回样本的Fisher无偏峰度。 |
|
返回样本的Fisher无偏峰度。 |
|
返回DataFrame中值的最大值。 |
|
返回请求轴上的值的平均值。 |
|
返回请求轴的值的中位数。 |
|
返回DataFrame中的最小值。 |
|
获取沿选定轴的每个元素的众数。 |
|
计算DataFrame中连续元素之间的百分比变化。 |
|
返回DataFrame中值的乘积。 |
|
返回DataFrame中值的乘积。 |
|
返回给定分位数的值。 |
|
沿轴计算数值数据的排名(1到n)。 |
|
四舍五入到指定的小数位数。 |
将值缩放到 [0, 1] 的 float64 范围内 |
|
|
返回样本的无偏Fisher-Pearson偏度。 |
|
返回DataFrame中值的总和。 |
|
返回DataFrame的样本标准差。 |
|
返回DataFrame的无偏方差。 |
|
计算指定轴上不同元素的数量。 |
|
返回一个包含DataFrame中唯一行计数的Series。 |
重新索引 / 选择 / 标签操作#
|
使用字符串 prefix 作为前缀标签。 |
|
使用字符串suffix作为后缀标签。 |
|
从行或列中删除指定的标签。 |
|
返回删除重复行的DataFrame。 |
|
返回表示重复行的布尔系列。 |
|
测试两个对象是否包含相同的元素。 |
|
根据日期偏移选择时间序列数据的初始周期。 |
|
返回前 n 行。 |
|
根据日期偏移选择时间序列数据的最后周期。 |
|
使DataFrame适应新的索引。 |
|
更改列和索引标签。 |
|
重置DataFrame的索引,或其一个级别。 |
|
返回对象轴上项目的随机样本。 |
|
查找应插入元素以保持顺序的索引 |
|
返回一个带有新索引的新DataFrame |
|
连续重复元素。 |
|
返回最后n行作为新的DataFrame或Series |
|
返回一个包含由indices指定的行的新框架。 |
|
将行重复count次以形成一个新的框架。 |
|
在某个索引值前后截断Series或DataFrame。 |
缺失数据处理#
|
|
|
|
|
从列中删除包含空值的行(或列)。 |
|
|
|
使用 |
|
在一些点之间插值数据。 |
识别缺失值。 |
|
识别缺失值。 |
|
将nans(如果有的话)转换为nulls |
|
识别非缺失值。 |
|
识别非缺失值。 |
|
|
|
|
将 |
重塑、排序、转置#
|
返回将Series值排序的整数索引。 |
将表格中的Series列交错合并为单列。 |
|
|
通过columns中数据的哈希值对数据框进行分区。 |
|
返回由给定索引和列值重新组织的DataFrame。 |
|
创建一个电子表格样式的数据透视表作为DataFrame。 |
|
分散到多个数据框中。 |
|
按任一轴的值排序。 |
|
按标签排序对象(沿轴)。 |
|
返回按columns降序排列的前n行。 |
|
返回按columns升序排列的前n行。 |
|
交换第 i 层和第 j 层。 |
|
将指定的层级从列堆叠到索引 |
|
将(必须是分层的)索引标签的一个或多个级别进行透视。 |
|
将DataFrame从宽格式转换为长格式,可选择保留标识符变量。 |
|
将类似列表的每个元素转换为一行,复制索引值。 |
|
返回由DataFrame的列组成的结构体Series。 |
转置索引和列。 |
|
转置索引和列。 |
组合 / 比较 / 连接 / 合并#
|
从关键字参数中分配列到DataFrame。 |
|
在索引或键列上与其他DataFrame连接列。 |
|
通过执行数据库风格的连接操作,按列或索引合并GPU DataFrame对象。 |
|
使用另一个DataFrame中的非NA值就地修改DataFrame。 |
序列化 / 输入输出 / 转换#
|
从序列化表示生成对象。 |
|
执行设备端的反序列化任务。 |
序列化与设备内存相关的数据和元数据。 |
|
|
将PyArrow表转换为DataFrame。 |
|
从类似数组或字典的字典构造DataFrame。 |
|
从Pandas DataFrame转换。 |
|
将结构化或记录 ndarray 转换为 DataFrame。 |
|
计算此列中值的哈希值。 |
|
执行设备端的反序列化任务。 |
序列化与主机内存相关的数据和元数据。 |
|
生成对象的等效可序列化表示。 |
|
|
转换为 PyArrow 表。 |
|
将DataFrame转换为字典。 |
将cuDF对象转换为DLPack张量。 |
|
|
将DataFrame写入parquet格式。 |
|
将数据框写入csv文件格式。 |
|
将Frame转换为CuPy数组。 |
|
使用HDFStore将包含的数据写入HDF5文件。 |
|
将DataFrame转换为字典。 |
|
将 cuDF 对象转换为 JSON 字符串。 |
|
将Frame转换为NumPy数组。 |
|
转换为Pandas DataFrame。 |
|
将DataFrame写入feather格式。 |
|
转换为numpy的recarray |
转换为字符串 |
|
返回DataFrame的CuPy表示。 |
|
返回数据的NumPy表示。 |