系列#
构造函数#
|
一维GPU数组(包括时间序列)。 |
属性#
坐标轴
返回表示Series轴的列表。 |
|
获取行的标签。 |
|
返回DataFrame的CuPy表示。 |
|
数据的GPU缓冲区 |
|
Series的数据类型。 |
|
获取一个表示索引维度的元组。 |
|
基础数据的维度数,根据定义为1。 |
|
一个布尔值,指示是否需要空值掩码 |
|
用于空值掩码的GPU缓冲区 |
|
空值的数量 |
|
返回基础数据中的元素数量。 |
|
返回转置,根据定义是自身。 |
|
|
返回对象的内存使用情况。 |
如果有任何NaN或null值,则返回True。 |
|
指示Series是否包含空值。 |
|
指示DataFrame或Series是否为空。 |
|
获取此对象的名称。 |
|
非空值的数量 |
|
返回数据的NumPy表示。 |
转换#
|
将对象转换为指定的数据类型。 |
|
将列转换为最佳的可空数据类型。 |
|
复制此对象的索引和数据。 |
|
从序列化表示生成对象。 |
|
执行设备端的反序列化任务。 |
序列化与设备内存相关的数据和元数据。 |
|
|
执行设备端的反序列化任务。 |
序列化与主机内存相关的数据和元数据。 |
|
生成对象的等效可序列化表示。 |
|
|
|
将值缩放到 [0, 1] 的 float64 范围内 |
索引,迭代#
通过标签或布尔掩码选择行和列。 |
|
按位置选择值。 |
|
不支持迭代。 |
|
不支持迭代。 |
|
不支持迭代。 |
|
返回索引的别名。 |
|
|
将1维轴对象压缩为标量。 |
二元运算符函数#
|
获取DataFrame或Series与其他元素的逐元素加法(二元操作符add)。 |
|
获取DataFrame或Series与其他元素的逐元素减法(二元运算符sub)。 |
|
获取DataFrame或Series与其他元素的逐元素减法(二元操作符sub)。 |
|
获取DataFrame或Series与其他的逐元素乘法(二元操作符mul)。 |
|
获取DataFrame或Series与其他的逐元素乘法(二元操作符mul)。 |
|
获取DataFrame或Series与其他的浮点除法,逐元素(二元运算符truediv)。 |
|
获取DataFrame或Series与其他的浮点除法,逐元素(二元运算符truediv)。 |
|
获取DataFrame或Series与其他的浮点除法,逐元素进行(二元操作符truediv)。 |
|
获取DataFrame或Series与其他的整数除法,逐元素进行(二元运算符floordiv)。 |
|
获取DataFrame或Series与其他的模,逐元素(二元操作符mod)。 |
|
获取DataFrame或Series与其他的指数,逐元素(二元操作符pow)。 |
|
获取DataFrame或Series与其他元素的加法,逐元素(二元运算符radd)。 |
|
获取DataFrame或Series与其他元素的逐元素减法(二元运算符rsub)。 |
|
获取DataFrame或Series与其他的逐元素乘法(二元运算符rmul)。 |
|
获取DataFrame或Series与其他元素的浮点除法,逐元素(二元运算符rtruediv)。 |
|
获取DataFrame或Series与其他的浮点除法,逐元素(二元运算符rtruediv)。 |
|
获取DataFrame或Series与其他元素的整数除法,逐元素进行(二元运算符rfloordiv)。 |
|
获取DataFrame或Series与其他的逐元素取模(二元操作符rmod)。 |
|
获取DataFrame或Series与其他的指数,逐元素(二元运算符rpow)。 |
|
四舍五入到指定的小数位数。 |
|
获取DataFrame或Series与其他元素的逐元素小于比较(二元操作符lt)。 |
|
获取DataFrame或Series与其他元素的逐元素大于比较(二元操作符gt)。 |
|
获取DataFrame或Series与其他元素的逐元素小于或等于(二元运算符le)。 |
|
获取DataFrame或Series与其他元素的逐元素大于或等于(二元运算符ge)。 |
|
获取DataFrame或Series与其他元素的逐元素不等比较(二元运算符ne)。 |
|
获取DataFrame或Series与其他元素的逐元素相等(二元操作符eq)。 |
|
返回DataFrame中值的乘积。 |
|
获取框架与其他的点积,(二元操作符 dot)。 |
函数应用、分组及窗口#
|
将标量函数应用于Series的值。 |
|
根据输入对应关系映射Series的值。 |
|
使用映射器或通过一系列列进行分组。 |
|
滚动窗口计算。 |
|
应用 |
计算 / 描述性统计#
返回一个包含每个元素绝对值的Series/DataFrame。 |
|
|
返回DataFrame中所有元素是否为True。 |
|
返回DataFrame中是否有任何元素为True。 |
|
计算滞后N的自相关。 |
|
返回布尔系列,相当于 left <= series <= right。 |
|
在输入阈值处修剪值。 |
|
计算两个Series之间的样本相关性,排除缺失值。 |
返回Series中非NA/非空观测值的数量 |
|
|
计算与Series的协方差,排除缺失值。 |
|
返回Series的累积最大值。 |
|
返回Series的累积最小值。 |
|
返回Series的累积乘积。 |
|
返回Series的累积和。 |
|
生成描述性统计信息。 |
|
元素的第一个离散差异。 |
|
返回每个值所属的区间的索引。 |
|
提供指数加权(EW)函数。 |
|
将输入值编码为整数标签。 |
|
返回样本的Fisher无偏峰度。 |
|
返回DataFrame中的最大值。 |
|
返回请求轴上的值的平均值。 |
|
返回请求轴的值的中位数。 |
|
返回DataFrame中的最小值。 |
|
返回数据集的众数。 |
|
返回一个新的包含n个最大元素的Series。 |
|
返回一个新的Series,包含n个最小的元素。 |
|
计算Series中连续元素之间的百分比变化。 |
|
返回DataFrame中值的乘积。 |
|
返回给定分位数的值。 |
|
沿轴计算数值数据的排名(1到n)。 |
|
返回样本的无偏Fisher-Pearson偏度。 |
|
返回DataFrame的样本标准差。 |
|
返回DataFrame中值的总和。 |
|
返回DataFrame的无偏方差。 |
|
返回样本的Fisher无偏峰度。 |
返回此Series的唯一值。 |
|
|
返回列中唯一值的计数。 |
如果对象中的值是唯一的,则返回布尔值。 |
|
如果对象中的值单调递增,则返回布尔值。 |
|
如果对象中的值单调递减,则返回布尔值。 |
|
|
返回一个包含唯一值计数的Series。 |
重新索引 / 选择 / 标签操作#
|
使用字符串 prefix 作为前缀标签。 |
|
使用字符串suffix作为后缀标签。 |
|
从行或列中删除指定的标签。 |
|
返回删除重复值的Series。 |
|
指示重复的Series值。 |
|
测试两个对象是否包含相同的元素。 |
|
根据日期偏移选择时间序列数据的初始周期。 |
|
返回前 n 行。 |
|
检查值是否包含在Series中。 |
|
根据日期偏移量选择时间序列数据的最后几个周期。 |
|
使Series适应新的索引。 |
|
更改系列名称 |
|
重置Series的索引,或其一个级别。 |
|
从对象的轴返回随机样本项。 |
|
返回一个包含由indices指定的行的新框架。 |
|
返回最后n行作为新的DataFrame或Series |
|
将行重复 count 次以形成一个新的 Frame。 |
|
在某个索引值前后截断Series或DataFrame。 |
|
替换条件为False的值。 |
|
替换条件为True的值。 |
缺失数据处理#
|
|
|
|
|
返回一个删除了空值的Series。 |
|
|
|
使用 |
|
在某些点之间插值数据。 |
识别缺失值。 |
|
识别缺失值。 |
|
将nans(如果有)转换为nulls |
|
识别非缺失值。 |
|
识别非缺失值。 |
|
|
|
|
将 |
重塑、排序#
|
返回将Series值排序的整数索引。 |
|
沿任一轴按值排序。 |
|
按标签排序对象(沿轴)。 |
|
将类似列表的每个元素转换为一行,复制索引值。 |
|
查找应插入元素以保持顺序的索引 |
|
连续重复元素。 |
返回转置,根据定义是自身。 |
组合 / 比较 / 连接 / 合并#
|
使用传入的Series的值就地修改Series。 |
访问器#
pandas 在各种访问器下提供了特定于数据类型的方法。
这些是 Series 中的独立命名空间,仅适用于特定的数据类型。
日期时间属性#
Series.dt 可用于访问系列的值作为类似日期时间的对象,并返回多个属性。
这些属性可以通过 Series.dt. 的方式访问。
用于访问Series值的日期时间属性的访问器对象。 |
日期时间属性#
日期时间的年份。 |
|
月份,1月=1,12月=12。 |
|
日期时间的天数。 |
|
日期时间的小时部分。 |
|
日期时间中的分钟部分。 |
|
日期时间的秒数。 |
|
日期时间的微秒部分。 |
|
日期时间的纳秒部分。 |
|
一周中的第几天,周一=0,周日=6。 |
|
一周中的某一天,周一=0,周日=6。 |
|
一年中的第几天,非闰年为1-365,闰年为1-366。 |
|
一年中的第几天,非闰年为1-365,闰年为1-366。 |
|
表示日期属于一年中的哪个季度的整数指示符。 |
|
布尔值,指示日期是否为月份的第一天。 |
|
布尔指示符,表示日期是否为该月的最后一天。 |
|
布尔指示符,表示日期是否为季度的第一天。 |
|
布尔指示符,表示日期是否为季度的最后一天。 |
|
布尔指示符,表示日期是否为一年中的第一天。 |
|
布尔指示符,表示日期是否为一年中的最后一天。 |
|
布尔指示符,表示日期是否属于闰年。 |
|
获取日期所在月份的总天数。 |
日期时间方法#
返回一个DataFrame,其中包含根据ISO 8601标准计算的年、周和日。 |
|
|
使用指定的 |
|
对数据执行四舍五入操作到指定的频率。 |
|
对数据执行向下取整操作到指定的频率。 |
|
对数据执行向上取整操作到指定的频率。 |
|
将无时区数据本地化为有时区数据。 |
时间差属性#
天数。 |
|
秒数(大于等于0且小于1天)。 |
|
微秒数(大于等于0且小于1秒)。 |
|
返回纳秒数(n),其中 0 <= n < 1 微秒。 |
|
返回一个包含Timedeltas组件的数据框。 |
字符串处理#
Series.str 可以用来访问系列的值作为字符串并对其应用多种方法。这些方法可以通过 Series.str.<函数/属性> 来访问。
用于Series和Index的向量化字符串函数。 |
计算Series/Index中每个字符串的字节数。 |
|
将Series/Index中的字符串转换为首字母大写。 |
|
|
将Series/Index中的字符串与给定的分隔符连接起来。 |
|
使用额外字符填充Series/Index中字符串的左右两侧。 |
|
从字符串列中的字符生成n-grams。 |
每个字符串被分割成单个字符。 |
|
返回一个数组,该数组填充了每个字符串中每个字符的UTF-8代码点值。 |
|
|
测试模式或正则表达式是否包含在Series或Index的字符串中。 |
|
计算Series/Index中每个字符串中模式的出现次数。 |
|
通过按照它们在 |
|
使用Levenshtein编辑距离算法将 |
计算系列中字符串之间的编辑距离。 |
|
|
测试每个字符串元素的结尾是否匹配一个模式。 |
|
将正则表达式 pat 中的捕获组提取为 DataFrame 中的列。 |
|
从此列中的字符串中删除非字母数字字符。 |
|
使用给定映射表中的字符范围从每个字符串中移除字符。 |
|
从系列中的每个字符串中移除小于min_token_length的标记,并可选地用替换字符串替换它们。 |
|
返回Series/Index中每个字符串中子字符串完全包含在 |
|
在Series/Index中查找模式或正则表达式的所有出现。 |
|
在Series/Index中查找所有模式的首个出现位置。 |
|
从每个组件的指定位置提取元素。 |
|
将JSONPath字符串应用于输入字符串列,其中列中的每一行都是有效的json字符串 |
返回由每个十六进制字符串表示的整数值。 |
|
|
返回由每个十六进制字符串表示的整数值。 |
|
返回每个字符串中子字符串完全包含在 |
|
将指定的字符串插入到每个字符串的指定位置。 |
|
将IP字符串转换为整数 |
将IP字符串转换为整数 |
|
|
如果字符串中 |
|
对于在 |
|
检查每个字符串中的所有字符是否都是字母数字。 |
|
检查每个字符串中的所有字符是否都是字母。 |
检查每个字符串中的所有字符是否都是十进制数字。 |
|
|
检查每个字符串中的所有字符是否都是数字。 |
|
检查每个字符串是否为空字符串。 |
|
检查每个字符串中的所有字符是否形成浮点值。 |
|
检查每个字符串中的所有字符是否构成一个十六进制整数。 |
检查每个字符串中的所有字符是否形成整数。 |
|
|
检查每个字符串中的所有字符是否构成一个IPv4地址。 |
|
检查每个字符串中的所有字符是否都是空白字符。 |
|
检查每个字符串中的所有字符是否都是小写。 |
检查每个字符串中的所有字符是否都是数字。 |
|
|
检查每个字符串中的所有字符是否都是大写。 |
|
检查每个字符串中的所有字符是否可以使用给定的格式转换为时间戳。 |
|
检查每个字符串是否为标题格式。 |
|
计算此列与给定输入字符串列之间的Jaccard指数。 |
|
将Series/Index中包含的列表与传递的分隔符连接起来。 |
|
计算Series/Index中每个元素的长度。 |
|
测试一个like模式是否匹配Series或Index的字符串。 |
|
在Series/Index的字符串右侧填充一个额外的字符。 |
|
将所有字符转换为小写。 |
|
移除前导和尾随字符。 |
|
确定每个字符串是否匹配正则表达式。 |
|
计算字符串列的minhash值。 |
|
从一组标记中生成n-grams,系列中的每条记录被视为一个标记。 |
|
使用每个字符串中的标记生成n-grams。 |
|
规范化字符串字符以便进行分词。 |
移除标记之间的多余空格,并修剪每个字符串开头和结尾的空格。 |
|
|
将Series/Index中的字符串填充到指定宽度。 |
|
在第一次出现 sep 的地方分割字符串。 |
计算每个字符串的Porter Stemmer度量。 |
|
|
复制Series或Index中的每个字符串。 |
|
从对象系列中移除前缀。 |
|
从对象系列中移除后缀。 |
|
将Series/Index中的模式/正则表达式替换为其他字符串。 |
|
在系列中的每个字符串中搜索目标标记,并在找到时用相应的替换项替换。 |
|
使用 |
|
返回Series/Index中每个字符串中子字符串完全包含在 |
|
返回每个字符串中子字符串完全包含在 |
|
在Series/Index中的字符串左侧填充额外的字符。 |
|
在最后一次出现 sep 的地方分割字符串。 |
|
围绕给定的分隔符/定界符分割字符串。 |
|
移除前导和尾随字符。 |
|
从Series或Index中的每个元素中切片子字符串。 |
|
返回每个字符串的子字符串,使用每个字符串的位置。 |
|
用新字符串替换每个字符串的指定部分。 |
|
围绕给定的分隔符/定界符分割字符串。 |
|
测试每个字符串元素的开头是否匹配一个模式。 |
|
移除前导和尾随字符。 |
|
将每个小写字符转换为大写,反之亦然。 |
|
将每个空格后的第一个字母大写,其余字母小写。 |
|
每个字符串使用提供的分隔符分割成令牌。 |
|
每个字符串使用提供的分隔符分割成令牌。 |
|
通过给定的映射表映射字符串中的所有字符。 |
|
将每个字符串转换为大写。 |
返回每个字符串的URL解码格式。 |
|
返回每个字符串的URL编码格式。 |
|
|
将Series/Index中的长字符串换行,使其在段落中格式化,长度小于给定宽度。 |
|
通过在Series/Index中的字符串前面添加'0'字符来填充字符串。 |
分类访问器#
分类数据类型特定的方法和属性可通过Series.cat访问器获得。
用于访问Series值的分类属性的访问器对象。 |
此分类的类别。 |
|
类别是否具有有序关系。 |
|
返回代码的Series以及索引。 |
|
|
按照new_categories中指定的顺序重新排列类别。 |
|
添加新类别。 |
|
移除指定的类别。 |
|
将类别设置为指定的 new_categories。 |
将分类设置为有序。 |
|
将分类设置为无序。 |
列表处理#
Series.list 可以用来访问系列的值作为列表,并对其应用列表方法。这些可以通过 Series.list. 来访问。
Series的列表方法 |
|
返回一个新的列表系列,其中叶值转换为指定的数据类型。 |
|
对于至少有一层嵌套的列,连接每行中的列表。 |
|
返回布尔值,指示指定的标量是否是每行的元素。 |
|
返回表示每行搜索键索引的整数。 |
|
从列表系列中的每个列表中提取给定索引处的元素。 |
从一系列(可能是嵌套的)列表中,获取最内层列表的元素,并将其展平为一个Series(每行一个值)。 |
|
|
计算Series/Index中每个元素的长度。 |
|
按值对每个列表进行排序。 |
|
根据给定的索引收集列表元素。 |
|
返回每个列表中的唯一元素。 |
结构处理#
Series.struct 可以用来访问系列的值作为结构体并对其应用结构体方法。这些可以通过 Series.struct. 来访问。
Series的结构方法 |
序列化 / 输入输出 / 转换#
转换为PyArrow数组。 |
|
|
将Frame转换为CuPy数组。 |
|
将Series转换为{标签 -> 值}字典或类似字典的对象。 |
将 cuDF 对象转换为 DLPack 张量。 |
|
|
将Series转换为DataFrame |
|
使用HDFStore将包含的数据写入HDF5文件。 |
|
将cuDF对象转换为JSON字符串。 |
|
将Frame转换为NumPy数组。 |
|
转换为 pandas Series。 |
转换为字符串 |
|
|
从 PyArrow 数组/分块数组创建。 |
|
从 pandas.Categorical 创建 |
|
创建一个带有空值掩码的Series。 |
|
从Pandas Series转换。 |
|
计算此列中值的哈希值。 |