Series ¶
Attributes ¶
Series 的索引(轴标签)列。 |
|
返回底层数据的dtype对象。 |
|
返回底层数据的dtype对象。 |
|
返回一个表示数组维数目的整数。 |
|
返回 Series 的名称。 |
|
返回底层数据形状的元组。 |
|
返回行轴标签的列表。 |
|
返回一个表示此对象中元素数量的整数。 |
|
如果当前对象为空,则返回 true。 |
|
返回转置,即自身。 |
|
如果存在任何缺失值,则返回True。 |
|
返回DataFrame或Series的Numpy表示形式。 |
Conversion ¶
|
将 pandas-on-Spark 对象转换为指定的数据类型
|
|
复制此对象的索引和数据。 |
|
返回当前对象中单个元素的布尔值。 |
Indexing, iteration ¶
访问行/列标签对的一个单一值。 |
|
通过整数位置访问行/列对的单个值。 |
|
通过标签或布尔序列访问一组行和列。 |
|
纯基于整数位置的索引,用于按位置选择。 |
|
|
返回索引的别名。 |
|
返回项目并从系列中删除。 |
|
惰性地迭代(索引,值)元组。 |
这是
|
|
|
返回底层数据的第一个元素作为Python标量。 |
|
返回序列的横截面。 |
|
从对象中获取给定键的项(DataFrame 列、Panel 切片等)。 |
Binary operator functions ¶
|
返回序列和其他元素的加法运算结果,逐元素进行(二元运算符 + )。 |
|
返回序列和其他的浮点数除法,逐元素进行(二元运算符 / )。 |
|
返回序列和其他元素的乘积,逐元素进行(二元运算符 * )。 |
|
返回序列和其他的反向加法,逐元素进行(二元运算符 + )。 |
|
返回序列和其他的反向浮点除法,逐元素进行(二元运算符 / )。 |
|
返回序列和其他的反向乘法,逐元素进行(二元运算符 * )。 |
|
返回序列和其他的反向减法,逐元素进行(二元运算符 - )。 |
|
返回序列和其他的反向浮点除法,逐元素进行(二元运算符 / )。 |
|
返回序列和其他的元素减法结果,逐元素进行(二元运算符 - )。 |
|
返回序列和其他的浮点数除法,逐元素进行(二元运算符 / )。 |
|
返回序列与序列及其他元素的指数幂(二元运算符 ** )。 |
|
返回序列和其他的反指数幂,逐元素操作(二元运算符 ** )。 |
|
返回序列和其他的模,逐元素进行(二元运算符 % )。 |
|
返回序列和其他的反向模数,逐元素进行(二元运算符 % )。 |
|
返回序列和其他的整数除法,逐元素进行(二元运算符 // )。 |
|
返回序列和其他的反向整数除法,逐元素进行(二元运算符 // )。 |
|
返回序列和另一个序列的整数除法和模数,逐元素进行(二元运算符 divmod )。 |
|
返回序列和另一个序列的整数除法和模,逐元素操作(二元运算符 rdivmod )。 |
|
合并 Series 的值,优先选择调用 Series 的值。 |
|
比较当前值是否小于另一个值。 |
|
比较当前值是否大于另一个值。 |
|
比较当前值是否小于或等于另一个值。 |
|
比较当前值是否大于或等于另一个值。 |
|
比较当前值是否不等于另一个值。 |
|
比较当前值是否等于另一个值。 |
|
返回值的乘积。 |
|
计算Series与other列之间的点积。 |
Function application, GroupBy & Window ¶
|
在Series的值上调用函数。 |
|
在指定轴上使用一个或多个操作进行聚合。 |
|
在指定轴上使用一个或多个操作进行聚合。 |
|
调用
|
|
根据输入对应关系映射Series的值。 |
|
使用一个或多个列对DataFrame或Series进行分组。 |
|
提供滚动变换。 |
|
提供扩展转换。 |
|
应用 func(self, *args, **kwargs)。 |
Computations / Descriptive Stats ¶
|
返回一个包含每个元素绝对数值的Series/DataFrame。 |
|
返回是否所有元素都为真。 |
|
返回是否有任何元素为真。 |
|
计算滞后N的自相关。 |
|
返回布尔序列,等价于 left <= series <= right。 |
|
在输入阈值处修剪值。 |
|
计算与 其他 序列的相关性,排除缺失值。 |
|
计算每列中非NA单元格的数量。 |
|
计算与 Series 的协方差,排除缺失值。 |
|
返回 DataFrame 或 Series 轴上的累积最大值。 |
|
返回DataFrame或Series轴上的累积最小值。 |
|
返回 DataFrame 或 Series 轴上的累计和。 |
|
返回 DataFrame 或 Series 轴上的累积乘积。 |
|
生成描述性统计数据,总结数据集分布的集中趋势、离散度和形状,排除
|
|
提供指数加权窗口变换。 |
|
根据指定索引中的标签对数据框的行或列进行子集化。 |
|
返回使用Fisher定义的无偏峰度(正态分布的峰度 == 0.0)。 |
|
返回值的平均绝对偏差。 |
|
返回值的最大值。 |
|
返回值的平均值。 |
|
返回值的最小值。 |
|
返回数据集的众数。 |
|
返回最大的 n 个元素。 |
|
返回最小的 n 个元素。 |
|
当前元素与前一个元素之间的百分比变化。 |
|
返回值的乘积。 |
|
返回对象中唯一元素的数量。 |
返回对象中的值是否唯一的布尔值 |
|
|
返回给定分位数处的值。 |
|
沿轴计算数值数据的排名(1到n)。 |
|
返回请求轴上的平均值的无偏标准误差。 |
|
返回通过N-1标准化的无偏斜度。 |
|
返回样本标准差。 |
|
返回值的总和。 |
|
返回请求轴上值的中位数。 |
|
返回无偏方差。 |
|
返回使用Fisher定义的无偏峰度(正态分布的峰度 == 0.0)。 |
返回Series对象的唯一值。 |
|
|
返回一个包含唯一值计数的序列。 |
|
将序列中的每个值四舍五入到给定的位数。 |
|
元素的第一个离散差分。 |
返回布尔值,判断对象中的值是否单调递增。 |
|
返回布尔值,判断对象中的值是否单调递增。 |
|
返回布尔值,判断对象中的值是否单调递减。 |
Reindexing / Selection / Label manipulation ¶
|
使用指定的连接方法将两个对象在其轴上对齐。 |
|
返回移除了指定索引标签的序列。 |
|
返回移除请求的索引级别后的序列。 |
|
返回已删除重复值的序列。 |
|
指示重复的Series值。 |
|
比较当前值是否等于另一个值。 |
|
使用字符串 前缀 作为标签前缀。 |
|
后缀标签带有字符串后缀。 |
|
根据日期偏移选择时间序列数据的前几个周期。 |
|
返回前n行。 |
|
返回最大值的行标签。 |
|
返回最小值的行标签。 |
|
检查 值 是否包含在Series或Index中。 |
|
根据日期偏移选择时间序列数据的最终周期。 |
|
修改序列索引标签或名称。 |
|
设置索引或列的轴名称。 |
|
将系列数据对齐到新的索引,并可选择填充逻辑,将NA/NaN放置在没有先前索引值的位置。 |
|
返回一个与另一个对象具有匹配索引的序列。 |
|
生成一个新的DataFrame或Series,并重置索引。 |
|
从对象的轴中返回一个随机样本项。 |
|
查找元素应插入以保持顺序的索引。 |
|
在 MultiIndex 中交换层级 i 和 j。 |
|
互换轴并适当交换值轴。 |
|
返回沿轴的给定 位置 索引中的元素。 |
|
返回最后 n 行。 |
|
在条件为假时替换值。 |
|
在条件为真时替换值。 |
|
在某个索引值之前和之后截断一个Series或DataFrame。 |
Missing data handling ¶
|
同义词为
DataFrame.fillna()
或
Series.fillna()
并带有
|
|
同义词为
DataFrame.fillna()
或
Series.fillna()
使用
|
|
检测现有的(非缺失的)值。 |
检测现有的(非缺失的)值。 |
|
|
检测现有的(非缺失的)值。 |
检测现有的(非缺失的)值。 |
|
|
同义词为
DataFrame.fillna()
或
Series.fillna()
使用
|
|
返回一个删除了缺失值的新序列。 |
|
填充NA/NaN值。 |
|
使用插值方法填充NaN值。 |
Reshaping, sorting, transposing ¶
返回用于对Series值进行排序的整数索引。 |
|
|
返回Series中最小值的整数位置。 |
|
返回Series中最大值的整数位置。 |
|
按标签排序对象(沿轴) |
|
按值排序。 |
|
解堆叠,又名 |
将类似列表的每个元素转换为一行。 |
|
|
重复一个Series中的元素。 |
|
将一维轴对象压缩为标量。 |
|
将对象编码为枚举类型或分类变量。 |
Combining / joining / merging ¶
|
连接两个或多个序列。 |
|
与另一个序列进行比较并显示差异。 |
|
将to_replace中给定的值替换为value。 |
|
使用传递的Series中的非NA值就地修改Series。 |
Accessors ¶
Pandas API on Spark 在各种访问器下提供了特定数据类型的方法。
这些是
Series
中的独立命名空间,仅适用于特定数据类型。
数据类型 |
访问器 |
---|---|
日期时间 |
|
字符串 |
|
分类 |
Date Time Handling ¶
Series.dt
可以用于访问序列的值作为日期时间类型,并返回多个属性。
这些属性可以通过
Series.dt.
访问。
Datetime Properties ¶
返回一个包含 Python datetime.date 对象的 Series(即不带时区信息的 Timestamp 的日期部分)。 |
|
日期时间中的年份。 |
|
时间戳的月份,1月 = 1,12月 = 12。 |
|
日期时间中的天数。 |
|
日期时间的小时部分。 |
|
日期时间的分钟部分。 |
|
日期时间的秒数。 |
|
日期时间中的微秒。 |
|
一年中的周序数。 |
|
一年中的周序数。 |
|
星期几,星期一=0,星期日=6。 |
|
星期几,星期一=0,星期日=6。 |
|
一年中的第几天。 |
|
日期的季度。 |
|
指示日期是否为月份的第一天。 |
|
指示日期是否为该月的最后一天。 |
|
指示日期是否为季度第一天的指标。 |
|
指示日期是否为季度最后一天的指标。 |
|
指示日期是否为某年的第一天。 |
|
指示日期是否为一年的最后一天。 |
|
布尔指示符,表示日期是否属于闰年。 |
|
该月份的天数。 |
|
该月份的天数。 |
Datetime Methods ¶
将时间转换为午夜。 |
|
|
使用指定的 date_format 转换为字符串序列。 |
|
对数据执行四舍五入操作到指定的频率。 |
|
对数据执行向下取整操作到指定的频率。 |
|
对数据执行ceil操作到指定的freq。 |
|
返回具有指定区域设置的序列的月份名称。 |
|
返回具有指定区域设置的序列的日期名称。 |
String Handling ¶
Series.str
可以用来将序列的值作为字符串访问,并对其应用多种方法。这些方法可以通过
Series.str.<函数/属性>
的方式访问。
将系列中的字符串转换为大写。 |
|
|
不支持。 |
|
在Series/Index中的字符串的左右两侧填充额外的字符。 |
|
测试模式或正则表达式是否包含在序列的字符串中。 |
|
计算模式在序列中每个字符串中的出现次数。 |
|
不支持。 |
|
不支持。 |
|
测试每个字符串元素的末尾是否匹配某个模式。 |
|
不支持。 |
|
不支持。 |
|
返回系列中每个字符串中子字符串完全包含在 [start:end] 之间的最低索引。 |
|
查找序列中所有匹配模式或正则表达式的出现。 |
|
从序列中的每个字符串或字符串列表/元组中提取指定位置的元素。 |
|
不支持。 |
|
返回每个字符串中子字符串完全包含在 [start:end] 之间的最低索引。 |
检查每个字符串中的所有字符是否都是字母数字。 |
|
检查每个字符串中的所有字符是否均为字母。 |
|
检查每个字符串中的所有字符是否都是数字。 |
|
检查每个字符串中的所有字符是否都是空白字符。 |
|
检查每个字符串中的所有字符是否都是小写的。 |
|
检查每个字符串中的所有字符是否均为大写。 |
|
检查每个字符串中的所有字符是否为标题大小写。 |
|
检查每个字符串中的所有字符是否都是数字。 |
|
检查每个字符串中的所有字符是否都是十进制数。 |
|
|
将作为Series元素包含的列表与传递的分隔符连接起来。 |
计算序列中每个元素的长度。 |
|
|
在Series中的字符串右侧填充额外的字符。 |
将 Series/Index 中的字符串转换为全部小写。 |
|
|
移除前导字符。 |
|
确定每个字符串是否匹配正则表达式。 |
|
返回 Series 中字符串的 Unicode 规范化形式。 |
|
在 Series 中填充字符串至指定宽度。 |
|
不支持。 |
|
在 Series 中重复每个字符串。 |
|
在Series中用其他字符串替换模式/正则表达式的匹配项。 |
|
返回Series中每个字符串中子字符串完全包含在[start:end]之间的最高索引。 |
|
返回每个字符串中子字符串完全包含在 [start:end] 之间的最高索引。 |
|
在Series中的字符串左侧填充额外的字符。 |
|
不支持。 |
|
根据给定的分隔符/定界符拆分字符串。 |
|
移除尾随字符。 |
|
从序列中的每个元素中切片子字符串。 |
|
从序列的每个元素中切片子字符串。 |
|
根据给定的分隔符/定界符拆分字符串。 |
|
测试每个字符串元素的开头是否匹配一个模式。 |
|
移除前导和尾随字符。 |
将 Series/Index 中的字符串转换为交换大小写。 |
|
将系列中的字符串转换为首字母大写。 |
|
|
通过给定的映射表映射字符串中的所有字符。 |
将 Series/Index 中的字符串转换为全部大写。 |
|
|
在系列中包装长字符串,以在段落中格式化,段落长度小于给定的宽度。 |
|
在 Series 中通过在字符串前添加 '0' 字符来填充字符串。 |
Categorical accessor ¶
分类数据类型特定的方法和属性可以通过
Series.cat
访问器访问。
这个分类的类别。 |
|
类别是否具有有序关系。 |
|
返回代码序列以及索引。 |
|
重命名类别。 |
|
按照 new_categories 中指定的方式重新排序类别。 |
|
添加新类别。 |
|
移除指定的分类。 |
|
移除未使用的分类。 |
|
|
将类别设置为指定的新类别。 |
|
设置分类变量为有序。 |
|
将分类设置为无序。 |
Plotting ¶
Series.plot
既是一个可调用的方法,也是一个命名空间属性,用于特定形式的绘图方法,如
Series.plot.
。
别名
|
|
|
绘制堆积面积图。 |
|
垂直条形图。 |
|
制作一个水平条形图。 |
|
绘制 Series 列的箱线图。 |
|
使用高斯核生成核密度估计图。 |
|
绘制DataFrame列的一个直方图。 |
|
将DataFrame/Series绘制为线条。 |
|
生成一个饼图。 |
|
使用高斯核生成核密度估计图。 |
|
绘制DataFrame列的一个直方图。 |
Serialization / IO / Conversion ¶
返回一个 pandas Series。 |
|
表示此 DataFrame 或 Series 中的值的 NumPy ndarray。 |
|
返回一个值的列表。 |
|
|
渲染 Series 的字符串表示形式。 |
|
将 Series 转换为 {标签 -> 值} 字典或类似字典的对象。 |
|
将对象复制到系统剪贴板。 |
|
将对象渲染为 LaTeX 表格环境表。 |
|
以Markdown友好格式打印Series或DataFrame。 |
|
将对象转换为JSON字符串。 |
|
将对象写入逗号分隔值(csv)文件。 |
|
将对象写入 Excel 工作表。 |
|
将 Series 转换为 DataFrame。 |
Pandas-on-Spark specific ¶
Series.pandas_on_spark
提供了 pandas-on-Spark 特有的功能,这些功能仅存在于 Spark 上的 pandas API 中。
可以通过
Series.pandas_on_spark.<函数/属性>
访问这些功能。
使用一个函数来转换数据,该函数接受 pandas Series 并输出 pandas Series。 |