mars.dataframe.Series#
- class mars.dataframe.Series(data=None, index=None, dtype=None, name=None, copy=False, chunk_size=None, gpu=None, sparse=None, num_partitions=None)[来源]#
- __init__(data=None, index=None, dtype=None, name=None, copy=False, chunk_size=None, gpu=None, sparse=None, num_partitions=None)[来源]#
方法
__init__([数据, 索引, 数据类型, 名称, 复制, ...])abs()add(其他[, 级别, 填充值, 轴])返回系列和其他的逐元素相加(双目运算符 add)。
add_prefix(前缀)在字符串 prefix 前添加前缀标签。
add_suffix(后缀)将后缀标签附加到字符串 suffix。
agg([函数, 轴])aggregate([函数, 轴])align(其他[, 连接, 轴, 级别, 复制, ...])使用指定的连接方法对齐两个对象的轴。
all([轴, 仅布尔值, 跳过空值, 级别, ...])any([轴, 仅布尔值, 跳过NA, 级别, ...])append(其他[, 忽略索引, ...])apply(func[, convert_dtype, output_type, ...])在系列值上调用函数。
astype(数据类型[, 复制, 错误])将pandas对象转换为指定的数据类型
dtype.autocorr([lag])计算滞后-N 自相关。
backfill([轴, 就地, 限制, 降级])与
DataFrame.fillna()具有相同意义,使用method='bfill'。between(左, 右[, 包含])返回布尔系列,相当于左侧 <= 系列 <= 右侧。
bfill([轴, 就地, 限制, 下cast])与
DataFrame.fillna()具有相同意义,使用method='bfill'。cartesian_chunk(right, func[, skip_infer, args])check_monotonic([下降,严格])检查对象中的值是否单调递增或递减。
copy([深复制])复制此对象的索引和数据。
copy_from(obj)copy_to(目标)corr(other[, method, min_periods])计算与其他序列的相关性,排除缺失值。
count([等级, 组合大小])cummax([轴, 跳过空值])cummin([轴, 跳过na])cumprod([轴, 跳过空值])cumsum([轴, 跳过空值])describe([百分位数, 包含, 排除])diff([periods])元素的第一次离散差异。
div(other[, level, fill_value, axis])返回系列和其他的浮点数除法,逐元素(双目运算符truediv)。
dot(其他)计算Series与其他列之间的点积。
drop([标签, 轴, 索引, 列, 级别, ...])返回带有指定索引标签删除的序列。
drop_duplicates([保留, 就地, 方法])返回去除重复值的系列。
dropna([轴, 就地, 如何])返回一个新的序列,删除缺失值。
duplicated([keep, method])指示重复的系列值。
eq(其他[, 等级, 轴])返回与序列和其他元素逐个相等的值(双目运算符 eq)。
ewm([com, span, halflife, alpha, ...])提供指数加权函数。
execute([session])expanding([最小周期, 中心, 轴])提供扩展变换。
explode([ignore_index])将列表中的每个元素转换为一行。
ffill([轴, 就地, 限制, 向下转换])与
DataFrame.fillna()结合使用method='ffill'的同义词。fillna([值, 方法, 轴, 就地, ...])使用指定的方法填充NA/NaN值。
floordiv(other[, level, fill_value, axis])返回系列和其他的整数除法,逐元素(二元运算符 floordiv)。
from_tensor(in_tensor[, index, name])ge(其他[, 级别, 轴])返回系列与其他之间的逐元素(双目运算符ge)的大于或等于值。
groupby([按, 级别, 作为索引, 排序, 分组键])gt(其他[, 级别, 轴])返回系列和其他元素的逐个比较结果(双目运算符 gt)。
head([n])返回前 n 行。
isin(值)系列中的元素是否包含在 values 中。
isna()检测缺失值。
isnull()检测缺失值。
items([批处理大小, 会话])懒惰地迭代(索引,值)元组。
iteritems([batch_size, session])懒惰地迭代(索引,值)元组。
keys()返回索引的别名。
kurt([轴, 跳过空值, 级别, 组合大小, ...])kurtosis([轴, 跳过空值, 级别, ...])le(其他[, 级别, 轴])返回系列和其他的元素级别(二元运算符 le)小于或等于的值。
lt(其他[, 级别, 轴])返回系列和其他的逐元素(按位操作符 lt),小于的值。
map(arg[, na_action, dtype, memory_scale, ...])根据输入的对应关系映射序列的值。
map_chunk(func[, args, kwargs, skip_infer])将函数应用于每个块。
mask(cond[, other, inplace, axis, level, ...])在条件为真时替换值。
max([轴, 跳过空值, 层级, 组合大小, 方法])mean([轴, 跳过空值, 级别, 合并大小, 方法])median([轴, 跳过缺失值, 输出, 覆盖输入, ...])返回请求轴上的值的中位数。
memory_usage([index, deep])返回序列的内存使用情况。
min([轴, 跳过空值, 层级, 组合大小, 方法])mod(other[, level, fill_value, axis])返回系列及其他的元素级模运算(二元运算符 mod)。
mul(other[, level, fill_value, axis])返回系列及其他的乘法,逐元素(双目运算符 mul)。
multiply(其他[, 级别, 填充值, 轴])返回系列及其他的乘法,逐元素(双目运算符 mul)。
ne(other[, level, axis])返回系列和其他的逐元素不等(双元运算符ne)。
notna()检测现有的(非缺失)值。
notnull()检测现有的(非缺失)值。
nunique([dropna, combine_size])返回对象中唯一元素的数量。
pad([轴, 就地, 限制, 下转换])与
DataFrame.fillna()结合使用method='ffill'的同义词。pct_change([periods, fill_method, limit, freq])当前元素与之前元素之间的百分比变化。
pow(other[, level, fill_value, axis])返回系列的指数幂及其他,逐元素(双目运算符 pow)。
prod([轴, 跳过NaN, 层级, 最小计数, ...])product([轴, 跳过NA, 级别, 最小计数, ...])quantile([q, interpolation])在给定分位数处返回值。
radd(other[, level, fill_value, axis])返回系列和其他的逐元素相加(二元操作符 radd)。
rdiv(其他[, 级别, 填充值, 轴])返回系列和其他元素的浮点除法(二元运算符rtruediv)。
rebalance([因子, 轴, 分区数量, ...])使数据在整个集群中更加均衡。
rechunk(块大小[, 重新分配工人])reindex(*args, **kwargs)符合新的索引的数据系列/数据框,带有可选的填充逻辑。
reindex_like(other[, method, copy, limit, ...])返回一个与其他对象具有匹配索引的对象。
rename([索引, 轴, 复制, 就地, 级别, ...])更改系列索引标签或名称。
rename_axis([mapper, index, columns, axis, ...])设置索引或列的轴名称。
replace([要替换的内容, 值, 就地, 限制, ...])将to_replace中给定的值替换为value。
reset_index([级别, 丢弃, 名称, 就地, ...])生成一个索引重置的新DataFrame或Series。
rfloordiv(other[, level, fill_value, axis])返回系列和其他元素的整数除法(二元运算符 rfloordiv)。
rmod(其他[, 级别, 填充值, 轴])返回系列及其他的模(按元素,二元操作符 rmod)。
rmul(其他[, 级别, 填充值, 轴])返回系列和其他元素的逐元素乘法(双目运算符 rmul)。
rolling(窗口[, 最小周期, 中心, ...])提供滚动窗口计算。
round([小数位数])将序列中的每个值四舍五入到给定的小数位数。
rpow(other[, level, fill_value, axis])返回系列及其他的指数幂,逐元素(双目运算符 rpow)。
rsub(其他[, level, fill_value, axis])返回系列和其他的逐元素减法(二元运算符 rsubtract)。
rtruediv(other[, level, fill_value, axis])返回系列和其他元素的浮点除法(二元运算符rtruediv)。
sample([n, frac, replace, weights, ...])从对象的一个轴返回一个随机样本的项目。
sem([轴, 跳过空值, 层级, 自由度, ...])set_axis(标签[, 轴, 就地])将期望的索引分配给给定的轴。
shift([周期, 频率, 轴, 填充值])将索引移动到所需的周期数,并可选地指定时间freq。
skew([轴, 跳过空值, 层级, 合并大小, ...])sort_index([轴, 级别, 升序, ...])按标签对对象进行排序(沿着一个轴)。
sort_values([轴, 升序, 原地, ...])按值排序。
std([轴, 跳过空值, 等级, 自由度, ...])sub(other[, level, fill_value, axis])返回系列和其他的逐元素减法(双目运算符 subtract)。
sum([轴, 跳过缺失值, 层级, 最小计数, ...])tail([n])返回最后 n 行。
tiles()to_cpu()to_csv(路径[, 分隔符, 缺失值表示, 浮点数格式, ...])将对象写入逗号分隔值(csv)文件。
to_dict([into, batch_size, session])将序列转换为 {label -> value} 字典或类似字典的对象。
to_frame([name])将系列转换为数据框。
to_gpu()to_pandas([session])to_sql(name, con[, schema, if_exists, ...])将存储在DataFrame中的记录写入SQL数据库。
to_tensor([dtype])transform(func[, convert_dtype, axis, ...])在自我身上调用
func生成一个具有转化值的 Series。truediv(other[, level, fill_value, axis])返回系列和其他的浮点数除法,逐元素(双目运算符truediv)。
tshift([周期, 频率, 轴])如果可用,使用索引的频率来移动时间索引。
unique([方法])唯一值按出现顺序返回。
value_counts([标准化, 排序, 升序, ...])返回一个包含唯一值计数的系列。
var([轴, 跳过NA, 级别, 自由度, ...])where(条件[, 其他, 就地, 轴, 水平, ...])在条件为假时替换值。
属性
返回转置,按定义自我。
访问行/列标签对的单个值。
data返回底层数据的dtype对象。
系列的索引(轴标签)。
如果对象中的值是单调递增的,则返回布尔标量。
如果对象中的值是单调递减的,则返回布尔标量。
如果对象中的值是单调递增的,则返回布尔标量。
返回一个整数,表示轴/数组维度的数量。
sizetype_namevalues