函数#

这些函数可以从Polars模块根目录中获得,并且可以用作表达式,有时也可以在急切上下文中使用。


模块命名空间中可用:

all(*names[, ignore_nulls])

要么返回一个表示所有列的表达式,要么执行一个按位与操作。

all_horizontal(*exprs)

计算列之间的水平位与。

any(*names[, ignore_nulls])

评估按位或操作。

any_horizontal(*exprs)

计算列之间的水平按位或。

approx_n_unique(*columns)

唯一值的近似计数。

arange([start, end, step, dtype, eager])

生成一个整数范围。

arctan2(y, x)

计算两个参数的反正切值,单位为弧度。

arctan2d(y, x)

计算两个参数的反正切值,单位为度。

arg_sort_by(exprs, *more_exprs[, ...])

返回将列排序的行索引。

arg_where(condition, *[, eager])

返回condition评估为True的索引。

business_day_count(开始, 结束[, 周掩码, ...])

计算startend之间的工作日数量(不包括end)。

coalesce(exprs, *more_exprs)

从左到右折叠列,保留第一个非空值。

concat_arr(exprs, *more_exprs)

将列水平连接成单个数组列。

concat_list(exprs, *more_exprs)

水平连接列到单个列表列。

concat_str(exprs, *more_exprs[, separator, ...])

将列水平连接成单个字符串列。

corr(a, b, *[, method, ddof, propagate_nans])

计算两列之间的皮尔逊或斯皮尔曼等级相关系数。

count(*columns)

返回列中非空值的数量。

cov(a, b[, ddof])

计算两列/表达式之间的协方差。

cum_count(*columns[, reverse])

返回列中非空值的累计计数。

cum_fold(acc, function, exprs, *[, include_init])

在列上水平累积折叠,使用左折叠。

cum_reduce(function, exprs)

通过左折叠在列之间水平累积减少。

cum_sum(*names)

累计所有值的总和。

cum_sum_horizontal(*exprs)

水平跨列累计所有值。

date(year, month, day)

创建一个类型为Date的Polars字面量表达式。

date_range(开始, 结束[, 间隔, 关闭, 急切])

生成一个日期范围。

date_ranges(start, end[, interval, closed, ...])

创建一个日期范围的列。

datetime(年, 月, 日[, 小时, 分钟, ...])

创建一个类型为Datetime的Polars字面量表达式。

datetime_range(开始, 结束[, 间隔, ...])

生成一个日期时间范围。

datetime_ranges(start, end[, interval, ...])

创建一个日期时间范围的列。

duration(*[, 周, 天, 小时, 分钟, ...])

从不同的时间组件创建polars Duration

element()

eval表达式中被评估的元素的别名。

exclude(columns, *more_columns)

表示除给定列之外的所有列。

first(*columns)

获取第一列或值。

fold(acc, function, exprs)

使用左折叠在多个列上水平/按行累积。

format(f_string, *args)

将表达式格式化为字符串。

from_epoch(column[, time_unit])

实用函数,将纪元时间戳(或Unix时间)解析为Polars日期(时间)。

groups(column)

pl.col("foo").agg_groups() 的语法糖。

head(column[, n])

获取前n行。

implode(*columns)

将所有列值聚合到一个列表中。

int_range([start, end, step, dtype, eager])

生成一个整数范围。

int_ranges([start, end, step, dtype, eager])

为输入列的每一行生成一个整数范围。

last(*columns)

获取最后一列或值。

len()

返回上下文中的行数。

lit(value[, dtype, allow_object])

返回表示字面值的表达式。

map_batches(exprs, function[, return_dtype])

在多个列/表达式上映射自定义函数。

map_groups(exprs, function[, return_dtype, ...])

在GroupBy上下文中应用自定义/用户定义的函数(UDF)。

max(*names)

获取最大值。

max_horizontal(*exprs)

获取列之间的水平最大值。

mean(*columns)

获取平均值。

mean_horizontal(*exprs[, ignore_nulls])

计算所有值在列之间的水平平均值。

median(*columns)

获取中位数值。

min(*names)

获取最小值。

min_horizontal(*exprs)

获取列之间的水平最小值。

n_unique(*columns)

计算唯一值。

nth(*indices)

获取上下文的第n列。

ones(n[, dtype, eager])

构造一个长度为 n 的列,并用1填充。

quantile(column, quantile[, interpolation])

pl.col("foo").quantile(..) 的语法糖。

reduce(function, exprs)

使用左折叠在多个列上水平/按行累积。

repeat(value, n, *[, dtype, eager])

构造一个长度为 n 的列,并用给定的值填充。

rolling_corr(a, b, *, window_size[, ...])

计算两列/表达式之间的滚动相关性。

rolling_cov(a, b, *, window_size[, ...])

计算两列/表达式之间的滚动协方差。

select(*exprs[, eager])

在没有上下文的情况下运行polars表达式。

sql(查询, *[, 急切])

对全局命名空间中的帧执行SQL查询。

sql_expr(sql)

将一个或多个SQL表达式解析为Polars表达式。

std(列[, 自由度])

获取标准差。

struct(*exprs[, schema, eager])

将列收集到一个结构列中。

sum(*names)

求和所有值。

sum_horizontal(*exprs[, ignore_nulls])

水平跨列求和所有值。

tail(column[, n])

获取最后 n 行。

time([hour, minute, second, microsecond])

创建一个类型为Time的Polars字面量表达式。

time_range([start, end, interval, closed, eager])

生成一个时间范围。

time_ranges([开始, 结束, 间隔, 关闭, ...])

创建一个时间范围的列。

var(column[, ddof])

获取方差。

when(*predicates, **constraints)

启动一个when-then-otherwise表达式。

zeros(n[, dtype, eager])

构造一个长度为 n 的列,并用零填充。

在表达式命名空间中可用:

Expr.all(*[, ignore_nulls])

返回列中的所有值是否都为True

Expr.any(*[, ignore_nulls])

返回列中的任何值是否为True

Expr.approx_n_unique()

唯一值的近似计数。

Expr.count()

返回列中非空元素的数量。

Expr.first()

获取第一个值。

Expr.head([n])

获取前n行。

Expr.implode()

将值聚合到一个列表中。

Expr.map_batches(function[, return_dtype, ...])

对整个Series或Series序列应用自定义的python函数。

Expr.map_elements(function[, return_dtype, ...])

将自定义/用户定义的函数(UDF)映射到列的每个元素。

Expr.max()

获取最大值。

Expr.mean()

获取平均值。

Expr.median()

使用线性插值获取中位数值。

Expr.min()

获取最小值。

Expr.n_unique()

计算唯一值。

Expr.quantile(quantile[, interpolation])

获取分位数值。

Expr.std([ddof])

获取标准差。

Expr.sum()

获取总和值。

Expr.tail([n])

获取最后 n 行。

Expr.var([ddof])

获取方差。