支持的pandas API ¶
下表显示了在Spark上实现或未实现的pandas API。有些pandas API未实现完整的参数,因此第三列显示了每个API缺失的参数。
-
第二列中的‘Y’表示它已实现,包括其所有参数。
-
‘N’表示尚未实现。
-
‘P’表示它已经部分实现,缺少一些参数。
下面列表中的所有API都通过分布式执行来计算数据,除了设计上需要本地执行的那些。例如, DataFrame.to_numpy() 需要将数据收集到驱动程序端。
如果您想要未实现的 pandas API 或参数,您可以创建一个 Apache Spark JIRA 来请求或自行贡献。
API列表是基于 最新的pandas官方API参考 进行更新的。
分类索引 API ¶
API |
已实现 |
缺失参数 |
---|---|---|
Y |
||
|
Y |
|
|
Y |
|
|
Y |
|
|
P |
|
|
P |
|
argsort |
N |
|
Y |
||
Y |
||
|
Y |
|
asof_locs |
N |
|
|
P |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
P |
|
|
Y |
|
|
Y |
|
|
Y |
|
duplicated |
N |
|
|
Y |
|
|
P |
|
|
P |
|
格式 |
N |
|
get_indexer |
N |
|
get_indexer_for |
N |
|
get_indexer_non_unique |
N |
|
|
Y |
|
get_loc |
N |
|
get_slice_bound |
N |
|
groupby |
N |
|
|
Y |
|
|
Y |
|
infer_objects |
N |
|
|
Y |
|
|
P |
|
is_ |
N |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
P |
|
|
Y |
|
|
Y |
|
|
Y |
|
连接 |
N |
|
Y |
||
|
Y |
|
内存使用 |
N |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
putmask |
N |
|
展平 |
N |
|
重新索引 |
N |
|
Y |
||
Y |
||
|
Y |
|
Y |
||
Y |
||
|
P |
|
searchsorted |
N |
|
Y |
||
|
Y |
|
|
P |
|
slice_indexer |
N |
|
slice_locs |
N |
|
|
Y |
|
|
P |
|
sortlevel |
N |
|
|
Y |
|
|
P |
|
to_flat_index |
N |
|
|
Y |
|
|
Y |
|
|
P |
|
|
P |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
where |
N |
数据框 API ¶
```html
API |
已实现 |
缺少参数 |
---|---|---|
Y |
||
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
Y |
||
P |
|
|
P |
|
|
P |
|
|
asfreq |
N |
|
asof |
N |
|
Y |
||
P |
|
|
Y |
||
P |
|
|
P |
|
|
P |
|
|
Y |
||
P |
|
|
P |
|
|
combine |
N |
|
Y |
||
compare |
N |
|
convert_dtypes |
N |
|
Y |
||
P |
|
|
P |
|
|
Y |
||
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
Y |
||
P |
|
|
|
P |
|
Y |
||
P |
|
|
Y |
||
Y |
||
P |
|
|
Y |
||
P |
|
|
Y |
||
Y |
||
P |
|
|
P |
|
|
Y |
||
P |
|
|
P |
|
|
Y |
||
Y |
||
Y |
||
P |
|
|
P |
|
|
Y |
||
P |
|
|
P |
|
|
Y |
||
P |
|
|
P |
|
|
P |
|
|
infer_objects |
N |
|
P |
|
|
Y |
||
P |
|
|
isetitem |
N |
|
Y |
||
Y |
||
Y |
||
Y |
||
Y |
||
Y |
||
P |
|
|
Y |
||
Y |
||
Y |
||
Y |
||
Y |
||
P |
|
|
P |
|
|
P |
|
|
Y |
||
Y |
||
Y |
||
P |
|
|
memory_usage |
N |
|
P |
|
|
Y |
||
P |
|
|
Y |
||
P |
|
|
|
P |
|
P |
|
|
Y |
||
Y |
||
Y |
||
Y |
||
Y |
||
P |
|
|
P |
|
|
Y |
||
Y |
||
P |
|
|
Y |
||
P |
|
|
Y |
||
Y |
||
P |
|
|
Y |
||
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
reorder_levels |
N |
|
Y |
||
P |
|
|
|
日期时间索引 API ¶
API |
已实现 |
缺失参数 |
---|---|---|
|
Y |
|
|
Y |
|
|
Y |
|
|
P |
|
|
P |
|
argsort |
N |
|
as_unit |
N |
|
|
Y |
|
asof_locs |
N |
|
|
P |
|
Y |
||
|
Y |
|
Y |
||
|
Y |
|
|
Y |
|
|
P |
|
|
Y |
|
|
Y |
|
|
Y |
|
duplicated |
N |
|
|
Y |
|
|
P |
|
|
P |
|
Y |
||
format |
N |
|
get_indexer |
N |
|
get_indexer_for |
N |
|
get_indexer_non_unique |
N |
|
|
Y |
|
get_loc |
N |
|
get_slice_bound |
N |
|
groupby |
N |
|
|
Y |
|
|
Y |
|
Y |
||
Y |
||
infer_objects |
N |
|
|
Y |
|
|
P |
|
is_ |
N |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
P |
|
|
Y |
|
|
Y |
|
isocalendar |
N |
|
|
Y |
|
join |
N |
|
|
Y |
|
|
P |
|
mean |
N |
|
memory_usage |
N |
|
|
P |
|
Y |
||
Y |
||
|
Y |
|
|
Y |
|
|
Y |
|
putmask |
N |
|
ravel |
N |
|
reindex |
N |
|
|
Y |
|
|
P |
|
Y |
||
searchsorted |
N |
|
|
Y |
|
|
P |
|
slice_indexer |
N |
|
slice_locs |
N |
|
snap |
N |
|
|
Y |
|
|
P |
|
sortlevel |
N |
|
std |
N |
|
Y |
||
|
Y |
|
|
P |
|
to_flat_index |
N |
|
|
Y |
|
to_julian_date |
N |
|
|
Y |
|
|
P |
|
to_period |
N |
|
to_pydatetime |
N |
|
|
P |
|
|
Y |
|
|
Y |
|
tz_convert |
N |
|
tz_localize |
N |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
where |
N |
索引 API ¶
API |
已实现 |
缺失参数 |
---|---|---|
Y |
||
Y |
||
Y |
||
P |
|
|
P |
|
|
argsort |
N |
|
Y |
||
asof_locs |
N |
|
P |
|
|
Y |
||
Y |
||
Y |
||
P |
|
|
Y |
||
Y |
||
Y |
||
duplicated |
N |
|
Y |
||
P |
|
|
P |
|
|
format |
N |
|
get_indexer |
N |
|
get_indexer_for |
N |
|
get_indexer_non_unique |
N |
|
|
Y |
|
get_loc |
N |
|
get_slice_bound |
N |
|
groupby |
N |
|
|
Y |
|
Y |
||
infer_objects |
N |
|
Y |
||
P |
|
|
is_ |
N |
|
Y |
||
Y |
||
Y |
||
Y |
||
Y |
||
Y |
||
Y |
||
P |
|
|
Y |
||
|
Y |
|
Y |
||
join |
N |
|
Y |
||
P |
|
|
memory_usage |
N |
|
P |
|
|
Y |
||
|
Y |
|
Y |
||
putmask |
N |
|
ravel |
N |
|
reindex |
N |
|
Y |
||
P |
|
|
searchsorted |
N |
|
Y |
||
P |
|
|
slice_indexer |
N |
|
slice_locs |
N |
|
|
Y |
|
P |
|
|
sortlevel |
N |
|
Y |
||
P |
|
|
to_flat_index |
N |
|
Y |
||
Y |
||
P |
|
|
P |
|
|
|
多重索引 API ¶
API |
已实现 |
缺少的参数 |
---|---|---|
|
Y |
|
|
Y |
|
Y |
||
|
P |
|
|
P |
|
argsort |
N |
|
|
Y |
|
asof_locs |
N |
|
P |
|
|
P |
|
|
Y |
||
Y |
||
P |
|
|
|
Y |
|
Y |
||
Y |
||
duplicated |
N |
|
Y |
||
Y |
||
|
P |
|
P |
|
|
format |
N |
|
get_indexer |
N |
|
get_indexer_for |
N |
|
get_indexer_non_unique |
N |
|
|
Y |
|
get_loc |
N |
|
get_loc_level |
N |
|
get_locs |
N |
|
get_slice_bound |
N |
|
groupby |
N |
|
|
Y |
|
Y |
||
infer_objects |
N |
|
Y |
||
P |
|
|
is_ |
N |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
P |
|
|
Y |
|
|
Y |
|
Y |
||
join |
N |
|
|
Y |
|
P |
|
|
memory_usage |
N |
|
P |
|
|
|
Y |
|
|
Y |
|
|
Y |
|
putmask |
N |
|
ravel |
N |
|
reindex |
N |
|
remove_unused_levels |
N |
|
P |
|
|
reorder_levels |
N |
|
P |
|
|
searchsorted |
N |
|
set_codes |
N |
|
set_levels |
N |
|
|
Y |
|
|
P |
|
slice_indexer |
N |
|
slice_locs |
N |
|
|
Y |
|
P |
|
|
sortlevel |
N |
|
Y |
||
Y |
||
P |
|
|
to_flat_index |
N |
|
P |
|
|
Y |
||
P |
|
|
P |
|
|
|
Y |
|
|
Y |
|
truncate |
N |
|
Y |
||
Y |
||
Y |
||
Y |
||
where |
N |
系列 API ¶
API |
已实现 |
缺失参数 |
---|---|---|
Y |
||
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
Y |
||
Y |
||
P |
|
|
asfreq |
N |
|
P |
|
|
P |
|
|
Y |
||
Y |
||
P |
|
|
Y |
||
P |
|
|
P |
|
|
Y |
||
P |
|
|
combine |
N |
|
Y |
||
P |
|
|
convert_dtypes |
N |
|
Y |
||
Y |
||
Y |
||
Y |
||
P |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
|
Y |
||
P |
|
|
|
P |
|
P |
|
|
Y |
||
P |
|
|
P |
|
|
时间差索引 API ¶
API |
实现 |
缺失的参数 |
---|---|---|
|
是 |
|
|
是 |
|
|
是 |
|
|
部分实现 |
|
|
部分实现 |
|
argsort |
未实现 |
|
as_unit |
未实现 |
|
|
是 |
|
asof_locs |
未实现 |
|
|
部分实现 |
|
ceil |
未实现 |
|
|
是 |
|
|
是 |
|
|
是 |
|
|
部分实现 |
|
|
是 |
|
|
是 |
|
|
是 |
|
duplicated |
未实现 |
|
|
是 |
|
|
部分实现 |
|
|
部分实现 |
|
floor |
未实现 |
|
format |
未实现 |
|
get_indexer |
未实现 |
|
get_indexer_for |
未实现 |
|
get_indexer_non_unique |
未实现 |
|
|
是 |
|
get_loc |
未实现 |
|
get_slice_bound |
未实现 |
|
groupby |
未实现 |
|
|
是 |
|
|
是 |
|
infer_objects |
未实现 |
|
|
是 |
|
|
部分实现 |
|
is_ |
未实现 |
|
|
是 |
|
|
是 |
|
|
是 |
|
|
是 |
|
|
是 |
|
|
是 |
|
|
是 |
|
|
部分实现 |
|
|
是 |
|
|
是 |
|
|
是 |
|
join |
未实现 |
|
|
是 |
|
|
部分实现 |
|
mean |
未实现 |
|
median |
未实现 |
|
memory_usage |
未实现 |
|
|
部分实现</ |
通用函数API ¶
API |
已实现 |
缺失的参数 |
---|---|---|
array |
N |
|
bdate_range |
N |
|
P |
|
|
crosstab |
N |
|
cut |
N |
|
P |
|
|
eval |
N |
|
factorize |
N |
|
from_dummies |
N |
|
Y |
||
infer_freq |
N |
|
interval_range |
N |
|
Y |
||
Y |
||
json_normalize |
N |
|
lreshape |
N |
|
P |
|
|
<a class="reference internal" |
扩展分组API ¶
API |
实现情况 |
缺失参数 |
---|---|---|
agg |
N |
|
aggregate |
N |
|
apply |
N |
|
corr |
N |
|
|
P |
|
cov |
N |
|
|
P |
|
|
P |
|
|
P |
|
median |
N |
|
|
P |
|
|
P |
|
rank |
N |
|
sem |
N |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
滚动 API ¶
API |
实现 |
缺少的参数 |
---|---|---|
agg |
N |
|
aggregate |
N |
|
apply |
N |
|
corr |
N |
|
P |
|
|
cov |
N |
|
|
P |
|
P |
|
|
P |
|
|
median |
N |
|
P |
|
|
P |
|
|
rank |
N |
|
sem |
N |
|
|
P |
|
|
P |
|
P |
|
|
|
P |
|
滚动分组 API ¶
API |
实现状态 |
缺失参数 |
---|---|---|
agg |
N |
|
aggregate |
N |
|
apply |
N |
|
corr |
N |
|
|
P |
|
cov |
N |
|
|
P |
|
|
P |
|
|
P |
|
median |
N |
|
|
P |
|
|
P |
|
rank |
N |
|
sem |
N |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
窗口 API ¶
API |
已实现 |
缺失参数 |
---|---|---|
agg |
N |
|
aggregate |
N |
|
mean |
N |
|
std |
N |
|
sum |
N |
|
var |
N |
数据框分组 API ¶
API |
已实现 |
缺少参数 |
---|---|---|
P |
|
|
P |
|
|
|
Y |
|
|
P |
|
|
Y |
|
|
Y |
|
箱形图 |
N |
|
相关性 |
N |
|
与...的相关性 |
N |
|
|
Y |
|
协方差 |
N |
|
|
Y |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
P |
|
|
|
P |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
P |
|
|
P |
|
|
Y |
|
|
P |
|
|
Y |
|
直方图 |
N |
|
|
P |
|
|
P |
|
|
Y |
|
|
P |
|
|
P |
|
|
Y |
|
|
P |
|
组编号 |
N |
|
|
Y |
|
ohlc |
N |
|
百分比变化 |
N |
|
管道 |
N |
|
|
Y |
|
|
P |
|
|
P |
|
重采样 |
N |
|
|
Y |
|
采样 |
N |
|
|
P |
|
|
P |
|
|
Y |
|
|
P |
|
|
P |
|
|
P |
|
|
Y |
|
取值 |
N |
|
|
P |
|
值计数 |
N |
|
|
P |
|
分组 API ¶
API |
已实现 |
缺失的参数 |
---|---|---|
|
P |
|
|
P |
|
Y |
||
P |
|
|
Y |
||
Y |
||
Y |
||
Y |
||
P |
|
|
P |
|
|
P |
|
|
P |
|
|
描述 |
N |
|
P |
|
|
Y |
||
|
Y |
|
Y |
||
Y |
||
P |
|
|
Y |
||
Y |
||
P |
|
|
P |
|
|
Y |
||
P |
|
|
ngroup |
N |
|
ohlc |
N |
|
pct_change |
N |
|
pipe |
N |
|
Y |
||
P |
|
|
P |
|
|
重采样 |
N |
|
|
Y |
|
抽样 |
N |
|
P |
|
|
P |
|
|
Y |
||
P |
|
|
P |
|
|
Y |
||
P |
|
系列分组 API ¶
API |
已实现 |
缺失参数 |
---|---|---|
|
P |
|
|
P |
|
|
Y |
|
|
P |
|
|
Y |
|
|
Y |
|
corr |
N |
|
|
Y |
|
cov |
N |
|
|
Y |
|
|
P |
|
|
P |
|
|
P |
|
|
P |
|
describe |
N |
|
|
P |
|
|
Y |
|
|
Y |
|
|
Y |
|
|
P |
|
|
P |
|
|
Y |
|
|
P |
|
|
Y |
|
hist |
N |
|
|
P |
|
|
P |
|
|
Y |
|
|
P |
|
|
P |
|
|
Y |
|
|
P |
|
ngroup |
N |
|
P |
|
|
P |
|
|
|
Y |
|
ohlc |
N |
|
pct_change |
N |
|
pipe |
N |
|
|
Y |
|
|
P |
|
|
P |
|
resample |
N |
|
|
Y |
|
sample |
N |
|
|
P |
|
|
P |
|
|
Y |
|
|
P |
|
|
P |
|
|
P |
|
|
Y |
|
take |
N |
|
|
P |
|
Y |
||
P |
|
|
|
P |
|