cudf.pandas#

cuDF pandas 加速模式 (cudf.pandas) 基于 cuDF 构建,并在 GPU 上加速 pandas 代码。它支持100% 的 Pandas API,对支持的操作使用 GPU,并自动回退到 pandas 处理其他操作。

%load_ext cudf.pandas
# pandas API is now GPU accelerated

import pandas as pd

df = pd.read_csv("filepath")  # uses the GPU!
df.groupby("col").mean()  # uses the GPU!
df.rolling(window=3).sum()  # uses the GPU!
df.apply(set, axis=1)  # uses the CPU (fallback)
../_images/colab.png

在Google Colab上试试吧!#

零代码更改加速

只需在 Jupyter 中输入 %load_ext cudf.pandas,或在命令行中传递 -m cudf.pandas

第三方库兼容

cudf.pandas 兼容大多数使用 pandas 的第三方库。

在CPU或GPU上运行相同的代码

从CPU切换到GPU时,无需更改任何内容,甚至不需要更改import语句。

100%的Pandas API

结合了Pandas的完全灵活性和cuDF的极速性能

cudf.pandas 现已作为 cudf 包的一部分正式发布(GA)。请参阅 RAPIDS 快速入门 以开始使用 cudf