欢迎来到cuDF文档!#

_images/RAPIDS-logo-purple.png

cuDF(发音为“KOO-dee-eff”)是一个Python GPU DataFrame库(基于Apache Arrow列式内存格式构建),用于加载、连接、聚合、过滤以及其他数据操作。cuDF还提供了一个类似于pandas的API,这对数据工程师和数据科学家来说非常熟悉,因此他们可以轻松地使用它来加速工作流程,而无需深入了解CUDA编程的细节。

cudf.pandas 基于 cuDF 构建,并在 GPU 上加速 pandas 代码。它支持 100% 的 pandas API,对支持的操作使用 GPU,对其他操作自动回退到 pandas。

_images/duckdb-benchmark-groupby-join.png

包括cudf.pandas在内的类数据库操作基准测试的结果。详情请参见此处#