开始使用#

Mars 利用并行和分布式技术加速 numpy、pandas、scikit-learn 和 Python 函数。

Mars中有四个主要的API:

  1. Mars tensor,它模仿numpy API并提供处理大张量/ndarray的能力。

  2. Mars DataFrame,模拟pandas API并能够处理大型DataFrame。

  3. Mars learn,模仿 scikit-learn API 并扩展机器学习算法。

  4. Mars Remote,它提供了并行执行 Python 函数的能力。

Mars 默认是 惰性求值,需要使用 .execute() 来进行计算,然而,也支持 急切模式,如果开启急切模式,执行将在每次创建每个张量、DataFrame 等时触发。

Mars 可以 利用 NVIDIA GPU 来加速计算。