SynapseML(以前称为MMLSpark)是一个开源库,它简化了大规模可扩展的机器学习(ML)管道的创建。SynapseML为各种不同的机器学习任务(如文本分析、视觉、异常检测等)提供了简单、可组合和分布式的API。SynapseML建立在Apache Spark分布式计算框架上,并与SparkML/MLLib库共享相同的API,使您能够无缝地将SynapseML模型嵌入到现有的Apache Spark工作流中。
使用SynapseML,您可以构建可扩展的智能系统,以解决异常检测、计算机视觉、深度学习、文本分析等领域的挑战。SynapseML可以在单节点、多节点和弹性可调整大小的计算机集群上训练和评估模型。这使您能够扩展工作而不会浪费资源。SynapseML可在Python、R、Scala、Java和.NET中使用。此外,其API抽象了各种数据库、文件系统和云数据存储,以简化实验,无论数据位于何处。
SynapseML 需要 Scala 2.12、Spark 3.2+ 和 Python 3.8+。