Skip to main content

· One min read

SynapseML(以前称为MMLSpark)是一个开源库,它简化了大规模可扩展的机器学习(ML)管道的创建。SynapseML为各种不同的机器学习任务(如文本分析、视觉、异常检测等)提供了简单、可组合和分布式的API。SynapseML建立在Apache Spark分布式计算框架上,并与SparkML/MLLib库共享相同的API,使您能够无缝地将SynapseML模型嵌入到现有的Apache Spark工作流中。

使用SynapseML,您可以构建可扩展的智能系统,以解决异常检测、计算机视觉、深度学习、文本分析等领域的挑战。SynapseML可以在单节点、多节点和弹性可调整大小的计算机集群上训练和评估模型。这使您能够扩展工作而不会浪费资源。SynapseML可在Python、R、Scala、Java和.NET中使用。此外,其API抽象了各种数据库、文件系统和云数据存储,以简化实验,无论数据位于何处。

SynapseML 需要 Scala 2.12、Spark 3.2+ 和 Python 3.8+。

· One min read

在数据库中部署机器学习(ML)算法的过程是具有挑战性的。现代ML算法的不同计算足迹和众多数据库技术,每种技术都有其限制性的语法,使得这些任务变得相当复杂。我们介绍了一种基于Apache Spark的微服务编排

· One min read

"将Azure认知服务的力量集成到您在Apache Spark™上的大数据工作流程中

今天在Spark + AI Summit 2019上,我们很高兴在SparkML生态系统中引入了一套新模型,使得在TB级别上使用Azure认知服务变得容易。