Skip to main content

SynapseML

简单且分布式的机器学习

Coming from MMLSpark? We have been renamed to SynapseML!
from synapse.ml.cognitive import *
sentiment_df = (TextSentiment()
.setTextCol("text")
.setLocation("eastus")
.setSubscriptionKey(key)
.setOutputCol("sentiment")
.setErrorCol("error")
.setLanguageCol("language")
.transform(input_df))
Read more
Simple

简单

只需几行代码即可快速创建、训练和使用分布式机器学习工具。

Scalable

可扩展

将机器学习工作负载扩展到您的 Apache Spark 集群上的数百台机器。

Multilingual

多语言

使用SynapseML从任何与Spark兼容的语言,包括Python、Scala、R、Java、.NET和C#。

Open

打开

SynapseML 是开源的,可以在任何 Spark 3 基础设施上安装和使用,包括您的本地机器、Databricks、Synapse Analytics 等。

安装

使用Scala编写,并支持多种语言。开源且云原生。

SynapseML 已预装在 Fabric 上。要安装不同版本,请在笔记本的第一个单元格中添加以下内容:

%%configure -f
{
"name": "synapseml",
"conf": {
"spark.jars.packages": "com.microsoft.azure:synapseml_2.12:[THE_SYNAPSEML_VERSION_YOU_WANT]",
"spark.jars.repositories": "https://mmlspark.azureedge.net/maven",
"spark.jars.excludes": "org.scala-lang:scala-reflect,org.apache.spark:spark-tags_2.12,org.scalactic:scalactic_2.12,org.scalatest:scalatest_2.12,com.fasterxml.jackson.core:jackson-databind",
"spark.yarn.user.classpath.first": "true",
"spark.sql.parquet.enableVectorizedReader": "false"
}
}