跳过主要内容

为什么选择Metaflow

1. 现代企业渴望利用数据科学和机器学习

在过去,数据科学家和机器学习工程师不得不依赖一系列的单点解决方案和自定义系统来构建机器学习和数据科学应用。

Many data science opportunities


2. 数据科学/机器学习应用中有什么共同点?

如果应用程序建立在一个共同的、友好的基础上,它们可以更快且更健壮地构建。那么这个基础应该涵盖什么呢?

A solid foundation for all use cases


3. 所有的DS/ML应用都使用数据

数据可以有不同的形状和大小,并且可以从各种数据存储中加载。但是,无论使用何种数据,访问和处理它都不应该太繁琐。

Data


4. 数据科学/机器学习应用需要进行计算

一些应用程序需要极大的计算能力 - 比如计算机视觉 - 而有些则较少。无论规模如何,所有应用程序都需要可靠地执行计算。多亏了云计算,数据科学家和机器学习工程师应该能够无障碍地利用弹性计算资源。

Compute


5. DS/ML 应用程序由多个相互关联的部分组成

考虑一个加载数据、转换数据、训练一组模型、选择最佳表现模型、运行推理并将结果写入数据库的应用程序。像这样的多步骤工作流在机器学习中是常见的。需要一个工作流协调器来确保所有步骤按顺序、及时执行。

Orchestration


6. 数据科学/机器学习应用随着时间的推移逐步演变

现实世界的应用程序很少只构建和部署一次。相反,一个典型的应用程序是逐渐构建的,由许多人贡献。项目需要被跟踪、组织和版本控制,这使得随时间的系统化和持续改进成为可能。

Versioning


7. DS/ML 应用以多种方式创造业务价值

为了产生真正的商业价值,数据科学/机器学习应用不能生活在一个封闭的环境中。它们必须与周围的系统无缝集成:一些应用增强了数据库中的数据,一些驱动内部仪表板或微服务,而另一些则驱动面向用户的产品。有许多方法可以在生产中部署机器学习。应用越有价值,它需要越小心地操作和监控。

Deployment


8. DS/ML 应用应利用最佳可用工具

对于许多数据科学家和机器学习工程师来说,项目中最重要的部分是 建模。利用他们的领域知识和专业技能,建模者应该能够 从现成的库中选择最合适的工具,例如 PyTorch、XGBoost、Scikit Learn,以及其他许多工具。或者,如果有必要,他们应该能够使用完全自定义的方法。

Modeling


9. Metaflow涵盖了DS/ML基础设施的完整栈

Metaflow 最初是在 Netflix 创建的,受到以下认识的推动:数据科学家和机器学习工程师需要帮助应对所有这些问题:堆栈中的任何间隙或摩擦都会大大减缓项目进展。得益于 Metaflow 提供的共同基础,数据科学家可以快速迭代想法,并通过依赖由团队中每个人共享的良好定义的架构和最佳实践,从而自信地部署它们。

Full-stack Metaflow


10. Metaflow 处理底层细节,让你可以专注于有趣的部分

Metaflow 为广泛的数据密集型应用提供了一个强大且用户友好的基础,包括大多数数据科学和机器学习的使用案例。了解 Python 基础的 数据科学家和机器学习工程师可以在此基础上构建自己的应用、模型和策略,而 Metaflow 负责低级基础设施:数据、计算、调度和版本控制。

Full stack triangles


11. Metaflow 依赖于工程师所了解和信任的系统

Metaflow 是在 Netflix 设计的,以满足对业务关键的机器学习/数据科学应用的需求。它依赖于经过验证的可扩展基础设施,适用于小型和大型组织。Metaflow 以负责任的方式与所有主要云服务以及 Kubernetes 和周围的系统集成。它尊重贵公司的安全和其他政策,也让工程团队满意。

Existing infrastructure


12. Metaflow 被数百家创新公司使用

今天,Metaflow 驱动着数千个机器学习/数据科学应用,遍布于NetflixCNNSAP23andMeRealtor.comREACoveoLatana以及其他数百个行业中的创新公司。Metaflow 的商业支持由Outerbounds提供。想要听听这些公司和其他许多公司的第一手经验,加入 Metaflow Slack