欢迎来到SkyPilot!#

SkyPilotSkyPilot

在任何基础设施上运行AI — 统一、更快、更便宜

Star Watch Fork

SkyPilot 是一个用于在任何基础设施上运行 AI 和批量工作负载的框架,提供统一的执行、高成本节省和高 GPU 可用性。

SkyPilot 抽象化了基础设施的负担:

  • 在任何基础设施上启动开发集群作业服务

  • 轻松的工作管理:排队、运行和自动恢复多个工作

SkyPilot 支持多个集群、云和硬件 (the Sky):

  • 带上您预留的GPU、Kubernetes集群或12+云服务

  • 灵活的资源调配 GPU、TPU、CPU,并自动重试

SkyPilot 降低您的云成本并最大化GPU可用性:

  • Autostop: 自动清理闲置资源

  • Managed Spot: 使用 spot 实例节省 3-6 倍成本,具有抢占自动恢复功能

  • Optimizer: 通过自动选择最便宜且最可用的基础设施,节省2倍成本

SkyPilot 支持您现有的 GPU、TPU 和 CPU 工作负载,无需更改代码。

当前支持的基础设施 (Kubernetes; AWS, GCP, Azure, OCI, Lambda Cloud, Fluidstack, RunPod, Cudo, Paperspace, Cloudflare, Samsung, IBM, VMware vSphere):

SkyPilot 支持的云服务 SkyPilot 支持的云服务

准备好开始了吗?#

安装 SkyPilot 只需1分钟。然后,在快速入门中,2分钟内启动您的第一个开发集群。

SkyPilot 是 BYOC:所有内容都在您的云账户、VPC 和集群中启动。

联系SkyPilot团队#

您可以在SkyPilot Slack上与SkyPilot团队和社区聊天。

了解更多#

要了解更多信息,请参阅概念:天空计算SkyPilot博客

可运行的示例:

案例研究和集成:社区聚焦

教程:SkyPilot Tutorials

关注更新:

阅读研究: