自动停止和自动关闭#

自动停止(或自动关闭)功能在集群空闲后自动停止(或拆除)集群。

通过自动停止功能,用户可以简单地提交作业并离开他们的笔记本电脑,同时确保不会发生不必要的支出:作业完成后,使用的集群将自动停止(稍后可以重新启动)。

使用autodown时,所使用的集群将自动拆除(即终止)。

要为集群安排自动停止,请使用 sky autostopsky launch -i minutes>

# Launch a cluster with logging detached (the -d flag)
sky launch -d -c mycluster cluster.yaml

# Autostop the cluster after 10 minutes of idleness
sky autostop mycluster -i 10

# Use the default, 5 minutes of idleness
# sky autostop mycluster

# (Equivalent to the above) Use the -i flag:
sky launch -d -c mycluster cluster.yaml -i 10

要为集群安排自动关闭,请将--down标志传递给sky autostopsky launch

# Add the --down flag to schedule autodown instead of autostop.

# This means the cluster will be torn down after 10 minutes of idleness.
sky launch -d -c mycluster2 cluster.yaml -i 10 --down

# Or:
sky autostop mycluster2 -i 10 --down

注意

自动停止/自动关闭逻辑将由远程集群自动执行。您的本地机器不需要保持开启状态以使它们生效。

要取消集群上任何计划的自动停止/自动关闭:

sky autostop mycluster --cancel

要查看集群的状态,请使用 sky status [--refresh]

$ sky status
NAME         LAUNCHED    RESOURCES            STATUS   AUTOSTOP       COMMAND
mycluster    1 min ago   2x AWS(m4.2xlarge)   UP       10 min         sky launch -d -c ...
mycluster2   1 min ago   2x AWS(m4.2xlarge)   UP       10 min(down)   sky launch -d -c ...

# Refresh the statuses by querying the cloud providers
$ sky status --refresh
I 06-27 13:36:11 backend_utils.py:2273] Autodowned cluster: mycluster2
NAME         LAUNCHED    RESOURCES            STATUS   AUTOSTOP  COMMAND
mycluster    11 min ago  2x AWS(m4.2xlarge)   STOPPED  10 min    sky launch -d -c ...

请注意,sky status 显示的是缓存的状态,对于计划了自动停止/自动关闭的集群,这些状态可能已经过时。 要查询这些集群的最新状态,请使用 sky status --refresh