自动停止和自动关闭#
自动停止(或自动关闭)功能在集群空闲后自动停止(或拆除)集群。
通过自动停止功能,用户可以简单地提交作业并离开他们的笔记本电脑,同时确保不会发生不必要的支出:作业完成后,使用的集群将自动停止(稍后可以重新启动)。
使用autodown时,所使用的集群将自动拆除(即终止)。
要为集群安排自动停止,请使用 sky autostop 或 sky launch -i :
# Launch a cluster with logging detached (the -d flag)
sky launch -d -c mycluster cluster.yaml
# Autostop the cluster after 10 minutes of idleness
sky autostop mycluster -i 10
# Use the default, 5 minutes of idleness
# sky autostop mycluster
# (Equivalent to the above) Use the -i flag:
sky launch -d -c mycluster cluster.yaml -i 10
要为集群安排自动关闭,请将--down标志传递给sky autostop或sky launch:
# Add the --down flag to schedule autodown instead of autostop.
# This means the cluster will be torn down after 10 minutes of idleness.
sky launch -d -c mycluster2 cluster.yaml -i 10 --down
# Or:
sky autostop mycluster2 -i 10 --down
注意
自动停止/自动关闭逻辑将由远程集群自动执行。您的本地机器不需要保持开启状态以使它们生效。
要取消集群上任何计划的自动停止/自动关闭:
sky autostop mycluster --cancel
要查看集群的状态,请使用 sky status [--refresh]:
$ sky status
NAME LAUNCHED RESOURCES STATUS AUTOSTOP COMMAND
mycluster 1 min ago 2x AWS(m4.2xlarge) UP 10 min sky launch -d -c ...
mycluster2 1 min ago 2x AWS(m4.2xlarge) UP 10 min(down) sky launch -d -c ...
# Refresh the statuses by querying the cloud providers
$ sky status --refresh
I 06-27 13:36:11 backend_utils.py:2273] Autodowned cluster: mycluster2
NAME LAUNCHED RESOURCES STATUS AUTOSTOP COMMAND
mycluster 11 min ago 2x AWS(m4.2xlarge) STOPPED 10 min sky launch -d -c ...
请注意,sky status 显示的是缓存的状态,对于计划了自动停止/自动关闭的集群,这些状态可能已经过时。
要查询这些集群的最新状态,请使用 sky status --refresh。