命令行界面#

工作流程#

你可以通过简单地将你的sky launch命令替换为sky bench launch来使用SkyPilot Benchmark:

# Launch mytask on a V100 VM and a T4 VM
$ sky bench launch mytask.yaml --gpus V100,T4 --benchmark mybench

第二个命令将同时在V100虚拟机和T4虚拟机上启动mytask.yaml,并使用基准名称mybench。 任务完成后,您可以使用sky bench show查看基准测试结果:

# Show the benchmark report on `mybench`
$ sky bench show mybench

CLUSTER              RESOURCES                          STATUS    DURATION  SPENT($)  STEPS  SEC/STEP  $/STEP  EST(hr)  EST($)
sky-bench-mybench-0  1x GCP(n1-highmem-8, {'V100': 1})  FINISHED  12m 51s   0.6317    -       -         -       -        -
sky-bench-mybench-1  1x AWS(g4dn.xlarge, {'T4': 1})     FINISHED  16m 19s   0.1430    -       -         -       -        -

在报告中,SkyPilot 显示了 mybench 在每个虚拟机上的持续时间和成本。 虚拟机可以通过 sky bench downsky down 终止:

# Terminate all the clusters used for `mybench`
$ sky bench down mybench

# Terminate all the clusters used for `mybench` except `sky-bench-mybench-0`
$ sky bench down mybench --exclude sky-bench-mybench-0

# Terminate individual clusters as usual
$ sky down sky-bench-mybench-0

注意

sky bench launch启动的每个集群将在任务完成后5分钟自动停止。 然而,您不必重新启动这些集群。 无论集群的状态如何,sky bench show都将提供基准测试结果。

注意

SkyPilot 基准测试不考虑配置和设置的时间/成本。 报告中的列(如 DURATIONSPENT($))表示执行任务 YAML 中 run 部分所花费的时间/成本。

注意

在这里,除了DURATIONSPENT($)之外的列都是空的。 要获取完整的基准测试报告,请参考SkyCallback

管理基准测试报告#

sky bench ls 显示你拥有的基准测试报告列表:

# List all the benchmark reports
$ sky bench ls

BENCHMARK  TASK         LAUNCHED             CANDIDATE 1                    CANDIDATE 2            CANDIDATE 3            CANDIDATE 4
bert       bert_qa      2022-08-10 10:07:27  1x Standard_NC6_Promo (K80:1)  1x g4dn.xlarge (T4:1)  1x g5.xlarge (A10G:1)  1x n1-highmem-8 (V100:1)
mybench    mytask       2022-08-10 11:24:27  1x n1-highmem-8 (V100:1)       1x g4dn.xlarge (T4:1)

要删除基准测试报告,请使用 sky bench delete

# Delete the benchmark report on `mybench`
$ sky bench delete mybench