请求配额增加#
大多数云服务提供商实施配额政策,以限制在给定区域中可以存在的虚拟机实例数量。 用户在资源调配过程中可能会遇到QuotaExceeded或VcpuLimitExceeded错误,特别是对于高端GPU如H100/A100。 要检查或增加您的配额限制,请按照以下说明操作。 提交请求后,通常需要几天时间供支持团队审核。 为了提高获得批准的机会,您可以回复他们的询问邮件,说明请求的资源将如何用于您的项目。
AWS#
选择区域 在右上角。
从列表中选择一个EC2实例类型(例如,
Running On-Demand P instances或All P Spot Instance Requests)。使用sky show-gpus --cloud aws --all或查看 这里 获取更多实例类型。点击配额名称,然后选择请求增加配额。
对于更改配额值,请输入新值。
选择请求。
Azure#
首先访问Azure的配额页面。
选择屏幕顶部附近的请求增加。
对于配额类型,选择
Compute-VM (cores-vCPUs) subscription limit increases。提示:请注意,可能会弹出消息“立即获取更多配额。您不需要支持票证即可获取更多配额…”;可以跳过它,因为请求大多数GPU实例的配额仍然需要创建支持票证(接下来的步骤)。选择下一步以进入附加详细信息屏幕,然后选择输入详细信息。
在配额详情界面:
对于部署模型,确保选择资源管理器。
对于位置,请选择您希望增加配额的所有区域。
对于您选择的每个区域,从配额下拉列表中选择一个或多个虚拟机系列。
对于您选择的每个VM系列(例如,H100实例的
ND_H100_v5),请输入您希望为此订阅设置的新vCPU限制。您可以查看更多VM系列。完成后,选择保存并继续。
输入或确认您的联系方式,然后选择下一步。
最后,确保在“查看 + 创建”页面上一切看起来都正确,然后选择创建以提交您的请求。
GCP#
OCI#
前往OCI Limits, Quotas and Usage console以检查您当前的资源状态。
点击页面上的请求服务限制增加链接,如果您想增加配额。
从列表中选择一个服务类别(例如,
Compute)。从列表中选择一个资源(例如,
GPUs for GPU.A10 based VM and BM Instances)。使用sky show-gpus --cloud oci --all或查看这里以获取更多实例类型。输入新限制的Limit字段和Reason for request以进行理由说明。
点击创建支持请求以提交。
您可以查看OCI 服务限制以获取更多信息。