请求配额增加#

大多数云服务提供商实施配额政策,以限制在给定区域中可以存在的虚拟机实例数量。 用户在资源调配过程中可能会遇到QuotaExceededVcpuLimitExceeded错误,特别是对于高端GPU如H100/A100。 要检查或增加您的配额限制,请按照以下说明操作。 提交请求后,通常需要几天时间供支持团队审核。 为了提高获得批准的机会,您可以回复他们的询问邮件,说明请求的资源将如何用于您的项目。

AWS#

  1. 前往EC2 Quotas控制台

  2. 选择区域 在右上角。

  3. 从列表中选择一个EC2实例类型(例如,Running On-Demand P instancesAll P Spot Instance Requests)。使用 sky show-gpus --cloud aws --all 或查看 这里 获取更多实例类型。

  4. 点击配额名称,然后选择请求增加配额

  5. 对于更改配额值,请输入新值。

  6. 选择请求

Azure#

  1. 首先访问Azure的配额页面

  2. 选择屏幕顶部附近的请求增加

  3. 对于配额类型,选择Compute-VM (cores-vCPUs) subscription limit increases。提示:请注意,可能会弹出消息“立即获取更多配额。您不需要支持票证即可获取更多配额…”;可以跳过它,因为请求大多数GPU实例的配额仍然需要创建支持票证(接下来的步骤)。

  4. 选择下一步以进入附加详细信息屏幕,然后选择输入详细信息

  • 在配额详情界面:

  • 对于部署模型,确保选择资源管理器

  • 对于位置,请选择您希望增加配额的所有区域。

  • 对于您选择的每个区域,从配额下拉列表中选择一个或多个虚拟机系列。

  • 对于您选择的每个VM系列(例如,H100实例的ND_H100_v5),请输入您希望为此订阅设置的新vCPU限制。您可以查看更多VM系列

  • 完成后,选择保存并继续

  1. 输入或确认您的联系方式,然后选择下一步

  2. 最后,确保在“查看 + 创建”页面上一切看起来都正确,然后选择创建以提交您的请求。

GCP#

  1. 在Google Cloud控制台中,转到配额页面

  2. 点击过滤并选择Service: Compute Engine API

  3. 对于H100 GPU:选择metric: GPUS_PER_GPU_FAMILY并选择维度gpu_family: NVIDIA_H100

  4. 对于所有其他GPU:选择Limit Name: instance_name。(例如,NVIDIA-V100-GPUS-per-project-region)。您可以查看计算GPU列表

  5. 选择您想要更改配额的区域的复选框。

  6. 点击编辑配额并填写新的限制。

  7. 点击提交请求

OCI#

  1. 前往OCI Limits, Quotas and Usage console以检查您当前的资源状态。

  2. 点击页面上的请求服务限制增加链接,如果您想增加配额。

  3. 从列表中选择一个服务类别(例如,Compute)。

  4. 从列表中选择一个资源(例如,GPUs for GPU.A10 based VM and BM Instances)。使用sky show-gpus --cloud oci --all或查看这里以获取更多实例类型。

  5. 输入新限制的Limit字段和Reason for request以进行理由说明。

  6. 点击创建支持请求以提交。

  7. 您可以查看OCI 服务限制以获取更多信息。