速率限制头信息
当你向代理发出请求时,代理将返回以下 OpenAI 兼容的头信息:
x-ratelimit-remaining-requests- 可选[整数]:在达到速率限制之前允许的剩余请求数量。x-ratelimit-remaining-tokens- 可选[整数]:在达到速率限制之前允许的剩余令牌数量。x-ratelimit-limit-requests- 可选[整数]:在达到速率限制之前允许的最大请求数量。x-ratelimit-limit-tokens- 可选[整数]:在达到速率限制之前允许的最大令牌数量。x-ratelimit-reset-requests- 可选[整数]:速率限制重置的时间。x-ratelimit-reset-tokens- 可选[整数]:速率限制重置的时间。
这些头信息对于客户端了解当前的速率限制状态并相应地调整请求速率非常有用。
这些头信息是如何计算的?
如果设置了密钥的速率限制
代理将返回该密钥的剩余速率限制。
如果没有设置密钥的速率限制
代理返回后端提供者返回的剩余请求/令牌。
如果后端提供者没有返回这些头信息,则该值为 None。