重新排序
tip
LiteLLM 遵循 cohere api 请求/响应格式 用于重新排序 API。
LiteLLM Python SDK 使用
快速开始
from litellm import rerank
import os
os.environ["COHERE_API_KEY"] = "sk-.."
query = "美国的首都是什么?"
documents = [
"卡森城是美国内华达州的首府。",
"北马里亚纳群岛是太平洋中的一组岛屿。它的首府是塞班岛。",
"华盛顿特区是美国的首都。",
"在美国成为一个国家之前,死刑就已经存在了。",
]
response = rerank(
model="cohere/rerank-english-v3.0",
query=query,
documents=documents,
top_n=3,
)
print(response)
异步使用
from litellm import arerank
import os, asyncio
os.environ["COHERE_API_KEY"] = "sk-.."
async def test_async_rerank():
query = "美国的首都是什么?"
documents = [
"卡森城是美国内华达州的首府。",
"北马里亚纳群岛是太平洋中的一组岛屿。它的首府是塞班岛。",
"华盛顿特区是美国的首都。",
"在美国成为一个国家之前,死刑就已经存在了。",
]
response = await arerank(
model="cohere/rerank-english-v3.0",
query=query,
documents=documents,
top_n=3,
)
print(response)
asyncio.run(test_async_rerank())
LiteLLM 代理使用
LiteLLM 提供了一个与 cohere api 兼容的 /rerank 端点用于重新排序调用。
设置
将此添加到您的 litellm 代理 config.yaml 中
model_list:
- model_name: Salesforce/Llama-Rank-V1
litellm_params:
model: together_ai/Salesforce/Llama-Rank-V1
api_key: os.environ/TOGETHERAI_API_KEY
- model_name: rerank-english-v3.0
litellm_params:
model: cohere/rerank-english-v3.0
api_key: os.environ/COHERE_API_KEY
启动 litellm
litellm --config /path/to/config.yaml
# 运行在 http://0.0.0.0:4000
测试请求
curl http://0.0.0.0:4000/rerank \
-H "Authorization: Bearer sk-1234" \
-H "Content-Type: application/json" \
-d '{
"model": "rerank-english-v3.0",
"query": "美国的首都是什么?",
"documents": [
"卡森城是美国内华达州的首府。",
"北马里亚纳群岛是太平洋中的一组岛屿。它的首府是塞班岛。",
"华盛顿特区是美国的首都。",
"在美国成为一个国家之前,死刑就已经存在了。"
],
"top_n": 3
}'
支持的提供商
| 提供商 | 使用链接 |
|---|---|
| Cohere | 使用 |
| Together AI | 使用 |
| Azure AI | 使用 |