重新排名#

介绍#

Rerank 是一种语义搜索工具，通过基于语义的重新排序系统提高搜索质量，该系统可以超越关键词相关性，将用户查询的含义置于上下文中。此工具最适合与查找工具一起使用，作为初始检索后的排序器。当前支持的排序方法列表如下。

名称	描述
BM25	BM25 是一种开源的排名算法，用于衡量文档与给定查询的相关性
Scaled Score Fusion	Scaled Score Fusion 计算一个缩放的相关性分数。
Cohere Rerank	Cohere Rerank 是市场上领先的重新排序模型，用于语义搜索和检索增强生成（RAG）。

需求#

对于AzureML用户，该工具已安装在默认镜像中，您无需额外安装即可使用该工具。
对于本地用户，

pip install promptflow-vectordb

先决条件#

BM25和Scaled Score Fusion作为默认的重新排序方法被包含在内。要使用cohere重新排序模型，您应该创建到该模型的无服务器部署，并按照以下方式在工具和资源之间建立连接。

添加无服务器模型连接。填写“API基础”和“API密钥”字段以连接到您的无服务器部署。

输入#

名称	类型	描述	是否必需
query	string	与您的输入文档相关的问题	Yes
ranker_parameters	string	使用的排名方法的类型	Yes
result_groups	object	需要重新排序的文档块列表。通常这是从lookup输出的	是
top_k	int	返回的相关文档的最大数量	No

输出#

返回类型	描述
文本	实体的文本
metadata	元数据，如文件路径和URL
additional_fields	元数据和重新排名分数

Output

[
  {
      "text": "sample text",
      "metadata":
      {
          "filepath": "sample_file_path",
          "metadata_json_string": "meta_json_string"
          "title": "",
          "url": ""
      },
      "additional_fields":
      {
          "filepath": "sample_file_path",
          "metadata_json_string": "meta_json_string"
          "title": "",
          "url": "",
          "@promptflow_vectordb.reranker_score": 0.013795365
      }
  }
]