检索组件
一个从指定数据集中检索信息的组件。
场景
在大多数RAG场景中,检索组件是必不可少的,在将信息发送到LLM进行内容生成之前,会从指定的知识库中提取信息。
配置
点击Retrieval组件以打开其配置窗口。
输入
检索组件依赖于输入变量来指定其数据输入(查询)。在输入部分点击+ 添加变量以添加所需的输入变量。输入变量有两种类型:参考和文本。
- 参考: 使用组件的输出或用户输入作为数据源。您需要从下拉菜单中选择:
- 在组件输出下的组件ID,或
- 在开始输入下的全局变量,该变量在开始组件中定义。
- 文本: 使用固定文本作为查询。您需要输入静态文本。
相似度阈值
RAGFlow在检索过程中采用了加权关键词相似度和加权向量余弦相似度的组合。此参数设置了用户查询与数据集中存储的块之间的相似度阈值。任何相似度得分低于此阈值的块将被排除在结果之外。
默认为0.2。
关键词相似度权重
此参数设置关键词相似度在综合相似度分数中的权重。两个权重的总和必须等于1.0。其默认值为0.7,这意味着在综合搜索中向量相似度的权重为1 - 0.7 = 0.3。
前N个
此参数从检索到的块中选择“Top N”块并将它们提供给LLM。
默认为8。
重排序模型
可选的
如果选择了重新排序模型,将使用加权关键词相似度和加权重新排序分数的组合进行检索。
WARNING
使用重新排序模型将显著增加系统的响应时间。
知识库
必填
您需要选择要从中检索数据的知识库。
IMPORTANT
如果您选择多个知识库,必须确保所选的知识库(数据集)使用相同的嵌入模型;否则,会出现错误信息。
示例
探索我们的客户服务代理模板,其中检索组件(组件ID:搜索产品信息)用于搜索数据集并将前N个结果发送给LLM:
- 点击页面顶部中央的Agent标签以访问Agent页面。
- 点击页面右上角的+ 创建代理以打开代理模板页面。
- 在代理模板页面上,将鼠标悬停在解释器卡片上,然后点击使用此模板。
- 为你的新代理命名,然后点击确定进入工作流编辑器。
- 点击Retrieval组件以显示其Configuration窗口。