跳转到内容

检索模式

使用索引进行检索时有4种检索模式可供选择:

  • chunks
  • files_via_metadata
  • files_via_content
  • auto_routed

此模式可通过 retrieval_mode 参数在 LlamaCloudIndex.as_retriever 实例方法上指定。 游乐场用户界面也可配置为使用这些检索模式中的每一种。

以下部分将更详细地描述每种模式。

在使用此模式时,检索查询将通过从已摄入索引的文档中查找语义相似的文块来完成。 这是通过将检索查询进行嵌入表示,然后在连接的数据接收器中搜索那些嵌入向量与该查询嵌入向量距离相近的文档文块来实现的。

当您需要从大型数据集中检索特定信息时,chunks模式是最佳选择。特别是针对文档特定部分的事实查询,非常适合使用这种检索模式。

files_via_metadata 模式下,检索过程侧重于根据文件的元数据属性来选择文件。该模式利用语言模型来评估文件元数据与查询的相关性。元数据可以包括文件名、资源信息和自定义元数据标签。随后对选定的文件进行处理以检索相关文档。

当您的查询预期匹配文件的特定元数据属性时,请使用 files_via_metadata 模式。这对于涉及通过文件名或其他元数据标签识别文件的查询特别有用,例如当您需要基于特定文件属性检索文档时,或者当元数据明确显示与查询相关时。

files_via_content 模式通过分析文件内容来检索文件。它根据文档片段与查询的相关性进行排序,并相应选择文件。该模式旨在完整理解和处理文件的实际内容,适用于需要对文档文本进行摘要的查询。

当您的查询需要对文件内容进行整体分析时,请选择 files_via_content 模式。该模式特别适用于需要总结文件内容但事先不知道具体是哪个文件的查询场景。

auto_routed 模式是其他检索模式的超集,旨在根据查询自动选择最合适的检索策略。它利用语言模型评估查询,并决定使用 chunksfiles_via_metadatafiles_via_content 模式。这种动态选择过程确保检索方法与查询需求相匹配,从而优化检索过程。

当查询的性质未预先确定,或者您希望系统智能选择最佳检索策略时,请使用auto_routed模式。该模式在查询需求可能差异很大的场景中特别有用,例如混合了事实查找、摘要和基于元数据的查询。通过自动将查询路由至最合适的检索器,auto_routed模式提供了更灵活的检索解决方案。