Skip to main content

· 5 min read
Yingfeng Zhang

2024年RAGFlow的最终版本v0.15.0刚刚发布,带来了以下关键更新:

代理改进

此版本引入了对Agent的多项增强,包括额外的API、逐步运行调试以及导入/导出功能。自v0.13.0以来,RAGFlow的Agent已进行了重构以提高可用性。逐步运行调试功能完成了这一过程,使得Agent工作流中的操作可以单独执行,从而帮助用户基于输出信息进行调试。

· 9 min read
Yingfeng Zhang

Infinity 是一个专门为检索增强生成(RAG)设计的数据库,在功能和性能方面表现出色。它为密集和稀疏向量搜索以及全文搜索提供了高性能能力,同时对这些数据类型进行高效的范围过滤。此外,它还具备基于张量的重新排序功能,能够实现强大的多模态 RAG,并集成了与 Cross Encoders 相媲美的排序能力。

· 5 min read
Yingfeng Zhang

RAGFlow 引入了Text2SQL功能以响应社区需求。传统的Text2SQL需要模型微调,这在企业环境中与RAG或Agent组件一起使用时,可能会显著增加部署和维护成本。RAGFlow基于RAG的Text2SQL利用现有的(已连接的)大型语言模型(LLM),使其能够与其他RAG/Agent组件无缝集成,而无需额外的微调模型。

· 6 min read
Yingfeng Zhang

RAGFlow v0.9 引入了对 GraphRAG 的支持,这是最近由微软开源的,据称是下一代检索增强生成(RAG)。在 RAGFlow 框架中,我们对 RAG 2.0 有更全面的定义。这个提出的端到端系统以搜索为中心,由四个阶段组成。最后两个阶段——索引和检索——主要需要一个专用的数据库,而前两个阶段定义如下:

· 9 min read
Yingfeng Zhang

搜索技术仍然是计算机科学中的主要挑战之一,很少有商业产品能够有效地进行搜索。在大型语言模型(LLMs)兴起之前,强大的搜索能力并不被认为是必不可少的,因为它们并没有直接提升用户体验。然而,随着LLMs开始流行,为了将LLMs应用于企业环境,需要一个强大的内置检索系统。这也被称为检索增强生成(RAG)——在将内容输入LLM以生成最终答案之前,搜索内部知识库以找到与用户查询最相关的内容。

· 6 min read
Yingfeng Zhang

一个简单的RAG系统的工作流程可以总结如下:RAG系统使用用户查询从指定的数据源进行检索,对检索结果进行重新排序,附加提示,并将其发送给LLM以生成最终答案。

在用户意图明显的情况下,简单的RAG就足够了,因为答案包含在检索结果中,可以直接发送给LLM。然而,在大多数情况下,模糊的用户意图是常态,需要迭代查询以生成最终答案。例如,涉及总结多个文档的问题需要多步推理。这些场景需要代理RAG,它在问答过程中涉及任务编排机制。

Agent 和 RAG 相辅相成。Agentic RAG,顾名思义,是一种基于代理的 RAG。Agentic RAG 与普通 RAG 的主要区别在于,Agentic RAG 引入了动态代理编排机制,该机制对检索进行批评,根据每个用户查询的意图重写查询,并采用“多跳”推理来处理复杂的问答任务。