Blog | RAGFlow

2024年RAG的崛起与演变年度回顾

December 24, 2024 · 35 min read

Yingfeng Zhang

Founder and CEO @ InfiniFlow

随着2024年接近尾声，检索增强生成（RAG）的发展可谓波澜壮阔。让我们从多个角度全面回顾这一年的进展。

深入探讨RAGFlow v0.15.0

December 19, 2024 · 5 min read

Yingfeng Zhang

Founder and CEO @ InfiniFlow

2024年RAGFlow的最终版本v0.15.0刚刚发布，带来了以下关键更新：

代理改进

此版本引入了对Agent的多项增强，包括额外的API、逐步运行调试以及导入/导出功能。自v0.13.0以来，RAGFlow的Agent已进行了重构以提高可用性。逐步运行调试功能完成了这一过程，使得Agent工作流中的操作可以单独执行，从而帮助用户基于输出信息进行调试。

RAG 需要哪些基础设施能力超越混合搜索

November 26, 2024 · 9 min read

Yingfeng Zhang

Founder and CEO @ InfiniFlow

Infinity 是一个专门为检索增强生成（RAG）设计的数据库，在功能和性能方面表现出色。它为密集和稀疏向量搜索以及全文搜索提供了高性能能力，同时对这些数据类型进行高效的范围过滤。此外，它还具备基于张量的重新排序功能，能够实现强大的多模态 RAG，并集成了与 Cross Encoders 相媲美的排序能力。

使用RAGFlow实现Text2SQL

September 24, 2024 · 5 min read

Yingfeng Zhang

Founder and CEO @ InfiniFlow

RAGFlow 引入了Text2SQL功能以响应社区需求。传统的Text2SQL需要模型微调，这在企业环境中与RAG或Agent组件一起使用时，可能会显著增加部署和维护成本。RAGFlow基于RAG的Text2SQL利用现有的（已连接的）大型语言模型（LLM），使其能够与其他RAG/Agent组件无缝集成，而无需额外的微调模型。

我们的GraphRAG如何揭示琼恩·雪诺和龙母的隐藏关系

September 19, 2024 · 6 min read

Yingfeng Zhang

Founder and CEO @ InfiniFlow

RAGFlow v0.9 引入了对 GraphRAG 的支持，这是最近由微软开源的，据称是下一代检索增强生成（RAG）。在 RAGFlow 框架中，我们对 RAG 2.0 有更全面的定义。这个提出的端到端系统以搜索为中心，由四个阶段组成。最后两个阶段——索引和检索——主要需要一个专用的数据库，而前两个阶段定义如下：

从RAG 1.0到RAG 2.0，循环往复

July 15, 2024 · 9 min read

Yingfeng Zhang

Founder and CEO @ InfiniFlow

搜索技术仍然是计算机科学中的主要挑战之一，很少有商业产品能够有效地进行搜索。在大型语言模型（LLMs）兴起之前，强大的搜索能力并不被认为是必不可少的，因为它们并没有直接提升用户体验。然而，随着LLMs开始流行，为了将LLMs应用于企业环境，需要一个强大的内置检索系统。这也被称为检索增强生成（RAG）——在将内容输入LLM以生成最终答案之前，搜索内部知识库以找到与用户查询最相关的内容。

RAGFlow 进入代理时代

July 11, 2024 · 7 min read

Yingfeng Zhang

Founder and CEO @ InfiniFlow

自v0.8版本起，RAGFlow正式进入代理时代，后端提供全面的基于图的任务编排框架，前端提供无代码工作流编辑器。为什么是代理？此功能与现有工作流编排系统有何不同？

Agentic RAG - 定义与低代码实现

June 18, 2024 · 6 min read

Yingfeng Zhang

Founder and CEO @ InfiniFlow

一个简单的RAG系统的工作流程可以总结如下：RAG系统使用用户查询从指定的数据源进行检索，对检索结果进行重新排序，附加提示，并将其发送给LLM以生成最终答案。

在用户意图明显的情况下，简单的RAG就足够了，因为答案包含在检索结果中，可以直接发送给LLM。然而，在大多数情况下，模糊的用户意图是常态，需要迭代查询以生成最终答案。例如，涉及总结多个文档的问题需要多步推理。这些场景需要代理RAG，它在问答过程中涉及任务编排机制。

Agent 和 RAG 相辅相成。Agentic RAG，顾名思义，是一种基于代理的 RAG。Agentic RAG 与普通 RAG 的主要区别在于，Agentic RAG 引入了动态代理编排机制，该机制对检索进行批评，根据每个用户查询的意图重写查询，并采用“多跳”推理来处理复杂的问答任务。

基于RAPTOR实现长上下文RAG

May 24, 2024 · 4 min read

Yingfeng Zhang

Founder and CEO @ InfiniFlow

RAGFlow v0.6.0 本周发布，解决了自今年四月开源以来出现的许多易用性和稳定性问题。RAGFlow 的未来版本将专注于解决 RAG 能力的深层次问题。不得不说，市场上现有的 RAG 解决方案仍处于概念验证阶段，无法直接应用于实际生产场景。

代理改进​

代理改进