Skip to content

图检索增强生成:综述

By , , , , , , ,
arXiv:2408.08921 [ cs.AI, cs.CL, cs.IR ] github:pengboci/GraphRAG-Survey

摘要

最近,检索增强生成(RAG)在解决大型语言模型(LLMs)的挑战方面取得了显著成功,而无需重新训练。通过引用外部知识库,RAG优化了LLM的输出,有效缓解了诸如“幻觉”、缺乏领域特定知识和信息过时等问题。然而,数据库中不同实体之间关系的复杂结构对RAG系统提出了挑战。为此,GraphRAG利用实体间的结构信息,实现更精确和全面的检索,捕捉关系知识,并促进更准确、上下文感知的响应。鉴于GraphRAG的新颖性和潜力,对当前技术进行系统回顾是必要的。本文首次全面概述了GraphRAG方法。我们形式化了GraphRAG的工作流程,包括基于图的索引、图引导的检索和图增强的生成。然后,我们概述了每个阶段的核心技术和训练方法。此外,我们研究了GraphRAG的下游任务、应用领域、评估方法和工业用例。最后,我们探讨了未来的研究方向,以激发进一步的探索并推动该领域的进展。为了跟踪该领域的最新进展,我们在\url{https://github.com/pengboci/GraphRAG-Survey}上建立了一个仓库。