
学习如何使用LangGraph构建一个由专业AI智能体团队组成的自主研究助手
GPT Researcher 自首次发布仅过去一年,但构建、测试和部署智能体的方法已经发生了显著变化。这正是当前人工智能发展的本质和速度。从最初简单的零样本或少样本提示,迅速演变为智能体函数调用、RAG(检索增强生成),如今最终发展为智能体工作流(又称"流程工程")。
吴恩达最近表示:“我认为AI智能体工作流将在今年推动人工智能的重大进展——甚至可能超过下一代基础模型。这是一个重要趋势,我敦促所有从事AI工作的人都予以关注。”
在本文中,您将了解为什么多智能体工作流是当前的最佳标准,以及如何使用LangGraph构建最优的自主研究多智能体助手。
要跳过本教程,欢迎查看GPT Researcher x LangGraph的Github仓库。
LangGraph简介
LangGraph是LangChain的一个扩展,旨在创建智能体和多智能体流程。它增加了创建循环流程的能力,并内置了记忆功能——这两者对于构建智能体都是至关重要的特性。
LangGraph为开发者提供了高度的可控性,对于创建自定义智能体和流程至关重要。实际生产环境中几乎所有的智能体都会针对其试图解决的具体用例进行定制。LangGraph让您能够灵活创建任意自定义智能体,同时提供直观的开发者体验来实现这一目标。
寒暄到此为止,让我们开始构建吧!
构建终极自主研究智能体
通过利用LangGraph,研究过程的深度和质量可以得到显著提升,这得益于多个具备专业技能的智能体的协同工作。让每个智能体专注于并精通某一特定技能,能够实现更好的关注点分离、更高的可定制性,并随着项目规模的扩大而持续进行扩展开发。
受近期STORM论文的启发,本示例展示了AI智能体团队如何协作完成从规划到发布的给定主题研究。该示例还将利用领先的自主研究智能体GPT Researcher。
研究智能体团队
研究团队由七个LLM智能体组成:
- 主编 — 监督研究过程并管理团队。这是使用LangGraph协调其他智能体的"主控"智能体。该智能体作为主要的LangGraph接口。
- GPT Researcher — 一个专门化的自主智能体,能够对给定主题进行深入研究。
- 编辑 — 负责规划研究大纲和结构。
- 审阅者 — 根据给定标准验证研究结果的正确性。
- 修订者 — 根据审阅者的反馈修订研究成果。
- Writer — 负责编译和撰写最终报告。
- 发布者 — 负责以多种格式发布最终报告。
如下所示,自动化流程基于以下阶段:规划研究、数据收集与分析、审核与修订、撰写报告,最后发布:

更具体地说,流程如下:
-
浏览器 (gpt-researcher) — 根据给定的研究任务在互联网上进行初步调研。这一步骤对大型语言模型至关重要,使其能够基于最新相关信息规划研究流程,而不仅仅依赖预训练数据来处理特定任务或主题。
-
编辑 — 根据初步研究规划报告大纲和结构。编辑还负责根据规划的大纲触发并行研究任务。
-
针对每个大纲主题(并行处理):
- 研究员 (gpt-researcher) — 对子主题进行深入研究并撰写初稿。该智能体底层使用GPT Researcher Python包,用于生成经过优化的、深入且基于事实的研究报告。
- 审阅者 — 根据一组指南验证草稿的正确性,并向修订者提供反馈(如有需要)。
- 修订者 — 根据评审反馈不断修改草稿,直至达到满意效果。
-
撰写者 — 根据给定的研究发现,编译并撰写最终报告,包括引言、结论和参考文献部分。
-
发布器 — 将最终报告发布为多种格式,如PDF、Docx、Markdown等。
-
由于代码量庞大,我们不会深入探讨所有代码,而是主要聚焦于我发现的值得分享的有趣部分。
定义图状态
LangGraph最让我喜爱的功能之一是状态管理。在LangGraph中,状态通过结构化方法实现,开发者可以定义一个GraphState来封装应用程序的完整状态。图中的每个节点都可以修改这个状态,从而根据交互过程中不断变化的上下文生成动态响应。
就像任何技术设计的开始阶段,考虑整个应用程序的数据架构是关键。在本例中,我们将定义一个ResearchState如下:
class ResearchState(TypedDict):
task: dict
initial_research: str
sections: List[str]
research_data: List[dict]
title: str
headers: dict
date: str
table_of_contents: str
introduction: str
conclusion: str
sources: List[str]
report: str
如上所示,状态分为两个主要区域:研究任务和报告布局内容。当数据在智能体图中流转时,每个智能体会基于现有状态依次生成新数据,并更新状态以便后续与其他智能体在图中进行进一步处理。
然后我们可以用以下方式初始化图表:
from langgraph.graph import StateGraph
workflow = StateGraph(ResearchState)
使用LangGraph初始化图表
如上所述,多智能体开发的一大优势在于构建每个智能体使其具备专业化和限定范围的技能。让我们以使用GPT Researcher Python包的研究员智能体为例:
from gpt_researcher import GPTResearcher
class ResearchAgent:
def __init__(self):
pass
async def research(self, query: str):
researcher = GPTResearcher(parent_query=parent_query, query=query, report_type=research_report, config_path=None)
await researcher.conduct_research()
report = await researcher.write_report()
return report
如上所示,我们已经创建了一个研究智能体的实例。现在假设我们对团队中的每个智能体都进行了同样的操作。在创建完所有智能体后,我们将使用LangGraph初始化图结构:
def init_research_team(self):
editor_agent = EditorAgent(self.task)
research_agent = ResearchAgent()
writer_agent = WriterAgent()
publisher_agent = PublisherAgent(self.output_dir)
workflow = StateGraph(ResearchState)
workflow.add_node("browser", research_agent.run_initial_research)
workflow.add_node("planner", editor_agent.plan_research)
workflow.add_node("researcher", editor_agent.run_parallel_research)
workflow.add_node("writer", writer_agent.run)
workflow.add_node("publisher", publisher_agent.run)
workflow.add_edge('browser', 'planner')
workflow.add_edge('planner', 'researcher')
workflow.add_edge('researcher', 'writer')
workflow.add_edge('writer', 'publisher')
workflow.set_entry_point("browser")
workflow.add_edge('publisher', END)
return workflow
如上所示,创建LangGraph图非常简单直接,主要由三个核心函数组成:add_node、add_edge和set_entry_point。通过这些主要函数,您可以先向图中添加节点,连接边,最后设置起始点。
重点检查:如果你一直在正确跟踪代码和架构,你会注意到上面的初始化中缺少了Reviewer和Reviser智能体。让我们深入探讨这个问题!
支持有状态并行化的图中图
这是我在使用LangGraph过程中最令人兴奋的部分!这个自主智能体的一个亮点功能是能够并行执行每项研究任务,并根据一组预定义的指导方针进行审查和修订。
了解如何在流程中利用并行工作是优化速度的关键。但如果所有智能体都向同一状态报告,该如何触发并行智能体工作?这可能导致最终数据报告中的竞争条件和不一致。为解决此问题,您可以创建一个子图,该子图将从主LangGraph实例触发。这个子图将为每次并行运行维护自己的状态,从而解决上述问题。
和之前一样,让我们定义LangGraph状态及其智能体。由于这个子图主要是审查和修改研究草稿,我们将用草稿信息来定义状态:
class DraftState(TypedDict):
task: dict
topic: str
draft: dict
review: str
revision_notes: str
正如DraftState所示,我们主要关注讨论的主题、审阅者以及修订说明,因为它们相互沟通以最终确定子主题研究报告。为了创建循环条件,我们将利用LangGraph的最后一个重要部分——条件边:
async def run_parallel_research(self, research_state: dict):
workflow = StateGraph(DraftState)
workflow.add_node("researcher", research_agent.run_depth_research)
workflow.add_node("reviewer", reviewer_agent.run)
workflow.add_node("reviser", reviser_agent.run)
workflow.set_entry_point("researcher")
workflow.add_edge('researcher', 'reviewer')
workflow.add_edge('reviser', 'reviewer')
workflow.add_conditional_edges('reviewer',
(lambda draft: "accept" if draft['review'] is None else "revise"),
{"accept": END, "revise": "reviser"})
通过定义条件边,如果审阅者存在审阅意见,图表将指向修订者,否则循环将以最终草案结束。如果回到我们构建的主图表,你会看到这个并行工作位于由ChiefEditor智能体调用的名为“researcher”的节点下。
运行研究助手
在确定智能体、状态和图表后,是时候运行我们的研究助手了!为了便于自定义,该助手通过给定的task.json文件运行:
{
"query": "Is AI in a hype cycle?",
"max_sections": 3,
"publish_formats": {
"markdown": true,
"pdf": true,
"docx": true
},
"follow_guidelines": false,
"model": "gpt-4-turbo",
"guidelines": [
"The report MUST be written in APA format",
"Each sub section MUST include supporting sources using hyperlinks. If none exist, erase the sub section or rewrite it to be a part of the previous section",
"The report MUST be written in spanish"
]
}
任务对象本身已经非常直观明了,但请注意如果follow_guidelines设为false,会导致图谱忽略修订步骤和已定义的指导原则。此外,max_sections字段定义了需要研究的子标题数量。设置较小的值将生成较短的报告。
运行该助手将生成最终的研究报告,支持Markdown、PDF和Docx等格式。
要下载并运行示例,请查看GPT Researcher与LangGraph的开源页面。
下一步是什么?
展望未来,有许多令人兴奋的思考方向。人机协同是优化AI体验的关键。通过人类协助助手修订并聚焦于最恰当的研究计划、主题和提纲,将显著提升整体质量和体验。此外,在AI流程中始终注重人类干预,能确保结果的正确性、可控性和确定性。很高兴看到LangGraph已经原生支持这一功能,具体可参考此处。
此外,支持对网络和本地数据的研究对于许多商业和个人用例来说至关重要。
最后,可以投入更多努力来提升检索来源的质量,并确保最终报告以最优的故事线构建。
在LangGraph和多智能体协作领域向前迈进的一步将是助手能够根据给定任务动态规划和生成图。这一愿景将使助手能够仅为特定任务选择一部分智能体,并根据本文介绍的图基础规划其策略,从而开启一个充满可能性的全新世界。鉴于人工智能领域的创新速度,新一代颠覆性的GPT Researcher版本很快将会问世。期待未来带来的惊喜!
要了解该项目的持续进展和更新,请加入我们的Discord社区。一如既往,如果您有任何反馈或进一步的问题,请在下方留言!