跳至内容

核心概念#

这是一份快速指南,介绍了在构建LLM应用时您将频繁遇到的高级概念。

大型语言模型(LLMs)#

大语言模型(LLMs)是推动LlamaIndex发展的基础性创新。它们是一种人工智能(AI)计算机系统,能够理解、生成和处理自然语言,包括根据其训练数据或在查询时提供的数据来回答问题。您可以了解更多关于使用LLMs的信息

智能体应用#

当LLM在应用程序中使用时,它通常用于做出决策、采取行动和/或与世界互动。这就是智能体应用的核心定义。

虽然智能体应用的定义很广泛,但有几个关键特征定义了智能体应用:

  • LLM增强: LLM通过工具(即代码中的任意可调用函数)、内存和/或动态提示进行增强。
  • 提示链: 使用多个相互构建的LLM调用,将一个LLM调用的输出作为下一个调用的输入。
  • 路由: LLM用于将应用程序路由到下一个适当的步骤或状态。
  • 并行处理: 该应用能够并行执行多个步骤或操作。
  • 编排: 使用LLM的层次结构来编排底层动作和LLM。
  • 反思: LLM用于反思和验证之前步骤或LLM调用的输出结果,这可以用来引导应用程序进入下一个合适的步骤或状态。

在LlamaIndex中,您可以通过使用Workflow类来编排一系列步骤和LLM,从而构建智能体应用。您可以了解更多关于工作流的信息

智能体#

我们将智能体定义为"智能体应用"的一个具体实例。智能体是一种软件,通过将LLM与其他工具和记忆相结合,半自主地执行任务,并由一个决定下一步使用哪个工具(如果有的话)的推理循环进行协调。

在实际操作中,这意味着类似以下流程: - 智能体接收用户消息 - 智能体利用LLM(基于先前的聊天记录、工具和最新用户消息)决定下一步应采取的行动 - 智能体可能调用一个或多个工具来协助处理用户请求 - 如果使用了工具,智能体会解析工具输出结果,并据此决定下一步行动 - 当智能体停止采取行动时,会将最终结果返回给用户

你可以了解更多关于智能体的信息

检索增强生成 (RAG)#

检索增强生成(RAG)是利用LlamaIndex构建数据驱动型LLM应用的核心技术。它通过查询时向LLM提供私有数据(而非训练LLM使用这些数据),使LLM能够回答关于您私有数据的问题。为避免每次查询都向LLM发送全部数据,RAG会对数据进行索引,并选择性地仅发送与查询相关的部分数据。您可以了解更多关于RAG的信息

使用案例#

基于数据的LLM应用有无数种用例,但大致可以分为四类:

智能体: 智能体是由大型语言模型驱动的自动化决策系统,通过一组工具与世界互动。智能体可以采取任意数量的步骤来完成给定任务,动态决定最佳行动方案,而不是遵循预先确定的步骤。这使其具备额外的灵活性来处理更复杂的任务。

工作流: LlamaIndex中的工作流是一种特定的事件驱动抽象,允许您编排一系列步骤和LLM调用。工作流可用于实现任何智能体应用,是LlamaIndex的核心组件。

结构化数据提取 Pydantic提取器允许您指定一个精确的数据结构来从数据中提取,并使用LLM以类型安全的方式填充缺失的部分。这对于从PDF、网站等非结构化来源提取结构化数据非常有用,是实现工作流自动化的关键。

查询引擎: 查询引擎是一个端到端的流程,允许您对数据提出问题。它接收自然语言查询,并返回响应以及检索到的参考上下文,这些上下文会被传递给LLM。

聊天引擎: 聊天引擎是与您的数据进行对话的端到端流程(支持多轮对话而不仅是单次问答)。

提示

优云智算