使用网页界面

要开始使用，请前往 cloud.llamaindex.ai。选择您偏好的方式登录。

我们支持使用 OAuth 2.0（谷歌、Github、微软）和电子邮件登录。

您现在应该能看到我们的欢迎界面。

创建提取智能体

一个提取智能体是可复用的配置，用于从特定类型内容中提取数据。这包括您想要提取的架构以及影响提取过程的其他设置。

要进入提取功能，请在主页或侧边栏中点击“提取（测试版）”。

Welcome screen

您现在可以选择创建一个新的提取智能体，或者查看之前已创建的现有智能体。为您的智能体命名，确保不与现有名称冲突，然后点击“创建”。这将带您进入

模式是您提取智能体的核心。它定义了您想要提取的数据结构。我们建议从一个简单的模式开始，然后逐步改进它。

定义模式最简单的方法是使用模式构建器。模式构建器支持允许的JSON模式规范的一个子集，但对于广泛的用例来说已经足够。例如，模式构建器允许定义嵌套对象和数组。

为了了解如何定义复杂模式，您可以使用预定义的提取模板之一。有关为您的用例设计模式的技巧，请参考模式设计技巧。

点击"模板"下拉菜单并选择技术简历模板：

请注意位置是如何嵌套在基础部分内的一个对象。 Schema Builder

在某些情况下，模式构建器功能不足（例如模式构建器不支持联合类型和枚举类型），或者您已有想要使用的JSON模式。在这些情况下，您可以直接将模式粘贴到原始编辑器中。

要保存您的提取智能体配置，请使用“智能体配置”面板底部的“发布配置”按钮。这将把模式转换为标准化格式，保存提取智能体的当前状态，并使其可供Python SDK使用。请注意，任何未保存智能体状态所做的更改，仅在通过“运行提取”按钮执行提取时使用。

请注意，每次发布配置时，这将立即导致 Python SDK 为提取智能体使用新的架构/设置。

每次运行提取智能体都会存储所使用的配置。如果您想使用之前运行的某个模式或设置，可以在“提取结果”选项卡中找到特定运行记录，点击“操作”列中的“眼睛”图标，然后在打开的详情视图中点击“编辑”。这将带您回到智能体配置区域，其中已填充了之前运行的模式和设置。

请参考选项了解影响提取过程的其他 Extraction Agent 选项。

当您对模式感到满意后，上传文档并点击“运行提取”。根据文档大小和模式复杂度的不同，这可能需要几秒到几分钟的时间。

提取完成后，您应该能在中间窗格中看到结果：

Extraction Results

首次运行特定文件时，由于需要解析并缓存文档，会消耗额外时间。对于较大的文档，这一点可能较为明显。后续的模式迭代处理速度会更快。

您也可以通过点击“提取结果”标签页查看智能体的历史提取记录。这将显示使用该智能体运行的所有提取任务。您可以查看用于提取的架构/设置，并进行编辑以运行新的提取任务。

网页界面让您可以轻松测试和迭代您的模式。当您对某个模式满意后，可以通过Python客户端进行可扩展的数据提取。