使用网页界面
要开始使用,请前往 cloud.llamaindex.ai。选择您偏好的方式登录。
我们支持使用 OAuth 2.0(谷歌、Github、微软)和电子邮件登录。

您现在应该能看到我们的欢迎界面。
一个提取智能体是可复用的配置,用于从特定类型内容中提取数据。 这包括您想要提取的架构以及影响提取过程的其他设置。
要进入提取功能,请在主页或侧边栏中点击“提取(测试版)”。

您现在可以选择创建一个新的提取智能体,或者查看之前已创建的现有智能体。 为您的智能体命名,确保不与现有名称冲突,然后点击“创建”。这将带您进入
模式是您提取智能体的核心。它定义了您想要提取的数据结构。 我们建议从一个简单的模式开始,然后逐步改进它。
定义模式最简单的方法是使用模式构建器。模式构建器支持允许的JSON模式规范的一个子集,但对于广泛的用例来说已经足够。例如,模式构建器允许定义嵌套对象和数组。
为了了解如何定义复杂模式,您可以使用预定义的提取模板之一。有关为您的用例设计模式的技巧,请参考 模式设计技巧。
点击"模板"下拉菜单并选择技术简历模板:
请注意位置是如何嵌套在基础部分内的一个对象。

在某些情况下,模式构建器功能不足(例如模式构建器不支持联合类型和枚举类型),或者您已有想要使用的JSON模式。在这些情况下,您可以直接将模式粘贴到原始编辑器中。
要保存您的提取智能体配置,请使用“智能体配置”面板底部的“发布配置”按钮。 这将把模式转换为标准化格式,保存提取智能体的当前状态,并使其可供Python SDK使用。 请注意,任何未保存智能体状态所做的更改,仅在通过“运行提取”按钮执行提取时使用。
请注意,每次发布配置时,这将立即导致 Python SDK 为提取智能体使用新的架构/设置。
每次运行提取智能体都会存储所使用的配置。如果您想使用之前运行的某个模式或设置,可以在“提取结果”选项卡中找到特定运行记录,点击“操作”列中的“眼睛”图标,然后在打开的详情视图中点击“编辑”。这将带您回到智能体配置区域,其中已填充了之前运行的模式和设置。
请参考选项了解影响提取过程的其他 Extraction Agent 选项。
当您对模式感到满意后,上传文档并点击“运行提取”。根据文档大小和模式复杂度的不同,这可能需要几秒到几分钟的时间。
提取完成后,您应该能在中间窗格中看到结果:

首次运行特定文件时,由于需要解析并缓存文档,会消耗额外时间。对于较大的文档,这一点可能较为明显。后续的模式迭代处理速度会更快。
您也可以通过点击“提取结果”标签页查看智能体的历史提取记录。这将显示使用该智能体运行的所有提取任务。您可以查看用于提取的架构/设置,并进行编辑以运行新的提取任务。
网页界面让您可以轻松测试和迭代您的模式。当您对某个模式满意后,可以通过Python客户端进行可扩展的数据提取。