快速入门
LlamaExtract 提供了一个简单的 API,用于从非结构化文档(如 PDF、文本文件和图像)中提取结构化数据。
LlamaExtract 提供网页界面、Python SDK 和 REST API 三种使用方式。
LlamaExtract 适合我吗?
Section titled “Is LlamaExtract right for me?”当您需要以下情况时,LlamaExtract 是一个绝佳选择:
- 为下游任务提供类型良好的数据: 您希望从文档中提取数据,并将其用于下游任务,如训练模型、构建仪表板、录入数据库等。LlamaExtract确保您的数据符合提供的模式,或在不符合时提供有用的错误信息。
- 精准数据提取: 我们采用业界领先的大语言模型从您的文档中提取数据。
- 迭代式模式开发: 您希望快速迭代您的模式,并获取关于它在示例文档上运行效果的反馈。是否需要提供更多示例来提取某个特定字段?是否需要将某个字段设为可选?
- 支持多种文件类型: LlamaExtract 支持多种文件类型,包括PDF、文本文件和图像。如果您需要支持其他文件类型,请告知我们!
尝试LlamaExtract最简单的方法是使用网页界面。
只需定义您的提取智能体(架构和设置),将任何支持的文档拖放到LlamaCloud中,即可从文档中提取数据。

准备好开始编码后,获取API密钥以便通过Python SDK使用LlamaExtract。
我们提供了一个适用于Python的库。这是推荐使用LlamaExtract进行大规模提取作业的方式。查看Python快速入门开始使用。
REST API
Section titled “REST API”如果你使用的不是Python语言,你可以使用REST API。