快速入门

概述

LlamaExtract 提供了一个简单的 API，用于从非结构化文档（如 PDF、文本文件和图像）中提取结构化数据。

LlamaExtract 提供网页界面、Python SDK 和 REST API 三种使用方式。

当您需要以下情况时，LlamaExtract 是一个绝佳选择：

为下游任务提供类型良好的数据: 您希望从文档中提取数据，并将其用于下游任务，如训练模型、构建仪表板、录入数据库等。LlamaExtract确保您的数据符合提供的模式，或在不符合时提供有用的错误信息。
精准数据提取: 我们采用业界领先的大语言模型从您的文档中提取数据。
迭代式模式开发: 您希望快速迭代您的模式，并获取关于它在示例文档上运行效果的反馈。是否需要提供更多示例来提取某个特定字段？是否需要将某个字段设为可选？
支持多种文件类型: LlamaExtract 支持多种文件类型，包括PDF、文本文件和图像。如果您需要支持其他文件类型，请告知我们！

尝试LlamaExtract最简单的方法是使用网页界面。

只需定义您的提取智能体（架构和设置），将任何支持的文档拖放到LlamaCloud中，即可从文档中提取数据。

Extraction Results

准备好开始编码后，获取API密钥以便通过Python SDK使用LlamaExtract。

我们提供了一个适用于Python的库。这是推荐使用LlamaExtract进行大规模提取作业的方式。查看Python快速入门开始使用。

如果你使用的不是Python语言，你可以使用REST API。