跳转到内容

结构化数据提取

大型语言模型能够处理大量非结构化数据并以结构化格式返回,而LlamaIndex旨在使这一过程变得简单。

使用LlamaIndex,您可以让大型语言模型读取自然语言并识别语义上重要的细节,例如姓名、日期、地址和数字,并以一致的结构化格式返回这些信息,无论源格式如何。

当您拥有非结构化的原始材料(如聊天记录和对话转录稿)时,这尤其有用。

一旦你有了结构化数据,就可以将它们发送到数据库,或者可以在代码中解析结构化输出来自动化工作流程。

我们的学习部分包含关于结构化数据提取的完整教程。我们建议从那里开始。

还有一个示例笔记本展示了教程中的部分技术。

要更全面地了解使用LlamaIndex进行结构化数据提取(包括底层模块),请查阅以下指南:

我们还支持多模态结构化数据提取。查看详情

一些突出用例的额外示例: