结构化数据提取
大型语言模型能够处理大量非结构化数据并以结构化格式返回,而LlamaIndex旨在使这一过程变得简单。
使用LlamaIndex,您可以让大型语言模型读取自然语言并识别语义上重要的细节,例如姓名、日期、地址和数字,并以一致的结构化格式返回这些信息,无论源格式如何。
当您拥有非结构化的原始材料(如聊天记录和对话转录稿)时,这尤其有用。
一旦你有了结构化数据,就可以将它们发送到数据库,或者可以在代码中解析结构化输出来自动化工作流程。
我们的学习部分提供了关于结构化数据提取的完整教程。我们建议从那里开始。
还有一个示例笔记本展示了教程中的部分技术。
要更全面地了解使用LlamaIndex进行结构化数据提取(包括底层模块),请查阅以下指南:
我们还支持多模态结构化数据提取。查看详情。
一些突出用例的额外示例: