Llama解析¶
解析原始文档以使用 Llama Parse。
设置环境变量¶
使用Llama Parse需要设置LLAMA_CLOUD_API_KEY环境变量。
您可以在此处获取API密钥
语言支持¶
您可以在此处找到有关支持语言的更多信息
您可以通过language参数设置使用的语言。
表格提取¶
如果原始文档中包含表格,请设置result_type: markdown将其转换为Markdown格式并保存。
📌result_type: 您可以设置3种结果类型。
文本
markdown
json
使用多模态模型¶
您可以在Multimodal Parsing查看关于多模态模型的更多信息
如需使用多模态模型,您需要设置以下参数。
use_vendor_multimodal_model: 是否使用供应商的多模态模型。如需使用多模态模型,请设置为True。默认为False。vendor_multimodal_model_name: 供应商多模态模型的名称。默认为"openai-gpt4o"。
您可以在此此处查看可用的多模态模型列表。
use_own_key: 是否使用自己的API密钥。默认为False。
如果设置为False,将使用llama parse提供的Basic Plan基础方案。
如果设为False,则只需设置环境变量
LLAMA_CLOUD_API_KEY即可使用。
如果为true,您需要在下方设置api_key。
有两种方式可以设置API密钥。
将
vendor_multimodal_api_key直接放入YAML文件根据
vendor_multimodal_model_name将API密钥放入环境变量中。vendor_multimodal_model_name:openai-gpt4o或openai-gpt-4o-mini设置
OPENAI_API_KEY环境变量
vendor_multimodal_model_name:anthropic-sonnet-3.5设置
ANTHROPIC_API_KEY环境变量
vendor_multimodal_model_name:gemini-1.5-flash或gemini-1.5-pro设置
GEMINI_API_KEY环境变量
注意
vendor_multimodal_model_name: 当前模块不支持“custom-azure-model”。
YAML配置示例¶
不使用多模态模型
modules:
- module_type: llama_parse
result_type: markdown
language: en
使用llama parse提供的基础套餐中的多模态模型
modules:
- module_type: llamaparse
result_type: markdown
use_vendor_multimodal_model: true
vendor_multimodal_model_name: openai-gpt-4o-mini
使用自带API密钥的多模态模型
modules:
- module_type: llamaparse
result_type: markdown
use_vendor_multimodal_model: true
vendor_multimodal_model_name: openai-gpt-4o-mini
use_own_key: true
vendor_multimodal_api_key: YOUR_OPENAI_API_KEY
使用多模态模型搭配自己的API密钥(环境变量)
modules:
- module_type: llamaparse
result_type: markdown
use_vendor_multimodal_model: true
vendor_multimodal_model_name: openai-gpt-4o-mini
use_own_key: true