Llama解析¶

解析原始文档以使用 Llama Parse。

设置环境变量¶

使用Llama Parse需要设置LLAMA_CLOUD_API_KEY环境变量。

您可以在此处获取API密钥

语言支持¶

您可以在此处找到有关支持语言的更多信息

您可以通过language参数设置使用的语言。

表格提取¶

如果原始文档中包含表格，请设置result_type: markdown将其转换为Markdown格式并保存。

📌result_type: 您可以设置3种结果类型。

文本
markdown
json

使用多模态模型¶

您可以在Multimodal Parsing查看关于多模态模型的更多信息

如需使用多模态模型，您需要设置以下参数。

use_vendor_multimodal_model: 是否使用供应商的多模态模型。如需使用多模态模型，请设置为True。默认为False。
vendor_multimodal_model_name: 供应商多模态模型的名称。默认为"openai-gpt4o"。

您可以在此此处查看可用的多模态模型列表。

use_own_key: 是否使用自己的API密钥。默认为False。

如果设置为False，将使用llama parse提供的Basic Plan基础方案。
- 如果设为False，则只需设置环境变量LLAMA_CLOUD_API_KEY即可使用。
如果为true，您需要在下方设置api_key。
有两种方式可以设置API密钥。
- 将vendor_multimodal_api_key直接放入YAML文件
- 根据vendor_multimodal_model_name将API密钥放入环境变量中。
  - vendor_multimodal_model_name: openai-gpt4o 或 openai-gpt-4o-mini
    - 设置 OPENAI_API_KEY 环境变量
  - vendor_multimodal_model_name: anthropic-sonnet-3.5
    - 设置 ANTHROPIC_API_KEY 环境变量
  - vendor_multimodal_model_name: gemini-1.5-flash 或 gemini-1.5-pro
    - 设置 GEMINI_API_KEY 环境变量

注意

vendor_multimodal_model_name: 当前模块不支持“custom-azure-model”。

YAML配置示例¶

不使用多模态模型

modules:
  - module_type: llama_parse
    result_type: markdown
    language: en

使用llama parse提供的基础套餐中的多模态模型

modules:
  - module_type: llamaparse
    result_type: markdown
    use_vendor_multimodal_model: true
    vendor_multimodal_model_name: openai-gpt-4o-mini

使用自带API密钥的多模态模型

modules:
  - module_type: llamaparse
    result_type: markdown
    use_vendor_multimodal_model: true
    vendor_multimodal_model_name: openai-gpt-4o-mini
    use_own_key: true
    vendor_multimodal_api_key: YOUR_OPENAI_API_KEY

使用多模态模型搭配自己的API密钥（环境变量）

modules:
  - module_type: llamaparse
    result_type: markdown
    use_vendor_multimodal_model: true
    vendor_multimodal_model_name: openai-gpt-4o-mini
    use_own_key: true