Llama解析

解析原始文档以使用 Llama Parse

设置环境变量

使用Llama Parse需要设置LLAMA_CLOUD_API_KEY环境变量。

您可以在此处获取API密钥

语言支持

您可以在此处找到有关支持语言的更多信息

您可以通过language参数设置使用的语言。

表格提取

如果原始文档中包含表格,请设置result_type: markdown将其转换为Markdown格式并保存。

📌result_type: 您可以设置3种结果类型。

  • 文本

  • markdown

  • json

使用多模态模型

您可以在Multimodal Parsing查看关于多模态模型的更多信息

如需使用多模态模型,您需要设置以下参数。

  1. use_vendor_multimodal_model: 是否使用供应商的多模态模型。如需使用多模态模型,请设置为True。默认为False。

  2. vendor_multimodal_model_name: 供应商多模态模型的名称。默认为"openai-gpt4o"。

  • 您可以在此此处查看可用的多模态模型列表。

  1. use_own_key: 是否使用自己的API密钥。默认为False。

  • 如果设置为False,将使用llama parse提供的Basic Plan基础方案。

    • 如果设为False,则只需设置环境变量LLAMA_CLOUD_API_KEY即可使用。

  • 如果为true,您需要在下方设置api_key。

  • 有两种方式可以设置API密钥。

    • vendor_multimodal_api_key直接放入YAML文件

    • 根据vendor_multimodal_model_name将API密钥放入环境变量中。

      • vendor_multimodal_model_name: openai-gpt4oopenai-gpt-4o-mini

        • 设置 OPENAI_API_KEY 环境变量

      • vendor_multimodal_model_name: anthropic-sonnet-3.5

        • 设置 ANTHROPIC_API_KEY 环境变量

      • vendor_multimodal_model_name: gemini-1.5-flashgemini-1.5-pro

        • 设置 GEMINI_API_KEY 环境变量

注意

vendor_multimodal_model_name: 当前模块不支持“custom-azure-model”。

YAML配置示例

  • 不使用多模态模型

modules:
  - module_type: llama_parse
    result_type: markdown
    language: en
  • 使用llama parse提供的基础套餐中的多模态模型

modules:
  - module_type: llamaparse
    result_type: markdown
    use_vendor_multimodal_model: true
    vendor_multimodal_model_name: openai-gpt-4o-mini
  • 使用自带API密钥的多模态模型

modules:
  - module_type: llamaparse
    result_type: markdown
    use_vendor_multimodal_model: true
    vendor_multimodal_model_name: openai-gpt-4o-mini
    use_own_key: true
    vendor_multimodal_api_key: YOUR_OPENAI_API_KEY
  • 使用多模态模型搭配自己的API密钥(环境变量)

modules:
  - module_type: llamaparse
    result_type: markdown
    use_vendor_multimodal_model: true
    vendor_multimodal_model_name: openai-gpt-4o-mini
    use_own_key: true