跳转到内容

结构化输出(测试版)



结构化输出在 llamaParse API 中已被弃用,请改用 LlamaExtract API。



结构化输出允许您在解析阶段直接从文档中提取结构化数据(如JSON),从而降低所需成本和时间。

结构化输出目前仅与我们默认的解析模式兼容,可通过在API中设置structured_output=True来激活。

parser = LlamaParse(
structured_output=True
)


然后您需要提供以下任一选项:

  • 一个 JSON 模式在 structured_output_json_schema API 变量中,将用于以所需格式提取数据
  • 或者变量 structured_output_json_schema_name 中我们预定义模式之一的名称
parser = LlamaParse(
structured_output_json_schema='A JSON SCHEMA'
)




允许LlamaParse推断输出格式的通配符模式

Terminal window
curl -X 'POST' \
'https://api.cloud.llamaindex.ai/api/v1/parsing/upload' \
-H 'accept: application/json' \
-H 'Content-Type: multipart/form-data' \
-H "Authorization: Bearer $LLAMA_CLOUD_API_KEY" \
--form 'structured_output_json_schema_name="imFeelingLucky"' \
-F 'file=@/path/to/your/file.pdf;type=application/pdf'


标准发票模式,适用于明细项目、税费和总计

Terminal window
curl -X 'POST' \
'https://api.cloud.llamaindex.ai/api/v1/parsing/upload' \
-H 'accept: application/json' \
-H 'Content-Type: multipart/form-data' \
-H "Authorization: Bearer $LLAMA_CLOUD_API_KEY" \
--form 'structured_output_json_schema_name="invoice"' \
-F 'file=@/path/to/your/file.pdf;type=application/pdf'


遵循 JSON 简历标准

Terminal window
curl -X 'POST' \
'https://api.cloud.llamaindex.ai/api/v1/parsing/upload' \
-H 'accept: application/json' \
-H 'Content-Type: multipart/form-data' \
-H "Authorization: Bearer $LLAMA_CLOUD_API_KEY" \
--form 'structured_output_json_schema_name="resume"' \
-F 'file=@/path/to/your/file.pdf;type=application/pdf'