TensorZero 评估概览

TensorZero提供两种评估类型：

静态评估专注于评估TensorZero变体（即提示选择、模型、推理策略等）在给定数据集上的性能。

动态评估专注于评估可能包含多次TensorZero推理调用、任意应用逻辑等复杂工作流。

打个不太准确的比方，静态评估就像针对单个推理调用的单元测试，而动态评估则像是针对复杂工作流的集成测试。

教程：静态评估

教程：动态评估