TensorZero提供两种评估类型:
静态评估专注于评估TensorZero变体(即提示选择、模型、推理策略等)在给定数据集上的性能。
动态评估专注于评估可能包含多次TensorZero推理调用、任意应用逻辑等复杂工作流。
打个不太准确的比方,静态评估就像针对单个推理调用的单元测试,而动态评估则像是针对复杂工作流的集成测试。