多轮越狱

Crescendo策略是一种多轮越狱技术，通过逐步升级提示的潜在危害，利用可接受与不可接受响应之间的模糊边界。

由于它是多轮的，因此可以暴露出仅在多次交互后才会出现的漏洞。

你可以使用以下配置来应用它：

strategies:
  - crescendo

或者通过以下参数进行调整：

strategies:
  - id: crescendo
    config:
      maxTurns: 5
      maxBacktracks: 5

增加轮数和回溯次数会使策略更具攻击性，但完成时间会更长，成本也会更高。

danger

此策略成本相对较高。我们建议在较少的测试和插件上运行，使用成本较低的提供商，或者优先选择更简单的迭代策略。

工作原理

Crescendo策略通过以下方式运作：

多轮越狱策略

当策略遇到拒绝时，它会回溯到对话的早期阶段。

像Crescendo这样的多轮越狱可以识别出仅在多次交互后才会出现的漏洞。

它们还利用了LLM在整个对话过程中变得更顺从，并更有可能忽略其原始指令的倾向。

回溯自动化也节省了大量时间，相比于手动红队测试，因为它消除了重建整个对话历史的需要。