示例#

我们提供了一些示例，展示如何在我们的软件包中解决您的问题。

数据准备#

数据集
- 通用数据集格式
- 支持的数据集及详细格式

检查点
- LLaMA 检查点

微调#

对于监督式微调（SFT），

微调

对于对齐过程，

奖励建模

RAFT

推理#

参考示例。

评估#