Shortcuts

AlpacaToMessages

class torchtune.data.AlpacaToMessages(train_on_input: bool = True, column_map: Optional[Dict[str, str]] = None)[source]

用于Alpaca风格数据集的Message转换类,包含“instruction”、“input”和“output”(或在column_map中指定的等效字段)列。用户消息由instruction + input列组成,助手消息由output列组成。提示模板的条件是“input”列的存在,因此由于这种自定义逻辑,直接在此转换类中处理,而不是在专用的PromptTemplate类中处理。

Parameters:
  • train_on_input (bool) – 模型是否在用户提示上进行训练。 默认值为 True。

  • column_map (可选[字典[str, str]]) – 一个映射,用于将预期的“instruction”、“input”和“output”列名更改为数据集中实际的列名。默认值为None,保留默认列名。