mistral_reward_7b¶
- torchtune.models.mistral.mistral_reward_7b() TransformerDecoder[source]¶
用于创建Mistral 7B模型的构建器,使用默认的7b参数值进行初始化,来源: https://huggingface.co/Ray2333/reward-model-Mistral-7B-instruct-Unified-Feedback 其中输出层是一个分类层,投影到单个类别以进行奖励建模。
- Returns:
Mistral 7B分类器模型的实例化
- Return type: