Table of Contents

Shortcuts

mistral_reward_7b¶

torchtune.models.mistral.mistral_reward_7b() → TransformerDecoder[source]¶

用于创建Mistral 7B模型的构建器，使用默认的7b参数值进行初始化，来源： https://huggingface.co/Ray2333/reward-model-Mistral-7B-instruct-Unified-Feedback 其中输出层是一个分类层，投影到单个类别以进行奖励建模。

Returns:: Mistral 7B分类器模型的实例化
Return type:: TransformerDecoder