Shortcuts

qwen2_5_1_5b_base

torchtune.models.qwen2_5.qwen2_5_1_5b_base() TransformerDecoder[source]

用于创建使用默认1.5B参数值初始化的Qwen2.5基础模型的构建器 来自 https://huggingface.co/Qwen/Qwen2.5-1.5B

Returns:

Qwen2.5 1.5B模型的实例化

Return type:

TransformerDecoder

注意

除了0.5B和3B之外,所有Qwen2.5模型大小的基础版本和指导版本在架构上略有不同。请确保为权重选择正确的模型构建器。

注意

Qwen2.5 0.5B-3B 模型构建器将默认启用 tie_word_embeddings(参见 qwen2())。