torchtune 概述¶

在本页中，我们将概述torchtune，包括其特性、关键概念和其他要点。

什么是torchtune？¶

torchtune 是一个用于轻松编写、微调和实验大型语言模型（LLMs）的 PyTorch 库。该库强调以下四个关键方面：

torchtune 提供：

兴奋吗？要开始，请查看我们的一些教程，包括：

您可以查看我们的食谱概览，了解我们支持的所有微调技术。

当你浏览教程和代码时，有两个概念将帮助你更好地理解和使用torchtune。

配置。 YAML 文件可以帮助您配置训练设置（数据集、模型、检查点）和超参数（批量大小、学习率），而无需修改代码。有关更多信息，请参阅“所有关于配置”深入探讨。

食谱。 食谱可以被视为针对训练和可选评估LLM的端到端管道。每个食谱都实现了一种训练方法（例如：完全微调），并应用了一组有意义的特性（例如：FSDP2 + 激活检查点 + 梯度累积 + 降低精度训练）到给定的模型系列（例如：Llama3.1）。有关更多信息，请参阅“什么是食谱？”深入探讨。

torchtune 体现了 PyTorch 的设计理念，尤其是“可用性高于一切”。

原生 PyTorch

torchtune 是一个原生 PyTorch 库。虽然我们提供了与周边生态系统的集成（例如：Hugging Face Datasets，EleutherAI’s Eval Harness），但所有核心功能都是用 PyTorch 编写的。

简单性和可扩展性

torchtune 旨在易于理解、使用和扩展。

正确性

torchtune 提供了经过充分测试的组件，确保高度的正确性。该库不会率先提供新功能，但提供的功能将经过全面测试。我们提供