SpeechBrain 基础

在SpeechBrain，我们决定超参数和学习算法之间的区别应该在我们工具包的结构中显而易见，因此我们将我们的配方分为两个主要文件：train.py 和 hyperparams.yaml。hyperparams.yaml 文件采用SpeechBrain开发的格式，我们称之为“HyperPyYAML”。我们选择扩展YAML，因为它是一种高度可读的数据序列化格式。通过扩展一个已经非常有用的格式，我们能够创建一个扩展的超参数定义，保持我们实际的实验代码简洁且高度可读。

🔗 数据加载

Cornell S. & Rouhe A.

2021年1月

难度：中等

时间：20分钟

🔗 Google Colab

设置一个高效的数据加载管道通常是一项繁琐的任务，涉及创建示例、定义你的 torch.utils.data.Dataset 类以及不同的数据采样和增强策略。在 SpeechBrain 中，我们提供了高效的抽象来简化这一耗时的过程，而不会牺牲灵活性。事实上，我们的数据管道是围绕 Pytorch 构建的。

🔗 检查点

Rouhe A.

2021年2月

难度：简单

时间：15分钟

🔗 Google Colab

通过检查点，我们指的是在特定时间点保存模型和所有其他必要的状态信息（如优化器参数、哪个时期和哪个迭代）。