SpeechBrain 高级

训练深度神经网络模型通常非常耗时且昂贵。因此，在可能的情况下，使用现成的预训练模型在各种场景中都非常方便。我们提供了一种简单直接的方法来下载和实例化来自HuggingFace HuggingFace HuggingFace的最先进的预训练模型，并可以将其用于直接推理或微调/知识蒸馏，或者任何你能想到的新奇技术！

🔗 大数据集和共享文件系统的数据加载

Rouhe A.

2021年2月

难度：中等

时间：15分钟

🔗 Google Colab

你是否有一个存储在共享文件系统中的巨大数据集？本教程将向你展示如何从共享文件系统加载大型数据集，并使用它们来训练一个使用SpeechBrain的神经网络。特别是，我们描述了一种基于WebDataset库的解决方案，该解决方案易于集成到SpeechBrain工具包中。

🔗 文本分词

Heba A. & Parcollet T.

2021年2月

难度：简单

时间：20分钟

🔗 Google Colab

处理文本的机器学习任务可能包含数千个词汇，这导致模型需要处理巨大的嵌入作为输入/输出（例如，对于one-hot-vectors和ndim=vocabulary_size）。这会导致内存的大量消耗、复杂的计算，更重要的是，由于极其稀疏和繁琐的one-hot向量，学习效果不佳。在本教程中，我们提供了正确使用基于SentencePiece（BPE和unigram）的SpeechBrain Tokenizer所需的所有基础知识。

🔗 将量化应用于语音识别模型

Lam J.

2024年4月

难度：中等

时间：30分钟

🔗 Google Colab

量化是许多深度神经网络的一个必要步骤，特别是对于需要低延迟和高效内存使用的任务，如实时自动语音识别。本教程将介绍量化问题，并解释如何使用SpeechBrain进行量化。