SpeechBrain 高级

🔗 性能分析

Nautsch A.

2022年6月

难度:中等

时间:45分钟

🔗 Google Colab

SpeechBrain模型的性能分析和基准测试可以服务于不同的目的,并从不同的角度进行考察。性能要求高度依赖于使用SpeechBrain的具体用例。这为全面的自学提供了手段,作为超越所提供内容的个人成长的起点。

🔗 动态批处理:它是什么以及为什么有时是必要的

Nautsch A. 和 Cornell S.

2021年11月

难度:中等

时间:25分钟

🔗 Google Colab

您是否希望加快训练速度或减少内存需求?一个可能的解决方案是动态批处理。通过这种方法,您可以动态地采样由不同数量的句子组成的批次。在本教程中,我们将展示如何在SpeechBrain中使用这种技术。

🔗 超参数优化

普洛伊尼科夫 A.

2021年12月

难度:中等

时间:25分钟

🔗 Google Colab

你想优化模型的超参数吗?你是否厌倦了手动操作?本教程将介绍如何使用Orion工具包优化SpeechBrain模型的超参数。

🔗 通过SpeechBrain和Flower进行联邦语音模型训练

高 Y. & 帕科莱 T.

2021年11月

难度:高

时间:45分钟

🔗 Google Colab

您是否对联邦学习(FL)和语音都感兴趣,但担心没有合适的工具来运行实验?今天您将得到答案。 本教程介绍了如何集成Flower和SpeechBrain以实现联邦语音模型训练。

🔗 推断你训练好的SpeechBrain模型

Parcollet T.

2021年9月

难度:中等

时间:30分钟

🔗 Google Colab

在本教程中,我们将学习三种不同的方法来对训练好的模型进行推断。 这对于调试您的管道或在生产环境中部署模型特别有用。

🔗 使用HuggingFace进行预训练模型和微调

Cornell S. & Parcollet T.

2021年3月

难度:中等

时间:30分钟

🔗 Google Colab

训练深度神经网络模型通常非常耗时且昂贵。 因此,在可能的情况下,使用现成的预训练模型在各种场景中都非常方便。 我们提供了一种简单直接的方法来下载和实例化来自HuggingFace HuggingFace HuggingFace的最先进的预训练模型,并可以将其用于直接推理或微调/知识蒸馏,或者任何你能想到的新奇技术!

🔗 大数据集和共享文件系统的数据加载

Rouhe A.

2021年2月

难度:中等

时间:15分钟

🔗 Google Colab

你是否有一个存储在共享文件系统中的巨大数据集?本教程将向你展示如何从共享文件系统加载大型数据集,并使用它们来训练一个使用SpeechBrain的神经网络。 特别是,我们描述了一种基于WebDataset库的解决方案,该解决方案易于集成到SpeechBrain工具包中。

🔗 文本分词

Heba A. & Parcollet T.

2021年2月

难度:简单

时间:20分钟

🔗 Google Colab

处理文本的机器学习任务可能包含数千个词汇,这导致模型需要处理巨大的嵌入作为输入/输出(例如,对于one-hot-vectors和ndim=vocabulary_size)。这会导致内存的大量消耗、复杂的计算,更重要的是,由于极其稀疏和繁琐的one-hot向量,学习效果不佳。在本教程中,我们提供了正确使用基于SentencePiece(BPE和unigram)的SpeechBrain Tokenizer所需的所有基础知识。

🔗 将量化应用于语音识别模型

Lam J.

2024年4月

难度:中等

时间:30分钟

🔗 Google Colab

量化是许多深度神经网络的一个必要步骤,特别是对于需要低延迟和高效内存使用的任务,如实时自动语音识别。本教程将介绍量化问题,并解释如何使用SpeechBrain进行量化。