语音处理任务

🔗 从零开始的语音识别

Ravanelli M. & Parcollet T.

2021年4月

难度：中等

时间：45分钟

🔗 Google Colab

你想了解如何使用SpeechBrain实现你的语音识别器吗？不用再找了，你来对地方了。本教程将带你完成实现一个离线的端到端基于注意力的语音识别器所需的所有步骤。这是一个自包含的教程，将帮助你在训练现代语音识别器所需的所有步骤中“连接点”。我们将讨论数据准备、分词器训练、语言模型、ASR模型和推理。我们将解释如何在你的数据上训练你的模型。

🔗 语音识别指标

de Langen S.

2024年9月

难度：中等

时间：30分钟

🔗 Google Colab

估计语音识别模型的准确性并不是一个简单的问题。单词错误率（WER）和字符错误率（CER）是标准指标，但一些研究一直在尝试开发与人类评估更相关的替代方案（例如SemDist）。

本教程介绍了一些替代的ASR指标及其在SpeechBrain中的灵活集成，这可以帮助您研究、使用或开发新的指标。

🔗 源分离

Subakan C.

2021年1月

难度：中等

时间：30分钟

🔗 Google Colab

在源分离中，目标是从观察到的混合信号中分离出源信号，该混合信号由多个源的叠加组成。在本教程中，我们介绍了一些使用SpeechBrain进行源分离的示例。

🔗 从零开始的语音增强

普兰廷加 P.

2021年2月

难度：中等

时间：30分钟

🔗 Google Colab

所以你想用语音进行回归任务吗？不用再找了，你来对地方了。本教程将带你通过一个基本的语音增强模板，使用SpeechBrain来展示制作新配方所需的所有组件。

🔗 从零开始的语音分类

Ravanelli M.

2021年1月

难度：中等

时间：30分钟

🔗 Google Colab

在本教程中，我们展示了如何使用SpeechBrain来实现一个话语级别的语音分类器。如果您想开发用于说话人识别、语言识别、情感识别、声音分类、关键词检测以及许多其他任务的系统，这可能会有所帮助。

🔗 语音活动检测

Ravanelli M.

2021年9月

难度：简单

时间：15分钟

🔗 Google Colab

在本教程中，我们将展示如何使用SpeechBrain进行语音活动检测。本教程将描述如何训练一个神经VAD，并将其用于长音频记录的推理。