speechbrain.inference.separation 模块

指定语音分离模块的推理接口。

Authors:
  • 阿库·罗赫 2021

  • 彼得·普兰廷加 2021

  • 洛伦·卢戈斯奇 2020

  • Mirco Ravanelli 2020

  • Titouan Parcollet 2021

  • 阿卜杜勒·赫巴 2021

  • 安德烈亚斯·诺茨 2022, 2023

  • Pooneh Mousavi 2023

  • Sylvain de Langen 2023

  • 阿德尔·穆门 2023

  • 普拉迪亚·坎达尔卡 2023

摘要

类:

SepformerSeparation

一个“即用型”语音分离模型。

参考

class speechbrain.inference.separation.SepformerSeparation(modules=None, hparams=None, run_opts=None, freeze_params=True)[source]

基础类:Pretrained

一个“即用型”语音分离模型。

使用Sepformer架构。

Example

>>> tmpdir = getfixture("tmpdir")
>>> model = SepformerSeparation.from_hparams(
...     source="speechbrain/sepformer-wsj02mix",
...     savedir=tmpdir)
>>> mix = torch.randn(1, 400)
>>> est_sources = model.separate_batch(mix)
>>> print(est_sources.shape)
torch.Size([1, 400, 2])
MODULES_NEEDED = ['encoder', 'masknet', 'decoder']
separate_batch(mix)[source]

对一批音频进行源分离。

Parameters:

mix (torch.Tensor) – 源的混合。

Returns:

分离的源

Return type:

张量

separate_file(path, savedir=None)[source]

从文件中分离源。

Parameters:
  • path (str) – 文件路径,该文件包含混合来源。它可以是本地路径、网页URL或huggingface仓库。

  • savedir (path) – 存储wav信号的路径(当从网络下载时)。

Returns:

分离的源

Return type:

张量

forward(mix)[source]

对输入混合物进行分离