speechbrain.lobes.models.segan_model 模块

该文件包含两个PyTorch模块,它们共同构成了SEGAN模型架构 (基于论文:Pascual等人 https://arxiv.org/pdf/1703.09452.pdf)。 通过修改初始化参数,可以改变类项目中描述的模型, 例如将生成器转换为VAE,或移除潜在变量的连接。

训练SEGAN的损失函数也在此文件中定义。

Authors
  • 弗朗西斯·卡特 2021

摘要

类:

Discriminator

SEGAN的CNN判别器

Generator

用于清理语音信号的CNN自编码器模型。

函数:

d1_loss

计算判别器在输入为干净时的损失

d2_loss

计算判别器在输入不干净时的损失

g3_loss

计算给定判别器输出的生成器损失

参考

class speechbrain.lobes.models.segan_model.Generator(kernel_size, latent_vae, z_prob)[source]

基础:Module

CNN自编码器模型用于清理语音信号。

Parameters:
  • kernel_size (int) – 卷积核的大小。

  • latent_vae (bool) – 是否将自动编码器转换为变分自动编码器

  • z_prob (bool) – 是否移除潜在变量的连接。仅在 latent_vae 为 False 时适用。

forward(x)[source]

通过自动编码器的前向传递

class speechbrain.lobes.models.segan_model.Discriminator(kernel_size)[source]

基础:Module

SEGAN的CNN判别器

Parameters:

kernel_size (int) – 卷积核的大小。

forward(x)[source]

通过判别器的前向传递

speechbrain.lobes.models.segan_model.d1_loss(d_outputs, reduction='mean')[source]

计算判别器在输入为干净时的损失

speechbrain.lobes.models.segan_model.d2_loss(d_outputs, reduction='mean')[source]

计算判别器在输入不干净时的损失

speechbrain.lobes.models.segan_model.g3_loss(d_outputs, predictions, targets, length, l1LossCoeff, klLossCoeff, z_mean=None, z_logvar=None, reduction='mean')[source]

计算给定判别器输出的生成器损失