speechbrain.lobes.models.MetricGAN 模块

MetricGAN中使用的生成器和判别器

作者: * Szu-Wei Fu 2020

摘要

类:

EnhancementGenerator

用于增强的简单LSTM,带有自定义初始化。

Learnable_sigmoid

实现一个可学习的sigmoid函数。

MetricDiscriminator

用于增强训练的度量估计器。

函数:

shifted_sigmoid

计算偏移的sigmoid函数。

xavier_init_layer

创建一个具有谱归一化、xavier均匀初始化和零偏置的层

参考

speechbrain.lobes.models.MetricGAN.xavier_init_layer(in_size, out_size=None, spec_norm=True, layer_type=<class 'torch.nn.modules.linear.Linear'>, **kwargs)[source]

创建一个具有谱归一化、xavier均匀初始化和零偏置的层

speechbrain.lobes.models.MetricGAN.shifted_sigmoid(x)[source]

计算偏移的sigmoid函数。

class speechbrain.lobes.models.MetricGAN.Learnable_sigmoid(in_features=257)[source]

基础:Module

实现一个可学习的sigmoid函数。

Parameters:

in_features (int) – 输入维度

forward(x)[source]

处理输入张量 x 并返回输出张量。

class speechbrain.lobes.models.MetricGAN.EnhancementGenerator(input_size=257, hidden_size=200, num_layers=2, dropout=0)[source]

基础:Module

用于增强的简单LSTM,带有自定义初始化。

Parameters:
  • input_size (int) – 输入张量最后一个维度的大小。

  • hidden_size (int) – LSTM层中使用的神经元数量。

  • num_layers (int) – LSTM中使用的层数。

  • dropout (int) – 训练期间要丢弃的神经元的比例。

blstm

对循环层使用正交初始化,对输入层使用xavier均匀初始化 偏置为0

forward(x, lengths)[source]

处理输入张量 x 并返回输出张量。

class speechbrain.lobes.models.MetricGAN.MetricDiscriminator(kernel_size=(5, 5), base_channels=15, activation=<class 'torch.nn.modules.activation.LeakyReLU'>)[source]

基础:Module

增强训练的度量估计器。

Consists of:
  • 四个二维卷积层

  • 通道平均

  • 三个线性层

Parameters:
  • kernel_size (tuple) – 用于卷积的二维核的尺寸。

  • base_channels (int) – 每个卷积层中使用的通道数。

  • activation (Callable) – 在层之间应用的函数。

forward(x)[source]

处理输入张量 x 并返回输出张量。