speechbrain.lobes.models.MetricGAN 模块

MetricGAN中使用的生成器和判别器

作者: * Szu-Wei Fu 2020

摘要

类：

`EnhancementGenerator`	用于增强的简单LSTM，带有自定义初始化。
`Learnable_sigmoid`	实现一个可学习的sigmoid函数。
`MetricDiscriminator`	用于增强训练的度量估计器。

函数：

`shifted_sigmoid`	计算偏移的sigmoid函数。
`xavier_init_layer`	创建一个具有谱归一化、xavier均匀初始化和零偏置的层

参考

speechbrain.lobes.models.MetricGAN.xavier_init_layer(in_size, out_size=None, spec_norm=True, layer_type=<class 'torch.nn.modules.linear.Linear'>, **kwargs)[source]: 创建一个具有谱归一化、xavier均匀初始化和零偏置的层

speechbrain.lobes.models.MetricGAN.shifted_sigmoid(x)[source]: 计算偏移的sigmoid函数。

class speechbrain.lobes.models.MetricGAN.Learnable_sigmoid(in_features=257)[source]

基础：Module

实现一个可学习的sigmoid函数。

Parameters:: in_features (int) – 输入维度

forward(x)[source]: 处理输入张量 x 并返回输出张量。

class speechbrain.lobes.models.MetricGAN.EnhancementGenerator(input_size=257, hidden_size=200, num_layers=2, dropout=0)[source]

基础：Module

用于增强的简单LSTM，带有自定义初始化。

Parameters:

input_size (int) – 输入张量最后一个维度的大小。
hidden_size (int) – LSTM层中使用的神经元数量。
num_layers (int) – LSTM中使用的层数。
dropout (int) – 训练期间要丢弃的神经元的比例。

blstm: 对循环层使用正交初始化，对输入层使用xavier均匀初始化偏置为0

forward(x, lengths)[source]: 处理输入张量 x 并返回输出张量。

class speechbrain.lobes.models.MetricGAN.MetricDiscriminator(kernel_size=(5, 5), base_channels=15, activation=<class 'torch.nn.modules.activation.LeakyReLU'>)[source]

基础：Module

增强训练的度量估计器。

Consists of:

四个二维卷积层
通道平均
三个线性层

Parameters:

kernel_size (tuple) – 用于卷积的二维核的尺寸。
base_channels (int) – 每个卷积层中使用的通道数。
activation (Callable) – 在层之间应用的函数。

forward(x)[source]: 处理输入张量 x 并返回输出张量。