paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan 模块

class paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan.PWGDiscriminator(in_channels: int = 1, out_channels: int = 1, kernel_size: int = 3, layers: int = 10, conv_channels: int = 64, dilation_factor: int = 1, nonlinear_activation: str = 'leakyrelu', nonlinear_activation_params: Dict[str, Any] = {'negative_slope': 0.2}, bias: bool = True, use_weight_norm: bool = True, init_type: str = 'xavier_uniform')[来源]

基础: Layer

用于音频的卷积判别器。

Args:
in_channels (int, optional):

输入音频的通道数量,默认为1

out_channels (int, optional):

输出特征大小,默认值为 1

kernel_size (int, optional):

卷积子层的内核大小,默认为3

layers (int, optional):

层数,默认为 10

conv_channels (int, optional):

卷积子层的特征大小,默认值为64

dilation_factor (int, optional):

如果扩张因子大于1,则每个卷积子层的扩张以指数方式增长;否则,每个卷积子层的扩张以线性方式增长,默认为1

nonlinear_activation (str, optional):

每个卷积子层后的激活,默认为“leakyrelu”

nonlinear_activation_params (Dict[str, Any], optional):

默认情况下,传递给激活函数初始化器的参数为 {"negative_slope": 0.2}

bias (bool, optional):

是否在卷积子层中使用偏置,默认为真

use_weight_norm (bool, optional):

是否在所有卷积子层使用权重归一化,默认值为True

方法

__call__(*inputs, **kwargs)

将self作为一个函数调用。

add_parameter(name, parameter)

添加一个参数实例。

add_sublayer(name, sublayer)

添加一个子层实例。

apply(fn)

递归地将 fn 应用到每个子层(由 .sublayers() 返回)以及自身。

buffers([include_sublayers])

返回当前层及其子层中的所有缓冲区的列表。

children()

返回一个迭代器,遍历直接子层。

clear_gradients()

清除此层所有参数的梯度。

create_parameter(shape[, attr, dtype, ...])

为该层创建参数。

create_tensor([name, persistable, dtype])

为该层创建张量。

create_variable([name, persistable, dtype])

为该层创建张量。

eval()

将该层及其所有子层设置为评估模式。

extra_repr()

该层的额外表示,您可以自定义实现自己的层。

forward(x)

参数:

full_name()

此层的完整名称,由 name_scope + "/" + MyLayer.__class__.__name__ 组成

load_dict(state_dict[, use_structured_name])

从 state_dict 设置参数和可持久化缓存。

named_buffers([prefix, include_sublayers])

返回一个迭代器,遍历层中的所有缓冲区,生成名称和张量的元组。

named_children()

返回一个直接子层的迭代器,同时提供层的名称和层本身。

named_parameters([prefix, include_sublayers])

返回一个迭代器,遍历层中的所有参数,生成名称和参数的元组。

named_sublayers([prefix, include_self, ...])

返回Layer中所有子层的迭代器,生成名称和子层的元组。

parameters([include_sublayers])

返回当前层及其子层的所有参数的列表。

register_buffer(name, tensor[, persistable])

将一个张量注册为该层的缓冲区。

register_forward_post_hook(hook)

为层注册一个前向后钩子。

register_forward_pre_hook(hook)

为层注册一个前向预钩子。

set_dict(state_dict[, use_structured_name])

从 state_dict 设置参数和可持久化的缓冲区。

set_state_dict(state_dict[, use_structured_name])

从state_dict设置参数和持久化缓冲区。

state_dict([destination, include_sublayers, ...])

获取当前层及其子层的所有参数和可持久化缓冲区。

sublayers([include_self])

返回子层的列表。

to([device, dtype, blocking])

通过给定的设备、数据类型和阻塞方式转换层的参数和缓冲区。

to_static_state_dict([destination, ...])

获取当前层及其子层的所有参数和缓冲区。

train()

将此层及其所有子层设置为训练模式。

应用权重规范

向后

注册状态字典钩子

remove_weight_norm

apply_weight_norm()[来源]
forward(x)[来源]
Args:
x (Tensor):

形状 (N, in_channels, num_samples),输入的音频。

Returns:

张量:形状 (N, out_channels, num_samples),预测的逻辑值。

remove_weight_norm()[来源]
class paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan.PWGGenerator(in_channels: int = 1, out_channels: int = 1, kernel_size: int = 3, layers: int = 30, stacks: int = 3, residual_channels: int = 64, gate_channels: int = 128, skip_channels: int = 64, aux_channels: int = 80, aux_context_window: int = 2, dropout: float = 0.0, bias: bool = True, use_weight_norm: bool = True, use_causal_conv: bool = False, upsample_scales: List[int] = [4, 4, 4, 4], nonlinear_activation: Optional[str] = None, nonlinear_activation_params: Dict[str, Any] = {}, interpolate_mode: str = 'nearest', freq_axis_kernel_size: int = 1, init_type: str = 'xavier_uniform')[来源]

基础: Layer

用于并行WaveGAN的波形生成器

Args:
in_channels (int, optional):

输入波形的通道数,默认为 1

out_channels (int, optional):

输出波形的通道数,默认为1

kernel_size (int, optional):

残差块内部的内核大小,默认为3

layers (int, optional):

默认情况下,内部剩余块的数量为30

stacks (int, optional):

将残差块分割成的组数,默认值为 3。在每个组内,残差块的膨胀率呈指数级增长。

residual_channels (int, optional):

残差块的残差通道,默认值为 64

gate_channels (int, optional):

残差块的门通道,默认为128

skip_channels (int, optional):

跳过残差块的通道,默认为 64

aux_channels (int, optional):

残差块的辅助通道,默认为80

aux_context_window (int, optional):

应用于辅助输入的第一个卷积的上下文窗口大小,默认为2

dropout (float, optional):

残差块的 dropout,默认值为 0。

bias (bool, optional):

是否在残差块中使用偏置,默认为真

use_weight_norm (bool, optional):

是否在所有卷积中使用权重规范,默认为True

use_causal_conv (bool, optional):

是否在上采样网络和残差块中使用因果填充,默认值为 False

upsample_scales (List[int], optional):

上采样网络的上采样尺度,默认值为 [4, 4, 4, 4]

nonlinear_activation (Optional[str], optional):

上采样网络中的非线性激活,默认值为 None

nonlinear_activation_params (Dict[str, Any], optional):

传递给上采样网络中的线性激活的参数,默认值为 {}

interpolate_mode (str, optional):

上采样网络的插值模式,默认是“nearest”

freq_axis_kernel_size (int, optional):

上采样网络频率轴上的核大小,默认为1

方法

__call__(*inputs, **kwargs)

将self作为一个函数调用。

add_parameter(name, parameter)

添加一个参数实例。

add_sublayer(name, sublayer)

添加一个子层实例。

apply(fn)

递归地将 fn 应用到每个子层(由 .sublayers() 返回)以及自身。

apply_weight_norm()

递归地对子层中的所有卷积层应用权重规范化。

buffers([include_sublayers])

返回当前层及其子层中的所有缓冲区的列表。

children()

返回一个迭代器,遍历直接子层。

clear_gradients()

清除此层所有参数的梯度。

create_parameter(shape[, attr, dtype, ...])

为该层创建参数。

create_tensor([name, persistable, dtype])

为该层创建张量。

create_variable([name, persistable, dtype])

为该层创建张量。

eval()

将该层及其所有子层设置为评估模式。

extra_repr()

该层的额外表示,您可以自定义实现自己的层。

forward(x, c)

生成波形。

full_name()

此层的完整名称,由 name_scope + "/" + MyLayer.__class__.__name__ 组成

inference([c])

波形生成。

load_dict(state_dict[, use_structured_name])

从 state_dict 设置参数和可持久化缓存。

named_buffers([prefix, include_sublayers])

返回一个迭代器,遍历层中的所有缓冲区,生成名称和张量的元组。

named_children()

返回一个直接子层的迭代器,同时提供层的名称和层本身。

named_parameters([prefix, include_sublayers])

返回一个迭代器,遍历层中的所有参数,生成名称和参数的元组。

named_sublayers([prefix, include_self, ...])

返回Layer中所有子层的迭代器,生成名称和子层的元组。

parameters([include_sublayers])

返回当前层及其子层的所有参数的列表。

register_buffer(name, tensor[, persistable])

将一个张量注册为该层的缓冲区。

register_forward_post_hook(hook)

为层注册一个前向后钩子。

register_forward_pre_hook(hook)

为层注册一个前向预钩子。

remove_weight_norm()

递归地从所有的卷积层中的子层中移除权重归一化。

set_dict(state_dict[, use_structured_name])

从 state_dict 设置参数和可持久化的缓冲区。

set_state_dict(state_dict[, use_structured_name])

从state_dict设置参数和持久化缓冲区。

state_dict([destination, include_sublayers, ...])

获取当前层及其子层的所有参数和可持久化缓冲区。

sublayers([include_self])

返回子层的列表。

to([device, dtype, blocking])

通过给定的设备、数据类型和阻塞方式转换层的参数和缓冲区。

to_static_state_dict([destination, ...])

获取当前层及其子层的所有参数和缓冲区。

train()

将此层及其所有子层设置为训练模式。

向后

注册状态字典钩子

apply_weight_norm()[来源]

递归地将权重归一化应用于所有卷积层中的子层。

forward(x, c)[来源]

生成波形。

Args:
x(Tensor):

形状 (N, C_in, T),输入波形。

c(Tensor):

形状 (N, C_aux, T')。辅助输入(例如,声谱图)。它被上采样以匹配输入的时间分辨率。

Returns:

张量:形状 (N, C_out, T),生成的波形。

inference(c=None)[来源]

波形生成。该函数用于单实例推断。

Args:
c(Tensor, optional, optional):

形状 (T', C_aux),辅助输入,默认为 None

x(Tensor, optional):

形状 (T, C_in),噪声波形,默认为 None

Returns:

张量:形状 (T, C_out),生成的波形

remove_weight_norm()[来源]

递归地从子层中的所有卷积层中移除权重归一化。

class paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan.PWGInference(normalizer, pwg_generator)[来源]

基础: Layer

方法

__call__(*inputs, **kwargs)

将self作为一个函数调用。

add_parameter(name, parameter)

添加一个参数实例。

add_sublayer(name, sublayer)

添加一个子层实例。

apply(fn)

递归地将 fn 应用到每个子层(由 .sublayers() 返回)以及自身。

buffers([include_sublayers])

返回当前层及其子层中的所有缓冲区的列表。

children()

返回一个迭代器,遍历直接子层。

clear_gradients()

清除此层所有参数的梯度。

create_parameter(shape[, attr, dtype, ...])

为该层创建参数。

create_tensor([name, persistable, dtype])

为该层创建张量。

create_variable([name, persistable, dtype])

为该层创建张量。

eval()

将该层及其所有子层设置为评估模式。

extra_repr()

该层的额外表示,您可以自定义实现自己的层。

forward(logmel)

定义每次调用时执行的计算。

full_name()

此层的完整名称,由 name_scope + "/" + MyLayer.__class__.__name__ 组成

load_dict(state_dict[, use_structured_name])

从 state_dict 设置参数和可持久化缓存。

named_buffers([prefix, include_sublayers])

返回一个迭代器,遍历层中的所有缓冲区,生成名称和张量的元组。

named_children()

返回一个直接子层的迭代器,同时提供层的名称和层本身。

named_parameters([prefix, include_sublayers])

返回一个迭代器,遍历层中的所有参数,生成名称和参数的元组。

named_sublayers([prefix, include_self, ...])

返回Layer中所有子层的迭代器,生成名称和子层的元组。

parameters([include_sublayers])

返回当前层及其子层的所有参数的列表。

register_buffer(name, tensor[, persistable])

将一个张量注册为该层的缓冲区。

register_forward_post_hook(hook)

为层注册一个前向后钩子。

register_forward_pre_hook(hook)

为层注册一个前向预钩子。

set_dict(state_dict[, use_structured_name])

从 state_dict 设置参数和可持久化的缓冲区。

set_state_dict(state_dict[, use_structured_name])

从state_dict设置参数和持久化缓冲区。

state_dict([destination, include_sublayers, ...])

获取当前层及其子层的所有参数和可持久化缓冲区。

sublayers([include_self])

返回子层的列表。

to([device, dtype, blocking])

通过给定的设备、数据类型和阻塞方式转换层的参数和缓冲区。

to_static_state_dict([destination, ...])

获取当前层及其子层的所有参数和缓冲区。

train()

将此层及其所有子层设置为训练模式。

向后

注册状态字典钩子

forward(logmel)[来源]

定义每次调用时执行的计算。应该被所有子类重写。

Parameters:

*inputs(tuple): 解包的元组参数 **kwargs(dict): 解包的字典参数

class paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan.ResidualPWGDiscriminator(in_channels: int = 1, out_channels: int = 1, kernel_size: int = 3, layers: int = 30, stacks: int = 3, residual_channels: int = 64, gate_channels: int = 128, skip_channels: int = 64, dropout: float = 0.0, bias: bool = True, use_weight_norm: bool = True, use_causal_conv: bool = False, nonlinear_activation: str = 'leakyrelu', nonlinear_activation_params: Dict[str, Any] = {'negative_slope': 0.2}, init_type: str = 'xavier_uniform')[来源]

基础: Layer

一种用于音频的wavenet风格的判别器。

Args:
in_channels (int, optional):

输入音频的通道数量,默认为1

out_channels (int, optional):

输出特征大小,默认值为 1

kernel_size (int, optional):

残差块的内核大小,默认为 3

layers (int, optional):

残差块的数量,默认是30

stacks (int, optional):

残差块的组数,其中每个残差块的扩张按指数增长,默认值为 3

residual_channels (int, optional):

残差块的残差通道,默认值为64

gate_channels (int, optional):

残差块的门通道,默认值为128

skip_channels (int, optional):

跳过残差块的通道,默认是64

dropout (float, optional):

残差块的丢弃概率,默认值为0。

bias (bool, optional):

是否在残差块中使用偏置,默认为真

use_weight_norm (bool, optional):

是否在所有卷积层中使用权重归一化,默认值为 True

use_causal_conv (bool, optional):

是否在残差块中使用因果卷积,默认为 False

nonlinear_activation (str, optional):

在残差块中以外的卷积后的激活,默认值为 "leakyrelu"

nonlinear_activation_params (Dict[str, Any], optional):

要传递给激活函数的参数,默认值为 {"negative_slope": 0.2}

方法

__call__(*inputs, **kwargs)

将self作为一个函数调用。

add_parameter(name, parameter)

添加一个参数实例。

add_sublayer(name, sublayer)

添加一个子层实例。

apply(fn)

递归地将 fn 应用到每个子层(由 .sublayers() 返回)以及自身。

buffers([include_sublayers])

返回当前层及其子层中的所有缓冲区的列表。

children()

返回一个迭代器,遍历直接子层。

clear_gradients()

清除此层所有参数的梯度。

create_parameter(shape[, attr, dtype, ...])

为该层创建参数。

create_tensor([name, persistable, dtype])

为该层创建张量。

create_variable([name, persistable, dtype])

为该层创建张量。

eval()

将该层及其所有子层设置为评估模式。

extra_repr()

该层的额外表示,您可以自定义实现自己的层。

forward(x)

参数:

full_name()

此层的完整名称,由 name_scope + "/" + MyLayer.__class__.__name__ 组成

load_dict(state_dict[, use_structured_name])

从 state_dict 设置参数和可持久化缓存。

named_buffers([prefix, include_sublayers])

返回一个迭代器,遍历层中的所有缓冲区,生成名称和张量的元组。

named_children()

返回一个直接子层的迭代器,同时提供层的名称和层本身。

named_parameters([prefix, include_sublayers])

返回一个迭代器,遍历层中的所有参数,生成名称和参数的元组。

named_sublayers([prefix, include_self, ...])

返回Layer中所有子层的迭代器,生成名称和子层的元组。

parameters([include_sublayers])

返回当前层及其子层的所有参数的列表。

register_buffer(name, tensor[, persistable])

将一个张量注册为该层的缓冲区。

register_forward_post_hook(hook)

为层注册一个前向后钩子。

register_forward_pre_hook(hook)

为层注册一个前向预钩子。

set_dict(state_dict[, use_structured_name])

从 state_dict 设置参数和可持久化的缓冲区。

set_state_dict(state_dict[, use_structured_name])

从state_dict设置参数和持久化缓冲区。

state_dict([destination, include_sublayers, ...])

获取当前层及其子层的所有参数和可持久化缓冲区。

sublayers([include_self])

返回子层的列表。

to([device, dtype, blocking])

通过给定的设备、数据类型和阻塞方式转换层的参数和缓冲区。

to_static_state_dict([destination, ...])

获取当前层及其子层的所有参数和缓冲区。

train()

将此层及其所有子层设置为训练模式。

应用权重规范

向后

注册状态字典钩子

remove_weight_norm

apply_weight_norm()[来源]
forward(x)[来源]
Args:
x(Tensor):

形状 (N, in_channels, num_samples),输入音频。

Returns:

张量:形状 (N, out_channels, num_samples),预测的逻辑值。

remove_weight_norm()[来源]