paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan 模块

class paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan.PWGDiscriminator(in_channels: int = 1, out_channels: int = 1, kernel_size: int = 3, layers: int = 10, conv_channels: int = 64, dilation_factor: int = 1, nonlinear_activation: str = 'leakyrelu', nonlinear_activation_params: Dict[str, Any] = {'negative_slope': 0.2}, bias: bool = True, use_weight_norm: bool = True, init_type: str = 'xavier_uniform')[来源]

基础： Layer

用于音频的卷积判别器。

Args:

in_channels (int, optional):: 输入音频的通道数量，默认为1
out_channels (int, optional):: 输出特征大小，默认值为 1
kernel_size (int, optional):: 卷积子层的内核大小，默认为3
layers (int, optional):: 层数，默认为 10
conv_channels (int, optional):: 卷积子层的特征大小，默认值为64
dilation_factor (int, optional):: 如果扩张因子大于1，则每个卷积子层的扩张以指数方式增长；否则，每个卷积子层的扩张以线性方式增长，默认为1
nonlinear_activation (str, optional):: 每个卷积子层后的激活，默认为“leakyrelu”
nonlinear_activation_params (Dict[str, Any], optional):: 默认情况下，传递给激活函数初始化器的参数为 {"negative_slope": 0.2}
bias (bool, optional):: 是否在卷积子层中使用偏置，默认为真
use_weight_norm (bool, optional):: 是否在所有卷积子层使用权重归一化，默认值为True

方法

`__call__`(inputs, *kwargs)	将self作为一个函数调用。
`add_parameter`(name, parameter)	添加一个参数实例。
`add_sublayer`(name, sublayer)	添加一个子层实例。
`apply`(fn)	递归地将 `fn` 应用到每个子层（由 `.sublayers()` 返回）以及自身。
`buffers`([include_sublayers])	返回当前层及其子层中的所有缓冲区的列表。
`children`()	返回一个迭代器，遍历直接子层。
`clear_gradients`()	清除此层所有参数的梯度。
`create_parameter`(shape[, attr, dtype, ...])	为该层创建参数。
`create_tensor`([name, persistable, dtype])	为该层创建张量。
`create_variable`([name, persistable, dtype])	为该层创建张量。
`eval`()	将该层及其所有子层设置为评估模式。
`extra_repr`()	该层的额外表示，您可以自定义实现自己的层。
`forward`(x)	参数：
`full_name`()	此层的完整名称，由 name_scope + "/" + MyLayer.__class__.__name__ 组成
`load_dict`(state_dict[, use_structured_name])	从 state_dict 设置参数和可持久化缓存。
`named_buffers`([prefix, include_sublayers])	返回一个迭代器，遍历层中的所有缓冲区，生成名称和张量的元组。
`named_children`()	返回一个直接子层的迭代器，同时提供层的名称和层本身。
`named_parameters`([prefix, include_sublayers])	返回一个迭代器，遍历层中的所有参数，生成名称和参数的元组。
`named_sublayers`([prefix, include_self, ...])	返回Layer中所有子层的迭代器，生成名称和子层的元组。
`parameters`([include_sublayers])	返回当前层及其子层的所有参数的列表。
`register_buffer`(name, tensor[, persistable])	将一个张量注册为该层的缓冲区。
`register_forward_post_hook`(hook)	为层注册一个前向后钩子。
`register_forward_pre_hook`(hook)	为层注册一个前向预钩子。
`set_dict`(state_dict[, use_structured_name])	从 state_dict 设置参数和可持久化的缓冲区。
`set_state_dict`(state_dict[, use_structured_name])	从state_dict设置参数和持久化缓冲区。
`state_dict`([destination, include_sublayers, ...])	获取当前层及其子层的所有参数和可持久化缓冲区。
`sublayers`([include_self])	返回子层的列表。
`to`([device, dtype, blocking])	通过给定的设备、数据类型和阻塞方式转换层的参数和缓冲区。
`to_static_state_dict`([destination, ...])	获取当前层及其子层的所有参数和缓冲区。
`train`()	将此层及其所有子层设置为训练模式。

应用权重规范
向后
注册状态字典钩子
remove_weight_norm

apply_weight_norm()[来源]

forward(x)[来源]

Args:

x (Tensor):: 形状 (N, in_channels, num_samples)，输入的音频。

Returns:

张量：形状 (N, out_channels, num_samples)，预测的逻辑值。

remove_weight_norm()[来源]

class paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan.PWGGenerator(in_channels: int = 1, out_channels: int = 1, kernel_size: int = 3, layers: int = 30, stacks: int = 3, residual_channels: int = 64, gate_channels: int = 128, skip_channels: int = 64, aux_channels: int = 80, aux_context_window: int = 2, dropout: float = 0.0, bias: bool = True, use_weight_norm: bool = True, use_causal_conv: bool = False, upsample_scales: List[int] = [4, 4, 4, 4], nonlinear_activation: Optional[str] = None, nonlinear_activation_params: Dict[str, Any] = {}, interpolate_mode: str = 'nearest', freq_axis_kernel_size: int = 1, init_type: str = 'xavier_uniform')[来源]

基础： Layer

用于并行WaveGAN的波形生成器

Args:

in_channels (int, optional):: 输入波形的通道数，默认为 1
out_channels (int, optional):: 输出波形的通道数，默认为1
kernel_size (int, optional):: 残差块内部的内核大小，默认为3
layers (int, optional):: 默认情况下，内部剩余块的数量为30
stacks (int, optional):: 将残差块分割成的组数，默认值为 3。在每个组内，残差块的膨胀率呈指数级增长。
residual_channels (int, optional):: 残差块的残差通道，默认值为 64
gate_channels (int, optional):: 残差块的门通道，默认为128
skip_channels (int, optional):: 跳过残差块的通道，默认为 64
aux_channels (int, optional):: 残差块的辅助通道，默认为80
aux_context_window (int, optional):: 应用于辅助输入的第一个卷积的上下文窗口大小，默认为2
dropout (float, optional):: 残差块的 dropout，默认值为 0。
bias (bool, optional):: 是否在残差块中使用偏置，默认为真
use_weight_norm (bool, optional):: 是否在所有卷积中使用权重规范，默认为True
use_causal_conv (bool, optional):: 是否在上采样网络和残差块中使用因果填充，默认值为 False
upsample_scales (List[int], optional):: 上采样网络的上采样尺度，默认值为 [4, 4, 4, 4]
nonlinear_activation (Optional[str], optional):: 上采样网络中的非线性激活，默认值为 None
nonlinear_activation_params (Dict[str, Any], optional):: 传递给上采样网络中的线性激活的参数，默认值为 {}
interpolate_mode (str, optional):: 上采样网络的插值模式，默认是“nearest”
freq_axis_kernel_size (int, optional):: 上采样网络频率轴上的核大小，默认为1

方法

`__call__`(inputs, *kwargs)	将self作为一个函数调用。
`add_parameter`(name, parameter)	添加一个参数实例。
`add_sublayer`(name, sublayer)	添加一个子层实例。
`apply`(fn)	递归地将 `fn` 应用到每个子层（由 `.sublayers()` 返回）以及自身。
`apply_weight_norm`()	递归地对子层中的所有卷积层应用权重规范化。
`buffers`([include_sublayers])	返回当前层及其子层中的所有缓冲区的列表。
`children`()	返回一个迭代器，遍历直接子层。
`clear_gradients`()	清除此层所有参数的梯度。
`create_parameter`(shape[, attr, dtype, ...])	为该层创建参数。
`create_tensor`([name, persistable, dtype])	为该层创建张量。
`create_variable`([name, persistable, dtype])	为该层创建张量。
`eval`()	将该层及其所有子层设置为评估模式。
`extra_repr`()	该层的额外表示，您可以自定义实现自己的层。
`forward`(x, c)	生成波形。
`full_name`()	此层的完整名称，由 name_scope + "/" + MyLayer.__class__.__name__ 组成
`inference`([c])	波形生成。
`load_dict`(state_dict[, use_structured_name])	从 state_dict 设置参数和可持久化缓存。
`named_buffers`([prefix, include_sublayers])	返回一个迭代器，遍历层中的所有缓冲区，生成名称和张量的元组。
`named_children`()	返回一个直接子层的迭代器，同时提供层的名称和层本身。
`named_parameters`([prefix, include_sublayers])	返回一个迭代器，遍历层中的所有参数，生成名称和参数的元组。
`named_sublayers`([prefix, include_self, ...])	返回Layer中所有子层的迭代器，生成名称和子层的元组。
`parameters`([include_sublayers])	返回当前层及其子层的所有参数的列表。
`register_buffer`(name, tensor[, persistable])	将一个张量注册为该层的缓冲区。
`register_forward_post_hook`(hook)	为层注册一个前向后钩子。
`register_forward_pre_hook`(hook)	为层注册一个前向预钩子。
`remove_weight_norm`()	递归地从所有的卷积层中的子层中移除权重归一化。
`set_dict`(state_dict[, use_structured_name])	从 state_dict 设置参数和可持久化的缓冲区。
`set_state_dict`(state_dict[, use_structured_name])	从state_dict设置参数和持久化缓冲区。
`state_dict`([destination, include_sublayers, ...])	获取当前层及其子层的所有参数和可持久化缓冲区。
`sublayers`([include_self])	返回子层的列表。
`to`([device, dtype, blocking])	通过给定的设备、数据类型和阻塞方式转换层的参数和缓冲区。
`to_static_state_dict`([destination, ...])	获取当前层及其子层的所有参数和缓冲区。
`train`()	将此层及其所有子层设置为训练模式。

向后
注册状态字典钩子

apply_weight_norm()[来源]: 递归地将权重归一化应用于所有卷积层中的子层。

forward(x, c)[来源]

生成波形。

Args:

x(Tensor):: 形状 (N, C_in, T)，输入波形。
c(Tensor):: 形状 (N, C_aux, T')。辅助输入（例如，声谱图）。它被上采样以匹配输入的时间分辨率。

Returns:

张量：形状 (N, C_out, T)，生成的波形。

inference(c=None)[来源]

波形生成。该函数用于单实例推断。

Args:

c(Tensor, optional, optional):: 形状 (T', C_aux)，辅助输入，默认为 None
x(Tensor, optional):: 形状 (T, C_in)，噪声波形，默认为 None

Returns:

张量：形状 (T, C_out)，生成的波形

remove_weight_norm()[来源]: 递归地从子层中的所有卷积层中移除权重归一化。

class paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan.PWGInference(normalizer, pwg_generator)[来源]

基础： Layer

方法

`__call__`(inputs, *kwargs)	将self作为一个函数调用。
`add_parameter`(name, parameter)	添加一个参数实例。
`add_sublayer`(name, sublayer)	添加一个子层实例。
`apply`(fn)	递归地将 `fn` 应用到每个子层（由 `.sublayers()` 返回）以及自身。
`buffers`([include_sublayers])	返回当前层及其子层中的所有缓冲区的列表。
`children`()	返回一个迭代器，遍历直接子层。
`clear_gradients`()	清除此层所有参数的梯度。
`create_parameter`(shape[, attr, dtype, ...])	为该层创建参数。
`create_tensor`([name, persistable, dtype])	为该层创建张量。
`create_variable`([name, persistable, dtype])	为该层创建张量。
`eval`()	将该层及其所有子层设置为评估模式。
`extra_repr`()	该层的额外表示，您可以自定义实现自己的层。
`forward`(logmel)	定义每次调用时执行的计算。
`full_name`()	此层的完整名称，由 name_scope + "/" + MyLayer.__class__.__name__ 组成
`load_dict`(state_dict[, use_structured_name])	从 state_dict 设置参数和可持久化缓存。
`named_buffers`([prefix, include_sublayers])	返回一个迭代器，遍历层中的所有缓冲区，生成名称和张量的元组。
`named_children`()	返回一个直接子层的迭代器，同时提供层的名称和层本身。
`named_parameters`([prefix, include_sublayers])	返回一个迭代器，遍历层中的所有参数，生成名称和参数的元组。
`named_sublayers`([prefix, include_self, ...])	返回Layer中所有子层的迭代器，生成名称和子层的元组。
`parameters`([include_sublayers])	返回当前层及其子层的所有参数的列表。
`register_buffer`(name, tensor[, persistable])	将一个张量注册为该层的缓冲区。
`register_forward_post_hook`(hook)	为层注册一个前向后钩子。
`register_forward_pre_hook`(hook)	为层注册一个前向预钩子。
`set_dict`(state_dict[, use_structured_name])	从 state_dict 设置参数和可持久化的缓冲区。
`set_state_dict`(state_dict[, use_structured_name])	从state_dict设置参数和持久化缓冲区。
`state_dict`([destination, include_sublayers, ...])	获取当前层及其子层的所有参数和可持久化缓冲区。
`sublayers`([include_self])	返回子层的列表。
`to`([device, dtype, blocking])	通过给定的设备、数据类型和阻塞方式转换层的参数和缓冲区。
`to_static_state_dict`([destination, ...])	获取当前层及其子层的所有参数和缓冲区。
`train`()	将此层及其所有子层设置为训练模式。

向后
注册状态字典钩子

forward(logmel)[来源]

定义每次调用时执行的计算。应该被所有子类重写。

Parameters:: *inputs(tuple): 解包的元组参数 **kwargs(dict): 解包的字典参数

class paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan.ResidualPWGDiscriminator(in_channels: int = 1, out_channels: int = 1, kernel_size: int = 3, layers: int = 30, stacks: int = 3, residual_channels: int = 64, gate_channels: int = 128, skip_channels: int = 64, dropout: float = 0.0, bias: bool = True, use_weight_norm: bool = True, use_causal_conv: bool = False, nonlinear_activation: str = 'leakyrelu', nonlinear_activation_params: Dict[str, Any] = {'negative_slope': 0.2}, init_type: str = 'xavier_uniform')[来源]

基础： Layer

一种用于音频的wavenet风格的判别器。

Args:

in_channels (int, optional):: 输入音频的通道数量，默认为1
out_channels (int, optional):: 输出特征大小，默认值为 1
kernel_size (int, optional):: 残差块的内核大小，默认为 3
layers (int, optional):: 残差块的数量，默认是30
stacks (int, optional):: 残差块的组数，其中每个残差块的扩张按指数增长，默认值为 3
residual_channels (int, optional):: 残差块的残差通道，默认值为64
gate_channels (int, optional):: 残差块的门通道，默认值为128
skip_channels (int, optional):: 跳过残差块的通道，默认是64
dropout (float, optional):: 残差块的丢弃概率，默认值为0。
bias (bool, optional):: 是否在残差块中使用偏置，默认为真
use_weight_norm (bool, optional):: 是否在所有卷积层中使用权重归一化，默认值为 True
use_causal_conv (bool, optional):: 是否在残差块中使用因果卷积，默认为 False
nonlinear_activation (str, optional):: 在残差块中以外的卷积后的激活，默认值为 "leakyrelu"
nonlinear_activation_params (Dict[str, Any], optional):: 要传递给激活函数的参数，默认值为 {"negative_slope": 0.2}

方法

`__call__`(inputs, *kwargs)	将self作为一个函数调用。
`add_parameter`(name, parameter)	添加一个参数实例。
`add_sublayer`(name, sublayer)	添加一个子层实例。
`apply`(fn)	递归地将 `fn` 应用到每个子层（由 `.sublayers()` 返回）以及自身。
`buffers`([include_sublayers])	返回当前层及其子层中的所有缓冲区的列表。
`children`()	返回一个迭代器，遍历直接子层。
`clear_gradients`()	清除此层所有参数的梯度。
`create_parameter`(shape[, attr, dtype, ...])	为该层创建参数。
`create_tensor`([name, persistable, dtype])	为该层创建张量。
`create_variable`([name, persistable, dtype])	为该层创建张量。
`eval`()	将该层及其所有子层设置为评估模式。
`extra_repr`()	该层的额外表示，您可以自定义实现自己的层。
`forward`(x)	参数：
`full_name`()	此层的完整名称，由 name_scope + "/" + MyLayer.__class__.__name__ 组成
`load_dict`(state_dict[, use_structured_name])	从 state_dict 设置参数和可持久化缓存。
`named_buffers`([prefix, include_sublayers])	返回一个迭代器，遍历层中的所有缓冲区，生成名称和张量的元组。
`named_children`()	返回一个直接子层的迭代器，同时提供层的名称和层本身。
`named_parameters`([prefix, include_sublayers])	返回一个迭代器，遍历层中的所有参数，生成名称和参数的元组。
`named_sublayers`([prefix, include_self, ...])	返回Layer中所有子层的迭代器，生成名称和子层的元组。
`parameters`([include_sublayers])	返回当前层及其子层的所有参数的列表。
`register_buffer`(name, tensor[, persistable])	将一个张量注册为该层的缓冲区。
`register_forward_post_hook`(hook)	为层注册一个前向后钩子。
`register_forward_pre_hook`(hook)	为层注册一个前向预钩子。
`set_dict`(state_dict[, use_structured_name])	从 state_dict 设置参数和可持久化的缓冲区。
`set_state_dict`(state_dict[, use_structured_name])	从state_dict设置参数和持久化缓冲区。
`state_dict`([destination, include_sublayers, ...])	获取当前层及其子层的所有参数和可持久化缓冲区。
`sublayers`([include_self])	返回子层的列表。
`to`([device, dtype, blocking])	通过给定的设备、数据类型和阻塞方式转换层的参数和缓冲区。
`to_static_state_dict`([destination, ...])	获取当前层及其子层的所有参数和缓冲区。
`train`()	将此层及其所有子层设置为训练模式。

应用权重规范
向后
注册状态字典钩子
remove_weight_norm

apply_weight_norm()[来源]

forward(x)[来源]

Args:

x(Tensor):: 形状 (N, in_channels, num_samples)，输入音频。

Returns:

张量：形状 (N, out_channels, num_samples)，预测的逻辑值。

remove_weight_norm()[来源]