paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan 模块
- class paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan.PWGDiscriminator(in_channels: int = 1, out_channels: int = 1, kernel_size: int = 3, layers: int = 10, conv_channels: int = 64, dilation_factor: int = 1, nonlinear_activation: str = 'leakyrelu', nonlinear_activation_params: Dict[str, Any] = {'negative_slope': 0.2}, bias: bool = True, use_weight_norm: bool = True, init_type: str = 'xavier_uniform')[来源]
基础:
Layer用于音频的卷积判别器。
- Args:
- in_channels (int, optional):
输入音频的通道数量,默认为1
- out_channels (int, optional):
输出特征大小,默认值为 1
- kernel_size (int, optional):
卷积子层的内核大小,默认为3
- layers (int, optional):
层数,默认为 10
- conv_channels (int, optional):
卷积子层的特征大小,默认值为64
- dilation_factor (int, optional):
如果扩张因子大于1,则每个卷积子层的扩张以指数方式增长;否则,每个卷积子层的扩张以线性方式增长,默认为1
- nonlinear_activation (str, optional):
每个卷积子层后的激活,默认为“leakyrelu”
- nonlinear_activation_params (Dict[str, Any], optional):
默认情况下,传递给激活函数初始化器的参数为 {"negative_slope": 0.2}
- bias (bool, optional):
是否在卷积子层中使用偏置,默认为真
- use_weight_norm (bool, optional):
是否在所有卷积子层使用权重归一化,默认值为True
方法
__call__(*inputs, **kwargs)将self作为一个函数调用。
add_parameter(name, parameter)添加一个参数实例。
add_sublayer(name, sublayer)添加一个子层实例。
apply(fn)递归地将
fn应用到每个子层(由.sublayers()返回)以及自身。buffers([include_sublayers])返回当前层及其子层中的所有缓冲区的列表。
children()返回一个迭代器,遍历直接子层。
clear_gradients()清除此层所有参数的梯度。
create_parameter(shape[, attr, dtype, ...])为该层创建参数。
create_tensor([name, persistable, dtype])为该层创建张量。
create_variable([name, persistable, dtype])为该层创建张量。
eval()将该层及其所有子层设置为评估模式。
extra_repr()该层的额外表示,您可以自定义实现自己的层。
forward(x)参数:
full_name()此层的完整名称,由 name_scope + "/" + MyLayer.__class__.__name__ 组成
load_dict(state_dict[, use_structured_name])从 state_dict 设置参数和可持久化缓存。
named_buffers([prefix, include_sublayers])返回一个迭代器,遍历层中的所有缓冲区,生成名称和张量的元组。
named_children()返回一个直接子层的迭代器,同时提供层的名称和层本身。
named_parameters([prefix, include_sublayers])返回一个迭代器,遍历层中的所有参数,生成名称和参数的元组。
named_sublayers([prefix, include_self, ...])返回Layer中所有子层的迭代器,生成名称和子层的元组。
parameters([include_sublayers])返回当前层及其子层的所有参数的列表。
register_buffer(name, tensor[, persistable])将一个张量注册为该层的缓冲区。
register_forward_post_hook(hook)为层注册一个前向后钩子。
register_forward_pre_hook(hook)为层注册一个前向预钩子。
set_dict(state_dict[, use_structured_name])从 state_dict 设置参数和可持久化的缓冲区。
set_state_dict(state_dict[, use_structured_name])从state_dict设置参数和持久化缓冲区。
state_dict([destination, include_sublayers, ...])获取当前层及其子层的所有参数和可持久化缓冲区。
sublayers([include_self])返回子层的列表。
to([device, dtype, blocking])通过给定的设备、数据类型和阻塞方式转换层的参数和缓冲区。
to_static_state_dict([destination, ...])获取当前层及其子层的所有参数和缓冲区。
train()将此层及其所有子层设置为训练模式。
应用权重规范
向后
注册状态字典钩子
remove_weight_norm
- class paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan.PWGGenerator(in_channels: int = 1, out_channels: int = 1, kernel_size: int = 3, layers: int = 30, stacks: int = 3, residual_channels: int = 64, gate_channels: int = 128, skip_channels: int = 64, aux_channels: int = 80, aux_context_window: int = 2, dropout: float = 0.0, bias: bool = True, use_weight_norm: bool = True, use_causal_conv: bool = False, upsample_scales: List[int] = [4, 4, 4, 4], nonlinear_activation: Optional[str] = None, nonlinear_activation_params: Dict[str, Any] = {}, interpolate_mode: str = 'nearest', freq_axis_kernel_size: int = 1, init_type: str = 'xavier_uniform')[来源]
基础:
Layer用于并行WaveGAN的波形生成器
- Args:
- in_channels (int, optional):
输入波形的通道数,默认为 1
- out_channels (int, optional):
输出波形的通道数,默认为1
- kernel_size (int, optional):
残差块内部的内核大小,默认为3
- layers (int, optional):
默认情况下,内部剩余块的数量为30
- stacks (int, optional):
将残差块分割成的组数,默认值为 3。在每个组内,残差块的膨胀率呈指数级增长。
- residual_channels (int, optional):
残差块的残差通道,默认值为 64
- gate_channels (int, optional):
残差块的门通道,默认为128
- skip_channels (int, optional):
跳过残差块的通道,默认为 64
- aux_channels (int, optional):
残差块的辅助通道,默认为80
- aux_context_window (int, optional):
应用于辅助输入的第一个卷积的上下文窗口大小,默认为2
- dropout (float, optional):
残差块的 dropout,默认值为 0。
- bias (bool, optional):
是否在残差块中使用偏置,默认为真
- use_weight_norm (bool, optional):
是否在所有卷积中使用权重规范,默认为True
- use_causal_conv (bool, optional):
是否在上采样网络和残差块中使用因果填充,默认值为 False
- upsample_scales (List[int], optional):
上采样网络的上采样尺度,默认值为 [4, 4, 4, 4]
- nonlinear_activation (Optional[str], optional):
上采样网络中的非线性激活,默认值为 None
- nonlinear_activation_params (Dict[str, Any], optional):
传递给上采样网络中的线性激活的参数,默认值为 {}
- interpolate_mode (str, optional):
上采样网络的插值模式,默认是“nearest”
- freq_axis_kernel_size (int, optional):
上采样网络频率轴上的核大小,默认为1
方法
__call__(*inputs, **kwargs)将self作为一个函数调用。
add_parameter(name, parameter)添加一个参数实例。
add_sublayer(name, sublayer)添加一个子层实例。
apply(fn)递归地将
fn应用到每个子层(由.sublayers()返回)以及自身。递归地对子层中的所有卷积层应用权重规范化。
buffers([include_sublayers])返回当前层及其子层中的所有缓冲区的列表。
children()返回一个迭代器,遍历直接子层。
clear_gradients()清除此层所有参数的梯度。
create_parameter(shape[, attr, dtype, ...])为该层创建参数。
create_tensor([name, persistable, dtype])为该层创建张量。
create_variable([name, persistable, dtype])为该层创建张量。
eval()将该层及其所有子层设置为评估模式。
extra_repr()该层的额外表示,您可以自定义实现自己的层。
forward(x, c)生成波形。
full_name()此层的完整名称,由 name_scope + "/" + MyLayer.__class__.__name__ 组成
inference([c])波形生成。
load_dict(state_dict[, use_structured_name])从 state_dict 设置参数和可持久化缓存。
named_buffers([prefix, include_sublayers])返回一个迭代器,遍历层中的所有缓冲区,生成名称和张量的元组。
named_children()返回一个直接子层的迭代器,同时提供层的名称和层本身。
named_parameters([prefix, include_sublayers])返回一个迭代器,遍历层中的所有参数,生成名称和参数的元组。
named_sublayers([prefix, include_self, ...])返回Layer中所有子层的迭代器,生成名称和子层的元组。
parameters([include_sublayers])返回当前层及其子层的所有参数的列表。
register_buffer(name, tensor[, persistable])将一个张量注册为该层的缓冲区。
register_forward_post_hook(hook)为层注册一个前向后钩子。
register_forward_pre_hook(hook)为层注册一个前向预钩子。
递归地从所有的卷积层中的子层中移除权重归一化。
set_dict(state_dict[, use_structured_name])从 state_dict 设置参数和可持久化的缓冲区。
set_state_dict(state_dict[, use_structured_name])从state_dict设置参数和持久化缓冲区。
state_dict([destination, include_sublayers, ...])获取当前层及其子层的所有参数和可持久化缓冲区。
sublayers([include_self])返回子层的列表。
to([device, dtype, blocking])通过给定的设备、数据类型和阻塞方式转换层的参数和缓冲区。
to_static_state_dict([destination, ...])获取当前层及其子层的所有参数和缓冲区。
train()将此层及其所有子层设置为训练模式。
向后
注册状态字典钩子
- forward(x, c)[来源]
生成波形。
- Args:
- x(Tensor):
形状 (N, C_in, T),输入波形。
- c(Tensor):
形状 (N, C_aux, T')。辅助输入(例如,声谱图)。它被上采样以匹配输入的时间分辨率。
- Returns:
张量:形状 (N, C_out, T),生成的波形。
- class paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan.PWGInference(normalizer, pwg_generator)[来源]
基础:
Layer方法
__call__(*inputs, **kwargs)将self作为一个函数调用。
add_parameter(name, parameter)添加一个参数实例。
add_sublayer(name, sublayer)添加一个子层实例。
apply(fn)递归地将
fn应用到每个子层(由.sublayers()返回)以及自身。buffers([include_sublayers])返回当前层及其子层中的所有缓冲区的列表。
children()返回一个迭代器,遍历直接子层。
clear_gradients()清除此层所有参数的梯度。
create_parameter(shape[, attr, dtype, ...])为该层创建参数。
create_tensor([name, persistable, dtype])为该层创建张量。
create_variable([name, persistable, dtype])为该层创建张量。
eval()将该层及其所有子层设置为评估模式。
extra_repr()该层的额外表示,您可以自定义实现自己的层。
forward(logmel)定义每次调用时执行的计算。
full_name()此层的完整名称,由 name_scope + "/" + MyLayer.__class__.__name__ 组成
load_dict(state_dict[, use_structured_name])从 state_dict 设置参数和可持久化缓存。
named_buffers([prefix, include_sublayers])返回一个迭代器,遍历层中的所有缓冲区,生成名称和张量的元组。
named_children()返回一个直接子层的迭代器,同时提供层的名称和层本身。
named_parameters([prefix, include_sublayers])返回一个迭代器,遍历层中的所有参数,生成名称和参数的元组。
named_sublayers([prefix, include_self, ...])返回Layer中所有子层的迭代器,生成名称和子层的元组。
parameters([include_sublayers])返回当前层及其子层的所有参数的列表。
register_buffer(name, tensor[, persistable])将一个张量注册为该层的缓冲区。
register_forward_post_hook(hook)为层注册一个前向后钩子。
register_forward_pre_hook(hook)为层注册一个前向预钩子。
set_dict(state_dict[, use_structured_name])从 state_dict 设置参数和可持久化的缓冲区。
set_state_dict(state_dict[, use_structured_name])从state_dict设置参数和持久化缓冲区。
state_dict([destination, include_sublayers, ...])获取当前层及其子层的所有参数和可持久化缓冲区。
sublayers([include_self])返回子层的列表。
to([device, dtype, blocking])通过给定的设备、数据类型和阻塞方式转换层的参数和缓冲区。
to_static_state_dict([destination, ...])获取当前层及其子层的所有参数和缓冲区。
train()将此层及其所有子层设置为训练模式。
向后
注册状态字典钩子
- class paddlespeech.t2s.models.parallel_wavegan.parallel_wavegan.ResidualPWGDiscriminator(in_channels: int = 1, out_channels: int = 1, kernel_size: int = 3, layers: int = 30, stacks: int = 3, residual_channels: int = 64, gate_channels: int = 128, skip_channels: int = 64, dropout: float = 0.0, bias: bool = True, use_weight_norm: bool = True, use_causal_conv: bool = False, nonlinear_activation: str = 'leakyrelu', nonlinear_activation_params: Dict[str, Any] = {'negative_slope': 0.2}, init_type: str = 'xavier_uniform')[来源]
基础:
Layer一种用于音频的wavenet风格的判别器。
- Args:
- in_channels (int, optional):
输入音频的通道数量,默认为1
- out_channels (int, optional):
输出特征大小,默认值为 1
- kernel_size (int, optional):
残差块的内核大小,默认为 3
- layers (int, optional):
残差块的数量,默认是30
- stacks (int, optional):
残差块的组数,其中每个残差块的扩张按指数增长,默认值为 3
- residual_channels (int, optional):
残差块的残差通道,默认值为64
- gate_channels (int, optional):
残差块的门通道,默认值为128
- skip_channels (int, optional):
跳过残差块的通道,默认是64
- dropout (float, optional):
残差块的丢弃概率,默认值为0。
- bias (bool, optional):
是否在残差块中使用偏置,默认为真
- use_weight_norm (bool, optional):
是否在所有卷积层中使用权重归一化,默认值为 True
- use_causal_conv (bool, optional):
是否在残差块中使用因果卷积,默认为 False
- nonlinear_activation (str, optional):
在残差块中以外的卷积后的激活,默认值为 "leakyrelu"
- nonlinear_activation_params (Dict[str, Any], optional):
要传递给激活函数的参数,默认值为 {"negative_slope": 0.2}
方法
__call__(*inputs, **kwargs)将self作为一个函数调用。
add_parameter(name, parameter)添加一个参数实例。
add_sublayer(name, sublayer)添加一个子层实例。
apply(fn)递归地将
fn应用到每个子层(由.sublayers()返回)以及自身。buffers([include_sublayers])返回当前层及其子层中的所有缓冲区的列表。
children()返回一个迭代器,遍历直接子层。
clear_gradients()清除此层所有参数的梯度。
create_parameter(shape[, attr, dtype, ...])为该层创建参数。
create_tensor([name, persistable, dtype])为该层创建张量。
create_variable([name, persistable, dtype])为该层创建张量。
eval()将该层及其所有子层设置为评估模式。
extra_repr()该层的额外表示,您可以自定义实现自己的层。
forward(x)参数:
full_name()此层的完整名称,由 name_scope + "/" + MyLayer.__class__.__name__ 组成
load_dict(state_dict[, use_structured_name])从 state_dict 设置参数和可持久化缓存。
named_buffers([prefix, include_sublayers])返回一个迭代器,遍历层中的所有缓冲区,生成名称和张量的元组。
named_children()返回一个直接子层的迭代器,同时提供层的名称和层本身。
named_parameters([prefix, include_sublayers])返回一个迭代器,遍历层中的所有参数,生成名称和参数的元组。
named_sublayers([prefix, include_self, ...])返回Layer中所有子层的迭代器,生成名称和子层的元组。
parameters([include_sublayers])返回当前层及其子层的所有参数的列表。
register_buffer(name, tensor[, persistable])将一个张量注册为该层的缓冲区。
register_forward_post_hook(hook)为层注册一个前向后钩子。
register_forward_pre_hook(hook)为层注册一个前向预钩子。
set_dict(state_dict[, use_structured_name])从 state_dict 设置参数和可持久化的缓冲区。
set_state_dict(state_dict[, use_structured_name])从state_dict设置参数和持久化缓冲区。
state_dict([destination, include_sublayers, ...])获取当前层及其子层的所有参数和可持久化缓冲区。
sublayers([include_self])返回子层的列表。
to([device, dtype, blocking])通过给定的设备、数据类型和阻塞方式转换层的参数和缓冲区。
to_static_state_dict([destination, ...])获取当前层及其子层的所有参数和缓冲区。
train()将此层及其所有子层设置为训练模式。
应用权重规范
向后
注册状态字典钩子
remove_weight_norm