paddlespeech.t2s.datasets.vocoder_batch_fn 模块

class paddlespeech.t2s.datasets.vocoder_batch_fn.Clip(batch_max_steps=20480, hop_size=256, aux_context_window=0)[来源]

基础: object

用于训练语音编码器的合并函子。

方法

__call__(batch)

转换为批量张量。

class paddlespeech.t2s.datasets.vocoder_batch_fn.Clip_static(batch_max_steps=20480, hop_size=256, aux_context_window=0)[来源]

基础: Clip

用于训练声码器的合并函子。

方法

__call__(batch)

转换为批量张量。

class paddlespeech.t2s.datasets.vocoder_batch_fn.WaveRNNClip(mode: str = 'RAW', batch_max_steps: int = 4500, hop_size: int = 300, aux_context_window: int = 2, bits: int = 9, mu_law: bool = True)[来源]

基础: Clip

方法

__call__(batch)

转换为批张量。 参数: batch (list): 包含音频和特征的元组列表。 音频形状为 (T, ), 特征形状为(T', C).

to_quant

to_quant(wav)[来源]