paddlespeech.t2s.datasets.vocoder_batch_fn 模块
- class paddlespeech.t2s.datasets.vocoder_batch_fn.Clip(batch_max_steps=20480, hop_size=256, aux_context_window=0)[来源]
基础:
object用于训练语音编码器的合并函子。
方法
__call__(batch)转换为批量张量。
- class paddlespeech.t2s.datasets.vocoder_batch_fn.Clip_static(batch_max_steps=20480, hop_size=256, aux_context_window=0)[来源]
基础:
Clip用于训练声码器的合并函子。
方法
__call__(batch)转换为批量张量。
- class paddlespeech.t2s.datasets.vocoder_batch_fn.WaveRNNClip(mode: str = 'RAW', batch_max_steps: int = 4500, hop_size: int = 300, aux_context_window: int = 2, bits: int = 9, mu_law: bool = True)[来源]
基础:
Clip方法
__call__(batch)转换为批张量。 参数: batch (list): 包含音频和特征的元组列表。 音频形状为 (T, ), 特征形状为(T', C).
to_quant