paddlespeech.s2t.frontend.augmentor.volume_perturb 模块
包含体积扰动增强模型。
- class paddlespeech.s2t.frontend.augmentor.volume_perturb.VolumePerturbAugmentor(rng, min_gain_dBFS, max_gain_dBFS)[来源]
Bases:
AugmentorBase用于添加随机音量扰动的增强模型。
这用于PCEN的多响度训练。请参阅
https://arxiv.org/pdf/1607.05666v1.pdf
有关更多详细信息。
- Parameters:
rng (random.Random) -- 随机生成器对象。
min_gain_dBFS (float) -- 最小增益,单位为dBFS。
max_gain_dBFS (float) -- 最大增益(以dBFS为单位).
方法
__call__(x[, uttid, train])将自身作为函数调用。
transform_audio(audio_segment)改变音频响度。
transform_feature(spec_segment)为输入的音频特征片段添加各种效果。