paddlespeech.s2t.frontend.augmentor.volume_perturb 模块

包含体积扰动增强模型。

class paddlespeech.s2t.frontend.augmentor.volume_perturb.VolumePerturbAugmentor(rng, min_gain_dBFS, max_gain_dBFS)[来源]

Bases: AugmentorBase

用于添加随机音量扰动的增强模型。

这用于PCEN的多响度训练。请参阅

https://arxiv.org/pdf/1607.05666v1.pdf

有关更多详细信息。

Parameters:
  • rng (random.Random) -- 随机生成器对象。

  • min_gain_dBFS (float) -- 最小增益,单位为dBFS。

  • max_gain_dBFS (float) -- 最大增益(以dBFS为单位).

方法

__call__(x[, uttid, train])

将自身作为函数调用。

transform_audio(audio_segment)

改变音频响度。

transform_feature(spec_segment)

为输入的音频特征片段添加各种效果。

transform_audio(audio_segment)[来源]

改变音频音量。

请注意,这是一个就地转换。

Parameters:

audio_segment (音频段|语音段) -- 要添加效果的音频段。