paddlespeech.s2t.frontend.augmentor.base 模块

包含增广模型的抽象基类。

class paddlespeech.s2t.frontend.augmentor.base.AugmentorBase[来源]

基础: object

增广模型(augmentor)类的抽象基类。所有增广类都应该从这个类继承,并实现以下抽象方法。

方法

__call__(xs)

将自我作为一个函数调用。

transform_audio(audio_segment)

为输入的音频片段添加各种效果。

transform_feature(spec_segment)

为输入的音频特征段添加各种效果。

abstract transform_audio(audio_segment)[来源]

向输入音频片段添加各种效果。这些效果将增强训练数据,使模型对于现实世界中某些类型的扰动保持不变,提高模型的泛化能力。

请注意,这是一个就地转换。

Parameters:

audio_segment (音频段|语音段) -- 要添加效果的音频段。

abstract transform_feature(spec_segment)[来源]

向输入的音频特征片段添加各种效果。这样的效果将增强训练数据,使模型对现实世界中的某些时间掩码或频率掩码不变,从而提高模型的泛化能力。

Args:

spec_segment (Spectrogram):要添加效果的声谱段。