paddlespeech.vector.io.batch 模块

paddlespeech.vector.io.batch.batch_feature_normalize(batch, mean_norm: bool = True, std_norm: bool = True)[来源]

进行批量话语特征归一化

Args:

batch (list): dataloader 的批处理特征
mean_norm (bool, optional): 均值归一化标志。默认为 True。
std_norm (bool, optional): 标准差归一化标志。默认为 True。

Returns:

dict:标准化的批次特征

paddlespeech.vector.io.batch.batch_pad_right(arrays, mode='constant', value=0)[来源]

给定一个 numpy 数组的列表,它通过在每个维度上向右填充将它们组合在一起,以便使所有数组的长度相同。

Args:

arrays : list. 我们希望一起填充的数组列表。
mode : str. 填充模式,参见numpy.pad文档。
value : float. 填充值,参见numpy.pad文档。

Returns:

array : numpy.array. 填充数组。
valid_vals : list. 包含原始非填充值各个维度比例的列表。

paddlespeech.vector.io.batch.feature_normalize(feats: Tensor, mean_norm: bool = True, std_norm: bool = True, convert_to_numpy: bool = False)[来源]

进行一次话语特征归一化

Args:

feats (paddle.Tensor): 原始话语特征,例如 fbank, mfcc
mean_norm (bool, optional): 均值标准化标志。默认值为 True.
std_norm (bool, optional): 标准差标准化标志。默认值为 True.
convert_to_numpy (bool, optional): 将 paddle.tensor 转换为 numpy

并使用numpy进行特征规范化。默认值为False。

Returns:

paddle.Tensor : 归一化特征

paddlespeech.vector.io.batch.pad_right_2d(x, target_length, axis=-1, mode='constant', **kwargs)[来源]
paddlespeech.vector.io.batch.pad_right_to(array, target_shape, mode='constant', value=0)[来源]

该函数接收一个任意形状的numpy数组,并通过在右侧附加值将其填充到目标形状。

Args:

array: 输入的numpy数组。需要填充的输入数组的维度。

目标形状 : (列表, 元组). 我们想要的目标数组的目标形状,其长度必须等于 array.ndim
模式 : str. 填充模式,请参阅 numpy.pad 文档。
值 : float. 填充值,请参阅 numpy.pad 文档。

Returns:

array: numpy.array. 填充数组。 valid_vals : list. 包含原始非填充值每个维度比例的列表。

paddlespeech.vector.io.batch.waveform_collate_fn(batch)[来源]

将波形包装成批量形式

Args:
batch (list): the waveform list from the dataloader

数据项包括几个字段 特征:发声波形数据 标签:发声标签编码数据

Returns:

dict:传递给数据加载器的批量数据