paddlespeech.vector.io.embedding_norm 模块
- class paddlespeech.vector.io.embedding_norm.InputNormalization(mean_norm=True, std_norm=True, norm_type='global')[来源]
基础:
object方法
__call__(x, lengths[, spk_ids, stop_gradient])返回包含周围上下文的张量。 参数: x (paddle.Tensor): 一批张量。 lengths (paddle.Tensor): 一批张量,包含每个句子的相对长度(例如,[0.7, 0.9, 1.0])。它用于避免在零填充步骤上计算统计数据。 spk_ids (paddle.Tensor, 可选): 包含每个说话者的ID的张量(例如,[0 10 6])。它用于在norm_type='speaker'时执行按说话者的归一化。 默认为paddle.to_tensor([], dtype="float32")。 返回: paddle.Tensor: 归一化的特征或嵌入。
save(path)保存统计字典。
to(device)将所需的张量放置在正确的设备上。
- spk_dict_count: Dict[int, int]
- spk_dict_mean: Dict[int, Tensor]
- spk_dict_std: Dict[int, Tensor]