paddlespeech.s2t.frontend.normalizer 模块

包含特征标准化器。

class paddlespeech.s2t.frontend.normalizer.FeatureNormalizer(mean_std_filepath, manifest_path=None, featurize_func=None, num_samples=500, num_workers=0, random_seed=0)[来源]

基础: object

特征归一化。将特征标准化为零均值和单位标准差。

如果提供了 mean_std_filepath(不为 None),则归一化器将直接从文件初始化。否则,必须提供 manifest_path 和 featurize_func 以便动态计算均值和标准差。

Parameters:
  • mean_std_filepath (None|str) -- 包含预先计算的均值和标准差的文件。

  • manifest_path -- 实例的清单,用于计算均值和标准差。

  • featurize_func (None|callable) -- 提取特征的函数。它应该可以通过 featurize_func(audio_segment) 调用。

  • num_samples (int) -- 用于计算均值和标准差的随机样本数量。

  • random_seed (int) -- 用于抽样实例的随机种子。

Raises:

值错误 -- 如果 mean_std_filepath 和 manifest_path(或 mean_std_filepath 和 featurize_func 都为 None)。

方法

apply(features)

将特征归一化为零均值和单位标准差。

write_to_file(filepath)

将均值和标准差写入文件。

apply(features)[来源]

将特征归一化为零均值和单位标准差。

Parameters:
  • 特征 (ndarray, 形状 (T, D)) -- 输入要标准化的特征。

  • eps (float) -- 添加到 stddev 以提供数值稳定性。

Returns:

归一化特征。

Return type:

ndarray

write_to_file(filepath)[来源]

将均值和标准差写入文件。

Parameters:

filepath (str) -- 要写入均值和标准差的文件。