paddlespeech.s2t.models.st_interface 模块

ST接口模块。

class paddlespeech.s2t.models.st_interface.STInterface[来源]

基类: ASRInterface

ST接口模型实现。

注意:该类继承自 ASRInterface,以便在执行与 ASR 任务的多任务学习时启用联合翻译和识别。

Attributes:
attention_plot_class

获取注意力图类。

ctc_plot_class

获取CTC绘图类。

方法

add_arguments(parser)

向解析器添加参数。

build(idim, odim, **kwargs)

使用python级别的参数初始化此类。

calculate_all_attentions(xs, ilens, ys)

计算注意力。

calculate_all_ctc_probs(xs, ilens, ys)

计算CTC概率。

encode(feat)

编码特征在 beam_search 中(可选)。

forward(xs, ilens, ys, olens)

计算训练的损失。

get_total_subsampling_factor()

获取总的子采样因子。

recognize(x, recog_args[, char_list, rnnlm])

对 x 进行评估。

recognize_batch(x, recog_args[, char_list, ...])

用于批处理的束搜索实现。

scorers()

获取 beam_search 的得分者(可选).

translate(x, trans_args[, char_list, rnnlm, ...])

识别 x 以便评估。

translate_batch(x, trans_args[, char_list, ...])

批量的束搜索实现。

translate(x, trans_args, char_list=None, rnnlm=None, ensemble_models=[])[来源]

识别x以进行评估。

Parameters:
  • x (ndarray) -- 输入声学特征 (B, T, D) 或 (T, D)

  • trans_args (namespace) -- 参数命名空间限制选项

  • char_list (list) -- 字符列表

  • rnnlm (paddle.nn.Layer) -- 语言模型模块

Returns:

N-best 解码结果

Return type:

列表

translate_batch(x, trans_args, char_list=None, rnnlm=None)[来源]

批量的光束搜索实现。

Parameters:
  • x (paddle.Tensor) -- 编码器隐藏状态序列 (B, Tmax, Henc)

  • trans_args (namespace) -- 参数命名空间,包含选项

  • char_list (list) -- 字符列表

  • rnnlm (paddle.nn.Layer) -- 语言模型模块

Returns:

N-best 解码结果

Return type:

列表

paddlespeech.s2t.models.st_interface.dynamic_import_st(module)[来源]

动态导入ST模型。

Args:

模块 (str): 模块名称:类名称或别名在 预定义_st

Returns:

类型:ST 类