paddlespeech.s2t.decoders.scorers.ctc_prefix_score 模块

class paddlespeech.s2t.decoders.scorers.ctc_prefix_score.CTCPrefixScore(x, blank, eos, xp)[来源]

基础: object

计算CTC标签序列得分

该算法基于WATANABE等人的算法2。“用于端到端语音识别的混合CTC/注意力架构”,但扩展为可以高效地同时计算多个标签的概率

方法

__call__(y, cs, r_prev)

计算下一个标签的CTC前缀分数

initial_state()

获取初始CTC状态

initial_state()[来源]

获取初始CTC状态

Returns:

CTC 状态

class paddlespeech.s2t.decoders.scorers.ctc_prefix_score.CTCPrefixScorePD(x, xlens, blank, eos, margin=0)[来源]

基础: object

CTCPrefixScore的批处理

基于 WATANABE 等人所述的算法 2, "用于端到端语音识别的混合 CTC/注意力架构", 但扩展到有效地同时计算多个假设的标签概率 另见 Seki 等人 "基于 CTC-注意力的语音识别的向量化束搜索",于 2019 年的 INTERSPEECH 会议上(第 3825-3829 页)。

方法

__call__(y, state[, scoring_ids, att_w])

计算下一个标签的CTC前缀分数

extend_prob(x)

扩展CTC概率。

extend_state(state)

计算CTC前缀状态。

index_select_state(state, best_ids)

根据最佳 id 选择 CTC 状态

extend_prob(x)[来源]

扩展CTC概率。

Parameters:

x (paddle.Tensor) -- 输入标签后验序列 (B, T, O)

extend_state(state)[来源]

计算CTC前缀状态。

:param state : CTC状态 :return ctc_state

index_select_state(state, best_ids)[来源]

选择根据最佳ID的CTC状态

:param state : CTC 状态 :param best_ids : 通过束剪枝选中的索引号码 (B, W) :return selected_state