paddlespeech.s2t.utils.bleu_score 模块

该模块提供在不同级别计算bleu分数的函数。 例如,wer用于单词级别,cer用于字符级别。

class paddlespeech.s2t.utils.bleu_score.ErrorCalculator(char_list, sym_space, sym_pad, report_bleu=False)[来源]

基础: object

在训练过程中计算ST和MT模型的BLEU值。

Parameters:
  • y_hats -- numpy 数组,包含预测的文本

  • y_pads -- numpy数组,包含真实(目标)文本

  • char_list -- 词汇表

  • sym_space -- 空间符号

  • sym_pad -- 填充符号

  • report_bleu -- 如果为真,则报告BLUE分数

方法

__call__(ys_hat, ys_pad)

计算语料库级别的BLEU得分。

calculate_corpus_bleu(ys_hat, ys_pad)

计算小批量的语料库级别BLEU分数。

calculate_corpus_bleu(ys_hat, ys_pad)[来源]

计算小批量的语料库级别BLEU评分。

Parameters:
  • seqs_hat (torch.Tensor) -- 预测 (批次,序列长度)

  • seqs_true (torch.Tensor) -- 参考 (批次, 序列长度)

Returns:

语料库级别的BLEU评分

:rtype 浮点数

paddlespeech.s2t.utils.bleu_score.bleu(hypothesis, reference)[来源]

计算BLEU。BLEU使用scarebleu在词级别上比较参考文本和假设文本。

Parameters:
  • 参考 (列表[列表[字符串]]) -- 参考句子。

  • 假设 (列表[字符串]) -- 假设句子。

Raises:

ValueError -- 如果参考长度为零。

paddlespeech.s2t.utils.bleu_score.char_bleu(hypothesis, reference)[来源]

计算BLEU。BLEU使用scarebleu在字符级别比较参考文本和假设文本。

Parameters:
  • 参考 (列表[列表[字符串]]) -- 参考句子。

  • 假设 (列表[字符串]) -- 假设句子。

Raises:

值错误 -- 如果参考编号为零。