paddlespeech.t2s.frontend.generate_lexicon 模块

生成中文语音学的词汇和符号。
该词汇用于蒙特利尔对齐器。
请注意,在这个词汇中,音节被用作单词。由于在reorganize_baker.py生成的转录中使用的是音节而不是单词。
我们这样选择是为了更好地利用其他软件,如 pypinyin,用于中文文本到拼音的工具。这是中文 G2P 的惯例。

paddlespeech.t2s.frontend.generate_lexicon.generate_lexicon(with_tone=False, with_erhua=False)[来源]

为普通话生成词汇表。

paddlespeech.t2s.frontend.generate_lexicon.rule(C, V, R, T)[来源]

根据声母、韵母、儿化音标志和声调生成一个音节。
应用拼音的书写规则。(对于y、w、ui、un、iu的特殊情况)

请注意,在此系统中,当 'ü' 出现在音素中时,总是写作 'v',但在满足某些条件时,在音节中转换为 'u'。

当 'i' 出现在音素中时,具有不同的特征,并分为三类:'i','ii' 和 'iii'。
儿化可能适用于每个韵母,除了已经以 'r' 结尾的韵母。
当一个音节不可能或没有任何具有这种发音的字符时,返回 None 以将其过滤掉。