paddlespeech.t2s.frontend.generate_lexicon 模块

生成中文语音学的词汇和符号。
该词汇用于蒙特利尔对齐器。
请注意，在这个词汇中，音节被用作单词。由于在reorganize_baker.py生成的转录中使用的是音节而不是单词。
我们这样选择是为了更好地利用其他软件，如 pypinyin，用于中文文本到拼音的工具。这是中文 G2P 的惯例。

paddlespeech.t2s.frontend.generate_lexicon.generate_lexicon(with_tone=False, with_erhua=False)[来源]: 为普通话生成词汇表。

paddlespeech.t2s.frontend.generate_lexicon.rule(C, V, R, T)[来源]

根据声母、韵母、儿化音标志和声调生成一个音节。
应用拼音的书写规则。（对于y、w、ui、un、iu的特殊情况）

请注意，在此系统中，当 'ü' 出现在音素中时，总是写作 'v'，但在满足某些条件时，在音节中转换为 'u'。

当 'i' 出现在音素中时，具有不同的特征，并分为三类：'i'，'ii' 和 'iii'。
儿化可能适用于每个韵母，除了已经以 'r' 结尾的韵母。
当一个音节不可能或没有任何具有这种发音的字符时，返回 None 以将其过滤掉。