特点

数据集

  • Aishell

  • Librispeech

  • THCHS30

  • TIMIT

语音识别

语言模型

  • Ngram

解码器

  • ctc 贪心

  • ctc前缀束搜索

  • 贪婪

  • 束搜索

  • 注意 重新评分

部署

  • Paddle推理

对齐

  • MFA

  • CTC 对齐

语音前端

  • 音频

    • 自动增益

  • 特性

    • kaldi fbank

    • kaldi mfcc

    • 线性

    • 三角洲 delta

语音增强

  • 音频

    • 音量扰动

    • 速度扰动

    • 偏移扰动

    • 在线贝叶斯归一化

    • 噪声扰动

    • 脉冲响应

  • 光谱

    • 规范增强

    • 自适应SpecAugment

分词器

  • 中文/英文字符

  • 英语单词

  • 句子片段

分词

字素到音素

  • 音节

  • 音素