paddle speech Logo
latest

介绍

  • PaddleSpeech

快速入门

  • 安装
  • 语音转文本快速开始
  • 文本到语音的快速入门

语音转文本

  • 模型介绍
  • 数据准备
  • 特点
  • Ngram 语言模型

文本到语音

  • 高级用法
  • 基于规则的中文文本前端
  • 模型介绍
  • 生成对抗网络声码器
  • 音频样本
  • 音频样本 (PaddleSpeech TTS 与 Espnet TTS)

发布的模型

  • 发布的模型

演示

  • 演示视频
  • 流式自动语音识别演示视频
  • TTS 演示视频
  • 流式 TTS 演示视频

API 参考

  • paddleaudio
    • 子包
      • paddleaudio.backends 包
      • paddleaudio.compliance 包
        • 子模块
      • paddleaudio.datasets 包
      • paddleaudio.features 包
      • paddleaudio.functional 包
      • paddleaudio.kaldi 包
      • paddleaudio.metric 包
      • paddleaudio.sox_effects 包
      • paddleaudio.utils 包
  • paddlespeech.audio
  • paddlespeech.cli
  • paddlespeech.cls
  • paddlespeech.kws
  • paddlespeech.resource
  • paddlespeech.s2t
  • paddlespeech.server
  • paddlespeech.t2s
  • paddlespeech.text
  • paddlespeech.vector
paddle speech
  • paddleaudio package
  • paddleaudio.compliance package
  • Edit on GitHub

paddleaudio.compliance包

子模块

  • paddleaudio.compliance.kaldi 模块
    • fbank()
    • mfcc()
    • spectrogram()
  • paddleaudio.compliance.librosa 模块
    • adaptive_spect_augment()
    • 计算滤波银行矩阵()
    • depth_augment()
    • hz_to_mel()
    • mel_frequencies()
    • mel_to_hz()
    • melspectrogram()
    • mfcc()
    • mu_decode()
    • mu_encode()
    • power_to_db()
    • random_crop1d()
    • random_crop2d()
    • spect_augment()
    • spectrogram()
    • stft()
Previous Next

© 版权 2021,paddlespeech-developers。 修订版 17854a04.

Built with Sphinx using a theme provided by Read the Docs.