跳至主内容
Tutorials
完整安装ESPnet
ESPnet2
ESPnet1
训练配置
配方技巧
音频格式化
任务类与数据输入系统
Docker
作业调度系统
分布式训练
文档生成
Demos
路线图
ESPnet2
演示
课程
ESPnet-EZ
ESPnet EZ
ESPnet1 (旧版)
ESPnet1
Recipes
什么是配方模板?
自动语音识别(多任务处理)
基于离散单元的自动语音识别
说话人验证欺骗与防御措施
分类
语音编解码
说话人日志
语音增强
带语音增强的语音识别
带语音增强的说话人日志
Speech-to-Text Translation with Speech Enhancement
自监督学习
语言建模
Machine Translation
Speech-to-Speech Translation
弱监督学习(语音转文本)
ESPnet-SDS
口语理解
语音语言模型
说话人表征
自监督学习
Speech-to-Text Translation
歌声合成
ESPnet2 SVS2 配方模板
文本转语音
基于离散单元的文本转语音
无监督自动语音识别
Python API
espnet
asr
分布式
语言模型
mt
网络
优化器
调度器
st
转换
文本转语音
工具集
vc
espnet2
asr
asr_transducer
语音防伪
cls
语音分离
增强
文件输入输出
fst
gan_codec
gan_svs
gan_tts
hubert
迭代器
层
语言模型
主函数
mt
优化器
s2st
s2t
采样器
调度器
sds
语音语言理解
speechlm
说话人
ssl
st
svs
任务
文本
torch_utils
训练
文本转语音
tts2
语音识别
工具集
espnetez
配置
数据
数据加载器
数据集
预处理
任务
训练器
Shell API
espnet2_bin
espnet_bin
spm
工具集
utils_py
搜索
Ctrl
K
语音语言模型
不到1分钟
语音语言模型
这是ESPnet2的speechlm1配方模板。
上一页
语音增强
下一步
带语音增强的语音识别