介绍
快速入门
语音转文本
文本到语音
发布的模型
演示
API 参考
AudioInfo
info()
load()
save()
normalize()
resample()
soundfile_load()
soundfile_save()
to_mono()
get_audio_backend()
列出音频后端()
set_audio_backend()
fbank()
mfcc()
spectrogram()
adaptive_spect_augment()
计算滤波银行矩阵()
depth_augment()
hz_to_mel()
mel_frequencies()
mel_to_hz()
melspectrogram()
mu_decode()
mu_encode()
power_to_db()
random_crop1d()
random_crop2d()
spect_augment()
stft()
AudioClassificationDataset
ESC50
GTZAN
HeySnips
OpenRIRNoise
TESS
UrbanSound8K
create_dct()
fft_frequencies()
WindowFunctionRegister
get_window()
decompress()
下载和解压缩()
load_state_dict_from_url()
参数错误
Logger
depth_convert()
pcm16to32()
add_sos_eos()
has_tensor()
pad_sequence()
th_accuracy()
Timer
seconds_to_hms()