speechbrain.augment.preparation 模块

用于下载和准备数据集以进行数据增强的库, 该库提供了从网络下载数据集的功能,并 准备必要的CSV数据清单文件以供数据增强器使用。

作者: * Mirco Ravanelli 2023

摘要

函数:

prepare_csv

遍历一组wav文件并写入相应的csv文件。

prepare_dataset_from_URL

从提供的URL下载包含录音(例如,噪声序列)的数据集,并准备噪声增强器所需的CSV文件。

write_csv

遍历音频文件列表并写入相应的CSV文件。

参考

speechbrain.augment.preparation.prepare_dataset_from_URL(URL, dest_folder, ext, csv_file, max_length=None)[source]

从提供的URL下载包含录音(例如,噪声序列)的数据集,并准备必要的CSV文件以供噪声增强器使用。

Parameters:
  • URL (str) – 要下载的数据集的URL。

  • dest_folder (str) – 本地文件夹,用于下载噪声数据集。

  • ext (str) – 在下载的数据集中搜索的文件扩展名。

  • csv_file (str) – 存储准备好的噪声CSV文件的路径。

  • max_length (float) – 最大长度,单位为秒。 超过此长度的录音将自动切割成多个片段。

speechbrain.augment.preparation.prepare_csv(filelist, csv_file, max_length=None)[source]

迭代一组wav文件并写入相应的csv文件。

Parameters:
  • filelist (str) – 包含感兴趣文件路径的列表。

  • csv_file (str) – 存储准备好的噪声CSV文件的路径。

  • max_length (float) – 最大长度,单位为秒。 超过此长度的录音将自动切割成多个片段。

speechbrain.augment.preparation.write_csv(filelist, csv_file, max_length=None)[source]

遍历音频文件列表并写入相应的CSV文件。

Parameters:
  • filelist (list of str) – 包含感兴趣的音频文件路径的列表。

  • csv_file (str) – 存储准备好的噪声CSV文件的路径。

  • max_length (float (optional)) – 最大录音长度,单位为秒。 超过此长度的录音将自动切割成多个片段。