paddleaudio.datasets.gtzan模块

class paddleaudio.datasets.gtzan.GTZAN(mode='train', seed=0, n_folds=5, split=1, feat_type='raw', **kwargs)[来源]

基础: AudioClassificationDataset

GTZAN 数据集由 1000 个每个长达 30 秒的音频轨道组成。它包含 10 种类型,每种类型由 100 个轨道表示。该数据集是音乐类型识别 (MGR) 机器听觉研究中最常用的公共数据集。

Reference:

音频信号的音乐流派分类 https://ieeexplore.ieee.org/document/1021072/

方法

meta_info

META_INFO 的别名

archieves = [{'url': 'http://opihi.cs.uvic.ca/sound/genres.tar.gz', 'md5': '5b3d6dddb579ab49814ab86dba69e7c7'}]
audio_path = 'genres'
label_list = ['blues', 'classical', 'country', 'disco', 'hiphop', 'jazz', 'metal', 'pop', 'reggae', 'rock']
meta = 'genres/input.mf'
meta_info

的别名 META_INFO