paddleaudio.datasets.gtzan模块
- class paddleaudio.datasets.gtzan.GTZAN(mode='train', seed=0, n_folds=5, split=1, feat_type='raw', **kwargs)[来源]
基础:
AudioClassificationDatasetGTZAN 数据集由 1000 个每个长达 30 秒的音频轨道组成。它包含 10 种类型,每种类型由 100 个轨道表示。该数据集是音乐类型识别 (MGR) 机器听觉研究中最常用的公共数据集。
- Reference:
音频信号的音乐流派分类 https://ieeexplore.ieee.org/document/1021072/
方法
META_INFO的别名- archieves = [{'url': 'http://opihi.cs.uvic.ca/sound/genres.tar.gz', 'md5': '5b3d6dddb579ab49814ab86dba69e7c7'}]
- audio_path = 'genres'
- label_list = ['blues', 'classical', 'country', 'disco', 'hiphop', 'jazz', 'metal', 'pop', 'reggae', 'rock']
- meta = 'genres/input.mf'
- meta_info
的别名
META_INFO