paddlespeech.vector.exps.ge2e.speaker_verification_dataset 模块

class paddlespeech.vector.exps.ge2e.speaker_verification_dataset.Collate(num_frames)[来源]

基础： object

方法

__call__(examples)

将自身作为一个函数调用。

class paddlespeech.vector.exps.ge2e.speaker_verification_dataset.MultiSpeakerMelDataset(dataset_root: Path)[来源]

基础： Dataset

一个包含以 *.npy 格式的 mel 频谱图的 2 层目录。下面展示了一个示例文件结构树。我们更喜欢将原始数据集进行预处理并像这样组织。

dataset_root/

speaker1/: utterance1.npy utterance2.npy utterance3.npy
speaker2/: utterance1.npy utterance2.npy utterance3.npy

方法

通过索引获取示例

get_example_by_index(speaker_index, utterance_index)[来源]

class paddlespeech.vector.exps.ge2e.speaker_verification_dataset.MultiSpeakerSampler(dataset: 多说话者梅尔数据集, speakers_per_batch: int, utterances_per_speaker: int)[来源]

基础: BatchSampler

一个为说话人验证任务设计的多层采样器。首先，从所有说话人中随机抽取N个说话人。然后，对于每个说话人，从他们对应的发声中随机抽取M个发声。

class paddlespeech.vector.exps.ge2e.speaker_verification_dataset.RandomClip(frames)[来源]

基础： object

方法

__call__(spec)

将自身作为一个函数调用。