指南 3个标注团队操作手册:提升标注速度与质量

基于分段的自动语音识别

聆听音频文件并进行分段,然后用自然语言转录每个分段的内容,利用分段执行语音识别。

交互式模板预览

标注配置

<View>
  <Labels name="labels" toName="audio">
    <Label value="Speech" />
    <Label value="Noise" />
  </Labels>
  <Audio name="audio" value="$audio"/>
  <TextArea name="transcription" toName="audio"
            rows="2" editable="true"
            perRegion="true" required="true" />
</View>

关于标注配置

所有标注配置必须包含在View标签内。

使用Labels控制标签,让标注者能够高亮显示音频中代表不同类型噪音的部分:

<Labels name="labels" toName="audio">
    <Label value="Speech" />
    <Label value="Noise" />
</Labels>

使用Audio对象标签来显示可标注的音频波形:

<Audio name="audio" value="$audio"/>

使用TextArea控件标签提示标注者为每段音频提供文字转录:

<TextArea name="transcription" toName="audio"
          rows="2" editable="true"
          perRegion="true" required="true" />

editable="true"参数指定转录文本可编辑,required="true"将转录文本设为标注者的必填字段。若未为音频片段的每个分段提供转录文本(通过perRegion="true"参数设置),则无法提交标注结果。

增强此模板

为特定音频片段添加上下文

如果您希望提示标注者为特定音频片段添加上下文信息,例如选择给定音频片段中说话者的口音或假定性别,您可以在标注配置中添加以下内容:

<View visibleWhen="region-selected">
  <Header value="Select the assumed gender of the speaker:" />
  <Choices name="gender" toName="audio"
           perRegion="true" required="true">
    <Choice value="Man" />
    <Choice value="Woman" />
  </Choices>
</View>

View标签中的visibleWhen参数表示该选项仅在选中特定音频片段时可见。Header标签为标注者提供操作说明。Choices标签包含perRegion参数,用于将所选选项仅应用于选中的音频片段。