指南 3个标注团队操作手册:提升标注速度与质量

上下文滚动

音频与对应段落片段之间的播放同步功能,为您提供增强的上下文和控制能力,从而在对话分析过程中产出高质量的标注数据集并提升工作效率。

标注配置

<View>
  <Audio name="audio" value="$url" sync="text"></Audio>
    <View>
    <Header value="Transcript"/>
    <Paragraphs audioUrl="$audio" contextScroll="true" sync="audio" name="text" value="$text" layout="dialogue" textKey="text" nameKey="author" granularity="paragraph"/>
  </View>  
    <View>
      <Header value="Sentiment Labels"/>
      <ParagraphLabels  name="label" toName="text">
        <Label value="Positive" background="#00ff00"/>
        <Label value="Negative" background="#ff0000"/>
      </ParagraphLabels>
    </View>
</View>

关于标注配置

所有标注配置必须包含在View标签内。

您可以添加一个header来为标注者提供说明:

<Header value="Listen to the audio:"></Header>

使用Audio对象标签来指定音频片段的类型和位置。在这种情况下,音频片段存储在url键中。音频与Paragraphs配对时,需将'contextScroll'设为true,并将sync设为audio。此外,段落标签的name应包含音频标签中的textKey值:

<Audio name="audio" value="$url" sync="text"></Audio>
<Paragraphs audioUrl="$audio" contextScroll="true" sync="audio" name="text" value="$text" layout="dialogue" textKey="text" nameKey="author" granularity="paragraph"/>

使用Paragraph Labels控制标签与Label标签来标注段落转录的各个部分。

<ParagraphLabels  name="label" toName="text">
  <Label value="Positive" background="#00ff00"/>
  <Label value="Negative" background="#ff0000"/>
</ParagraphLabels>

转录数据

转录数据应包含开始时间以及结束时间或持续时间

{
    "text": [
      {
        "end": 1.5,
        "text": "Dont you hate that?",
        "start": 0,
        "author": "Mia Wallace"
      },
      {
        "text": "Hate what?",
        "start": 1.5,
        "author": "Vincent Vega:",
        "duration": 3
      },
      {
        "end": 7,
        "text": "Uncomfortable silences. Why do we feel its necessary to yak to feel comfortable?",
        "start": 4.5,
        "author": "Mia Wallace:"
      },
      {
        "end": 10,
        "text": "I dont know. That's a good question.",
        "start": 8,
        "author": "Vincent Vega:"
      },
    ],
  },

增强此模板

该模板可以通过多种方式进行增强。

添加额外数据点

可以向此模板添加多个标签以增加注释的数据点。这里我们添加了ChoicesTextArea标签,为说话者提供上下文和转录文本的响应区域:

<View>
  <Choices name="speakers" toName="audio" choice="multiple" showInline="true">
  <Choice value="speaker_1"/>
  <Choice value="speaker_2"/>
</Choices>
</View>
<View>
  <Header value="Provide your response:"/>  
  <TextArea name="response" toName="text"/>
</View>