上下文滚动
音频与对应段落片段之间的播放同步功能,为您提供增强的上下文和控制能力,从而在对话分析过程中产出高质量的标注数据集并提升工作效率。
标注配置
<View>
<Audio name="audio" value="$url" sync="text"></Audio>
<View>
<Header value="Transcript"/>
<Paragraphs audioUrl="$audio" contextScroll="true" sync="audio" name="text" value="$text" layout="dialogue" textKey="text" nameKey="author" granularity="paragraph"/>
</View>
<View>
<Header value="Sentiment Labels"/>
<ParagraphLabels name="label" toName="text">
<Label value="Positive" background="#00ff00"/>
<Label value="Negative" background="#ff0000"/>
</ParagraphLabels>
</View>
</View>
关于标注配置
所有标注配置必须包含在View标签内。
您可以添加一个header来为标注者提供说明:
<Header value="Listen to the audio:"></Header>
使用Audio对象标签来指定音频片段的类型和位置。在这种情况下,音频片段存储在url键中。音频与Paragraphs配对时,需将'contextScroll'设为true,并将sync设为audio。此外,段落标签的name应包含音频标签中的textKey值:
<Audio name="audio" value="$url" sync="text"></Audio>
<Paragraphs audioUrl="$audio" contextScroll="true" sync="audio" name="text" value="$text" layout="dialogue" textKey="text" nameKey="author" granularity="paragraph"/>
使用Paragraph Labels控制标签与Label标签来标注段落转录的各个部分。
<ParagraphLabels name="label" toName="text">
<Label value="Positive" background="#00ff00"/>
<Label value="Negative" background="#ff0000"/>
</ParagraphLabels>
转录数据
转录数据应包含开始时间以及结束时间或持续时间
{
"text": [
{
"end": 1.5,
"text": "Dont you hate that?",
"start": 0,
"author": "Mia Wallace"
},
{
"text": "Hate what?",
"start": 1.5,
"author": "Vincent Vega:",
"duration": 3
},
{
"end": 7,
"text": "Uncomfortable silences. Why do we feel its necessary to yak to feel comfortable?",
"start": 4.5,
"author": "Mia Wallace:"
},
{
"end": 10,
"text": "I dont know. That's a good question.",
"start": 8,
"author": "Vincent Vega:"
},
],
},
增强此模板
该模板可以通过多种方式进行增强。
添加额外数据点
可以向此模板添加多个标签以增加注释的数据点。这里我们添加了Choices和TextArea标签,为说话者提供上下文和转录文本的响应区域:
<View>
<Choices name="speakers" toName="audio" choice="multiple" showInline="true">
<Choice value="speaker_1"/>
<Choice value="speaker_2"/>
</Choices>
</View>
<View>
<Header value="Provide your response:"/>
<TextArea name="response" toName="text"/>
</View>