指南 3个标注团队操作手册:提升标注速度与质量

问答系统

如果你想训练一个问答机器学习模型,可以使用此模板来构建数据集。该模板会提示标注人员阅读一段文本,然后高亮显示回答特定问题的文本片段。

交互式模板预览

标注配置

<View>
  <Header value="Please read the passage" />
  <Text name="text" value="$text" granularity="word"/>
  <Header value="Select a text span answering the following question:"/>
  <Text name="question" value="$question"/>
  <Labels name="answer" toName="text">
    <Label value="Answer" maxUsage="1" background="red"/>
  </Labels>
</View>

关于标注配置

所有标注配置必须包含在View标签内。

您可以添加一个header来为标注者提供说明:

<Header value="Please read the passage" />

使用Text对象标签向标注者显示一段文本:

<Text name="text" value="$text" granularity="word"/>

使用 granularity 参数确保高亮文本范围包含完整的单词。

您可以添加一个header来为标注者提供说明:

<Header value="Select a text span answering the following question:"/>

使用另一个Text对象标签向标注者显示第二段文本片段,在本例中是关于文本的问题:

<Text name="question" value="$question"/>

name参数必须与第一个文本片段使用的name不同,而value用于引用CSV文件中的列或JSON文件中的键以显示文本。您也可以使用value参数来显示静态文本。

使用Labels控制标签为标注者提供一个答案标签,用于在原文段落中高亮显示问题的答案:

<Labels name="answer" toName="text">
    <Label value="Answer" maxUsage="1" background="red"/>
</Labels>