NEW暗黑模式现已上线 🌓 Label Studio 1.18.0 版本发布

Label Studio 版本发布说明 0.6.0 - 嵌套数据标注

版本发布说明

经过两个月的精心打磨,本次发布标志着标注界面的重大进化——它不仅支持多种数据类型和标注场景,更探索了为标注任务引入更多维度的可能性。与此同时,在纯界面优化之外,模型辅助标注功能也迎来了重大更新。

我们已有一段时间提供预测面板,其背后的理念是提供一组可能来自不同模型的预测以供探索和调整,现在新增了一个模型页面,可以更轻松地管理连接的内容以及用于生成这些预测的内容。

以下是本次更新的更多详情:

嵌套标注

嵌套标注功能允许您指定多个分类选项,这些选项会在您选择关联的父类后显示:

它可以根据所选的选项或标签值进行匹配,并且也能与required属性配合使用,智能选择您尚未标注的区域。要试用此功能,请查阅Choices文档并查找以下属性:visibleWhenwhenTagNamewhenLabelValuewhenChoiceValue

按区域标注

通过按区域标注功能,您现在可以为标注区域提供额外属性。例如,在进行音频分段时,您可以进一步对区域进行分类。该功能适用于所有数据类型及以下控制标签:ChoicesTextAreaRating

它与嵌套标注完美集成,例如,您可以为任何特定区域提供多级分类。

机器学习更新

用户界面中新增的机器学习页面,您可以在其中指定连接机器学习后端的URL,手动触发模型训练,查看训练状态,并通过拖放任务快速检查预测结果。

多后端支持

Label Studio 现在支持连接多个机器学习后端。您可以同时获取每个任务的多个预测结果,并对不同模型或同一模型的不同超参数进行性能对比分析。您可以通过使用--ml-backend url1 url2 ...命令行选项或通过用户界面添加任意数量的后端连接。

连接模型

创建和连接机器学习后端变得更加简单 - 只需用.fit() / .predict()方法定义你的model.py脚本,然后运行label-studio-ml start --init --script=model.py启动ML后端。查看快速入门和教程了解如何连接sklearn和PyTorch模型

筛选

当标签或选项数量较多时,查找特定项目会变得繁琐。新标签功能应运而生,它能与任何标签/选项列表配合使用,并支持键盘操作。以下是交互示例:

按下shift+f聚焦,然后按Enter键选择第一个匹配项。

显示标签名称

在标注区域上方显示标签被证明是一个有用的功能,如果您想进行标注验证。通过视觉检查区域比在不同区域间切换所花费的时间更少。

模型评分

除了标签名称外,您还可以为特定区域提供预测分数。该分数可能来自您上传的数据或您连接的模型。当分数可用时,您可以按分数排序,并快速验证/调整最"不确定"区域的标注。

保持标签处于活动状态

如果您需要标注同一类型的数据,反复选择相同的标签可能会很繁琐。现在您可以选择保持最后一个标签处于激活状态,并将其用于新的标注任务。

当您想选择新标签时,别忘了取消选中当前区域,否则会修改已有区域的标签。

错误修复与改进

  • --host 参数现在可通过命令行参数使用(感谢 @hachreak
  • 修复了纯文本任务上传的问题(感谢 @gauthamsuresh09
  • 修复了Google Cloud上的一键部署问题(感谢@iCorv
  • 修复了代理安全的URL路径问题(感谢 ezavesky

相关内容