指南 3个标注团队操作手册:提升标注速度与质量

Label Studio 概述

什么是Label Studio?

Label Studio 是一个开源的数据标注工具,支持在一个平台上管理多个项目、用户和数据类型。它允许您执行以下操作:

  • 支持多种数据格式的不同类型标注任务。

  • 将Label Studio与机器学习模型集成,为标签提供预测(预标注),或执行持续主动学习。参见设置机器学习与标注流程

Label Studio 还提供企业级云服务,具备增强的安全性(单点登录SSO、基于角色的访问控制RBAC、SOC2合规认证)、团队管理功能、数据发现、分析与报告以及支持服务等级协议SLA。可通过免费试用快速入门并探索企业云产品。

界面


Project List Screenshot


Data Manager Screenshot


Quick View Screenshot

标注工作流

按照以下步骤使用Label Studio启动并完成标注项目:

  1. 安装Label Studio.
  2. 启动Label Studio.
  3. 创建Label Studio账户。创建一个账户来管理和设置标注项目。
  4. 设置标注项目。定义要在数据集上执行的标注类型并配置项目设置。
  5. 设置标注界面。添加您希望标注者使用的标签,并自定义标注界面。
  6. 将数据导入为标注任务
  7. 标注和注释数据
  8. 导出标注数据或注释

架构

企业版

您可以在自己的工具中使用Label Studio的任何组件,或根据需求进行定制。在对Label Studio进行深度定制前,建议先查看Label Studio企业版,确认是否已包含您想开发的相关功能。更多详情请参阅Label Studio Features

Label Studio的组件可作为模块化可扩展包使用,您可以将其集成到现有的机器学习流程和工具中。

模块 技术 描述
Label Studio main app Python 和 Django Label Studio的主应用程序,包含大部分后端代码;用于执行数据标注任务。
Label Studio frontend JavaScript web app using React and MST Located within the main app repo. web/apps/labelstudio acts as the central integration point for all frontend elements. web/libs/editor is the frontend library.
Data Manager JavaScript web app using React Manage data and tasks for labeling. Located under web/libs/datamanager in the main app repo.
Machine Learning Backends Python 在标注流程的不同阶段预测数据标签。

专为各种规模的团队设计 版本比较