Label Studio 概述
什么是Label Studio?
Label Studio 是一个开源的数据标注工具,支持在一个平台上管理多个项目、用户和数据类型。它允许您执行以下操作:
支持多种数据格式的不同类型标注任务。
将Label Studio与机器学习模型集成,为标签提供预测(预标注),或执行持续主动学习。参见设置机器学习与标注流程。
Label Studio 还提供企业级云服务,具备增强的安全性(单点登录SSO、基于角色的访问控制RBAC、SOC2合规认证)、团队管理功能、数据发现、分析与报告以及支持服务等级协议SLA。可通过免费试用快速入门并探索企业云产品。
界面



标注工作流
按照以下步骤使用Label Studio启动并完成标注项目:
- 安装Label Studio.
- 启动Label Studio.
- 创建Label Studio账户。创建一个账户来管理和设置标注项目。
- 设置标注项目。定义要在数据集上执行的标注类型并配置项目设置。
- 设置标注界面。添加您希望标注者使用的标签,并自定义标注界面。
- 将数据导入为标注任务。
- 标注和注释数据。
- 导出标注数据或注释。
架构
企业版
您可以在自己的工具中使用Label Studio的任何组件,或根据需求进行定制。在对Label Studio进行深度定制前,建议先查看Label Studio企业版,确认是否已包含您想开发的相关功能。更多详情请参阅Label Studio Features。
Label Studio的组件可作为模块化可扩展包使用,您可以将其集成到现有的机器学习流程和工具中。
模块 | 技术 | 描述 |
---|---|---|
Label Studio main app | Python 和 Django | Label Studio的主应用程序,包含大部分后端代码;用于执行数据标注任务。 |
Label Studio frontend | JavaScript web app using React and MST | Located within the main app repo. web/apps/labelstudio acts as the central integration point for all frontend elements. web/libs/editor is the frontend library. |
Data Manager | JavaScript web app using React | Manage data and tasks for labeling. Located under web/libs/datamanager in the main app repo. |
Machine Learning Backends | Python | 在标注流程的不同阶段预测数据标签。 |
