NEW暗黑模式现已上线 🌓 Label Studio 1.18.0 版本发布

开源
数据标注平台

最灵活的数据标注平台,用于微调LLMs、准备训练数据或验证AI模型。

最后提交:

最新版本:


                # Install the package
# into python virtual environment
pip install -U label-studio# Launch it!label-studio

标注各类数据类型。

GenAI

LLM微调

为监督微调或使用RLHF优化模型标注数据

LLM评估

响应审核、评分与并排对比

RAG评估

使用Ragas评分和人工反馈

计算机视觉

图像分类

将图像分类

目标检测

检测图像中的对象,支持方框、多边形、圆形和关键点

语义分割

将图像分割为多个区域。使用机器学习模型进行预标注并优化该流程

音频与语音应用

分类

将音频分类

说话人分离

根据说话人身份将输入音频流分割为同质片段

情绪识别

从音频中标记和识别情感

音频转录

将口头交流内容以文字形式记录下来

自然语言处理、文档、聊天机器人、转录文本

分类

将文档分类到一个或多个类别中。使用最多10000个分类的层级体系

命名实体

提取相关信息片段并归类到预定义的类别中

问答系统

根据上下文回答问题

情感分析

判断文档是正面、负面还是中性

机器人、传感器、物联网设备

分类

将时间序列分类

图像分割

识别与您构建机器学习算法相关的活动类型区域

事件识别

在时间序列数据图上标注单个事件

多领域应用

对话处理

呼叫中心录音可以同时转录并作为文本处理

光学字符识别

将图像和文本并排放置

带参考的时间序列

使用视频或音频流更轻松地分割时间序列数据

视频

分类

将视频分类

对象追踪

逐帧标记和追踪多个对象

辅助标注

添加关键帧并自动在关键帧之间插值边界框

灵活且可配置

可配置的布局和模板适应您的数据集和工作流程。

与您的机器学习/人工智能流程集成

Webhooks、Python SDK和API允许您进行身份验证、创建项目、导入任务、管理模型预测等操作。

机器学习辅助标注

通过集成ML后端使用预测功能辅助标注流程,节省时间。

连接您的云存储

连接到云端对象存储,并直接通过S3和GCP在那里标注数据。

探索并理解您的数据

在我们的数据管理器中,使用高级筛选器准备和管理您的数据集。

多项目与多用户

在一个平台上支持多种项目、用例和数据类型。

博客精选

查看所有文章
  • 将Label Studio与模型上下文协议(MCP)集成

    大语言模型能够推理和规划——但它们无法执行。模型上下文协议(MCP)改变了这一现状。了解如何将MCP与Label Studio集成,以自动化和简化您的标注工作流程。

    Jimmy Whitaker

    2025年6月2日

  • 谁来监督监督者?评估LLM作为裁判的可靠性

    LLM作为裁判承诺了速度、规模和更低成本——但代价是什么?本文探讨自动化评估在哪些场景有效、哪些场景失效,以及如何建立可信度。从微妙偏见到混合评估策略,我们剖析如何评估评估者本身。

    米凯拉·卡普兰

    2025年5月21日

  • 如何使用Krippendorff's Alpha衡量标注一致性

    Krippendorff's alpha是衡量标注者间一致性的最灵活方法之一。与其他指标不同,它适用于不完整数据并支持多种标签类型。本指南通过实际案例逐步演示如何计算观察一致性与期望一致性,并说明当分数较低时应采取的措施。

    米凯拉·卡普兰

    2025年5月19日

深受大小企业信赖

CloudflareSPI GlobalSRINVIDIAMetaIBMIntel
CloudflareSPI GlobalSRINVIDIAMetaIBMIntel
CloudflareSPI GlobalSRINVIDIAMetaIBMIntel

全球社区

加入数据科学家最大的社区,共同提升模型性能。

数百万 数据项已标注

17,000+ Slack社区成员

GitHub星标数

加入社区