开源
数据标注平台
# Install the package
# into python virtual environmentpip install -U label-studio# Launch it!label-studio
# Install the caskbrew install humansignal/tap/label-studio# Launch it!label-studio
# clone repogit clone https://github.com/HumanSignal/label-studio.git# install dependenciescd label-studio
pip install poetry
poetry install# apply db migrationspoetry run python label_studio/manage.py migrate# collect static filespoetry run python label_studio/manage.py collectstatic# launchpoetry run python label_studio/manage.py runserver
# Run latest Docker versiondocker run -it -p 8080:8080 -v `pwd`/mydata:/label-studio/data heartexlabs/label-studio:latest# Now visit http://localhost:8080/
标注各类数据类型。
GenAI
LLM微调
为监督微调或使用RLHF优化模型标注数据
LLM评估
响应审核、评分与并排对比
RAG评估
使用Ragas评分和人工反馈
计算机视觉
图像分类
将图像分类
目标检测
检测图像中的对象,支持方框、多边形、圆形和关键点
语义分割
将图像分割为多个区域。使用机器学习模型进行预标注并优化该流程
音频与语音应用
分类
将音频分类
说话人分离
根据说话人身份将输入音频流分割为同质片段
情绪识别
从音频中标记和识别情感
音频转录
将口头交流内容以文字形式记录下来
自然语言处理、文档、聊天机器人、转录文本
分类
将文档分类到一个或多个类别中。使用最多10000个分类的层级体系
命名实体
提取相关信息片段并归类到预定义的类别中
问答系统
根据上下文回答问题
情感分析
判断文档是正面、负面还是中性
机器人、传感器、物联网设备
分类
将时间序列分类
图像分割
识别与您构建机器学习算法相关的活动类型区域
事件识别
在时间序列数据图上标注单个事件
多领域应用
对话处理
呼叫中心录音可以同时转录并作为文本处理
光学字符识别
将图像和文本并排放置
带参考的时间序列
使用视频或音频流更轻松地分割时间序列数据
视频
分类
将视频分类
对象追踪
逐帧标记和追踪多个对象
辅助标注
添加关键帧并自动在关键帧之间插值边界框
灵活且可配置
可配置的布局和模板适应您的数据集和工作流程。
与您的机器学习/人工智能流程集成
Webhooks、Python SDK和API允许您进行身份验证、创建项目、导入任务、管理模型预测等操作。
机器学习辅助标注
通过集成ML后端使用预测功能辅助标注流程,节省时间。
连接您的云存储
连接到云端对象存储,并直接通过S3和GCP在那里标注数据。
探索并理解您的数据
在我们的数据管理器中,使用高级筛选器准备和管理您的数据集。
多项目与多用户
在一个平台上支持多种项目、用例和数据类型。
博客精选
查看所有文章-
大语言模型能够推理和规划——但它们无法执行。模型上下文协议(MCP)改变了这一现状。了解如何将MCP与Label Studio集成,以自动化和简化您的标注工作流程。
Jimmy Whitaker
2025年6月2日
-
LLM作为裁判承诺了速度、规模和更低成本——但代价是什么?本文探讨自动化评估在哪些场景有效、哪些场景失效,以及如何建立可信度。从微妙偏见到混合评估策略,我们剖析如何评估评估者本身。
米凯拉·卡普兰
2025年5月21日
-
如何使用Krippendorff's Alpha衡量标注一致性
Krippendorff's alpha是衡量标注者间一致性的最灵活方法之一。与其他指标不同,它适用于不完整数据并支持多种标签类型。本指南通过实际案例逐步演示如何计算观察一致性与期望一致性,并说明当分数较低时应采取的措施。
米凯拉·卡普兰
2025年5月19日