NEW暗黑模式现已上线 🌓 Label Studio 1.18.0 版本发布

使用Segment Anything模型集成

指南

在上次社区大会上,我们探讨了Segment Anything Model (SAM)与Label Studio的集成,这要归功于社区杰出成员Shivansh Sharma的贡献。

无论您是计算机视觉、图像标注或机器学习领域的资深专家,还是刚刚入门的新手——我们都为您提供了全面的支持。让我们从Segment Anything的基础知识及其与Label Studio的集成开始讲起。

什么是Segment Anything模型?

Segment Anything Model (SAM) 是一个强大的模型,可帮助从图像中解析分离的对象。Meta(原Facebook)创建了这个开源模型,用于从任意给定图像中识别和提取各类对象。

想了解更多?查看 Segment Anything 的 网站 了解 SAM 功能的演示。

SAM是一种计算机视觉模型,能够高效检测图像中的不同物体并为其生成分割掩码。在SAM出现之前,图像分割主要通过多边形、边界框或魔术棒工具完成。相比这些传统方法,SAM在易用性和准确性上都实现了重大突破。计算机视觉研究人员和图像标注人员有福了!

Label Studio 是一款灵活的开源数据标注工具,适用于各类用户——从技术爱好者、学生到专业人士,从小型初创企业到大型企业组织。凭借高度可配置的界面、支持为多种数据类型分配多样化标签的能力,以及在整个机器学习运维生态系统中的可扩展性,使其成为用创新方案解决传统问题的理想平台。

所有这些功能让社区贡献者Shivansh能够将SAM集成到Label Studio ML后端中,从而为任何Label Studio用户释放SAM的强大能力。

From the original pull request 到现在,所有的更新和进一步开发都是公开进行的,让全球的协作者都能参与其中。

Segment Anything 操作指南

SAM后端将图像和标注者信息传递给Label Studio ML后端。SAM后端接收这些数据,并根据用户选择的关键点和原始图像生成图像分割结果。

想开始使用ML后端吗?查看“机器学习入门”教程。

分割掩码和物体分类结果随后传回Label Studio,标注界面可在此显示预测的掩码。用户可利用Label Studio中的其他工具进一步优化生成的图像掩码。这种紧密的集成循环显著提升了标注流程的准确性和效率。

关键点集成

在开发该插件时,Shivansh首先关注的是关键点集成功能。关键点集成允许用户在任何给定图像中的对象上放置关键点,为模型提供识别对象并进行分割预测的参考点。

在初始选择后,用户可以使用橡皮擦工具去除不需要的部分,或使用画笔工具添加更多细节来优化标注。这种关键点集成方法几乎适用于任何图像。通常情况下,它的准确性很高,用户无需进一步调整。

这是一个使用关键点集成与Segment Anything模型的示例。在这个案例中,我们可以看到两个选定的关键点——香蕉和橙子——以及分配给它们的标签。

标注者可以选择任何适合其需求的标签。查看这个使用Ego Hands数据集中手部分割图像的示例来演示该过程。该工具通过选择一个类别(例如手臂)并在其上放置关键点,快速选中整个对象。

然而,在某些情况下,SAM可能会选择比您预期更多的对象部分。例如,您可能只想选择人的手臂,但SAM的分割模型默认会选中整个人体。这凸显了Label Studios标注精修工具的重要性。橡皮擦工具可以清理分割溢出的部分,画笔工具可以捕捉遗漏的对象元素,而边界框可以限制对象分割发生的区域。每种工具都为标注人员提供了提升分割准确性的有力手段。

边界框与分割减法功能

边界框可以帮助隔离图像的特定区域,从而选择对象的一部分而非整体。例如,要选择图像中人物的手臂,您可以在其周围绘制一个边界框,SAM将仅聚焦于该区域。这一改进加快了处理速度,并减少了对橡皮擦和画笔工具进行大量调整的需求。

除了关键点和边界框功能外,贡献者们正在开发一项即将推出的增强功能,允许用户减去选定对象的部分区域。当您需要从选区中排除部分背景时,这项功能将非常实用。

请注意该功能仍在开发中——如果您发现任何可以改进的地方,请及时反馈问题。如果需要更精确地选择图像区域,建议改用边界框功能。

一旦完全集成,这个减法功能将进一步增强标注流程,适应各种使用场景。

SAM 🤝 Label Studio = 🚀

这种集成的潜在应用场景是无限的。亲自尝试一下,探索Label Studio SAM ML后端如何对您的数据集进行精细化的分割调整。

随着SAM和Label Studio SAM集成的持续发展,我们可以期待未来会有更多改进与进展。更高效的图像标注只是SAM带来的优势之一。该工具还可用于微调任务、视频分割或基于图像中检测到的对象提取字幕。

该模型的多功能性和易于集成的特性使其成为各种应用的宝贵补充,进一步扩大了其在多个领域的潜在影响。

SAM集成是Label Studio ML后端的一个官方组件。如果您对使用计算机视觉模型进行数据标注感兴趣,并想亲自尝试,请前往ML后端示例查看。如果您是Label Studio的新手,正在寻找入门方法,请阅读"从零到一使用Label Studio"教程,然后继续学习"机器学习入门"教程。


这样的贡献只有通过社区的力量才能实现。加入Label Studio社区,在这里你可以结识像Shivansh这样的社区领袖,并告诉我们你的想法!

相关内容