指南 3个标注团队操作手册:提升标注速度与质量

EasyOCR 模型连接

EasyOCR模型连接是一个强大的工具,它将EasyOCR的功能与Label Studio集成在一起。该工具旨在协助机器学习标注任务,特别是涉及光学字符识别(OCR)的任务。

该连接的主要功能是从图像中识别并提取文本,这在许多机器学习工作流程中都是关键步骤。通过自动化这一过程,EasyOCR模型连接能显著提高效率,减少手动文本提取所需的时间和精力。

在Label Studio的背景下,这种连接增强了平台的标注能力,使用户能够自动为图像中的文本生成标签。这在数据标注、文档数字化等任务中尤其有用。

开始之前

在开始之前,您必须安装Label Studio ML后端

本教程使用easyocr示例

标注配置

EasyOCR模型连接可与Label Studio中默认的OCR标注配置一起使用。该配置通常涉及定义要使用的标签类型(例如文本、手写等)以及这些标签应应用的图像区域。

在设置标注配置时,选择计算机视觉 > 光学字符识别。该模板已针对OCR任务预先配置,包含用于标注图像中文本的必要元素:

<View>
  <Image name="image" value="$image"/>

  <Labels name="label" toName="image">
    <Label value="Text" background="green"/>
    <Label value="Handwriting" background="blue"/>
  </Labels>

  <Rectangle name="bbox" toName="image" strokeWidth="3"/>
  <Polygon name="poly" toName="image" strokeWidth="3"/>

  <TextArea name="transcription" toName="image"
            editable="true"
            perRegion="true"
            required="true"
            maxSubmissions="1"
            rows="5"
            placeholder="Recognized Text"
            displayMode="region-list"
            />
</View>

警告!请注意当前EasyOCR模型连接的实现不支持直接上传至Label Studio的图片。该功能设计用于处理托管在互联网上公开可访问的图片。因此,若要使用此连接,请确保您的图片可通过URL公开访问。

  1. 使用预构建的镜像在http://localhost:9090上启动机器学习后端:
docker-compose up
  1. 验证后端是否正在运行
$ curl http://localhost:9090/
{"status":"UP"}
  1. 在Label Studio中创建一个项目。然后从项目设置的模型页面,连接模型。默认URL是http://localhost:9090

从源码构建(高级)

要从源代码构建ML后端,您需要克隆代码仓库并构建Docker镜像:

docker-compose build

不使用Docker运行(高级)

要在不使用Docker的情况下运行ML后端,您需要克隆代码库并使用pip安装所有依赖项:

python -m venv ml-backend
source ml-backend/bin/activate
pip install -r requirements.txt

然后你可以启动ML后端:

label-studio-ml start ./easyocr

EasyOCR模型连接提供了多个配置选项,可在docker-compose.yml文件中设置:

  • BASIC_AUTH_USER: 指定模型服务器的基础认证用户。
  • BASIC_AUTH_PASS: 指定模型服务器的基础认证密码。
  • LOG_LEVEL: 设置模型服务器的日志级别。
  • WORKERS: 指定模型服务器的工作线程数量。
  • THREADS: 指定模型服务器的线程数。
  • MODEL_DIR: 指定模型目录。
  • LANG_LIST: 指定OCR模型使用的语言列表,以逗号分隔(默认值:mn,en)。
  • SCORE_THRESHOLD: 设置分数阈值以过滤掉噪声结果。
  • LABEL_MAPPINGS_FILE: 指定包含从COCO标签到自定义标签映射的文件。
  • DEVICE: 指定要使用的设备(cpu、cuda:0、cuda:1等)。
  • HEIGHT_THS: 设置框高度的最大差异。文本大小差异很大的框不应合并。
  • LABEL_STUDIO_ACCESS_TOKEN: 指定Label Studio的访问令牌。
  • LABEL_STUDIO_HOST: 指定Label Studio的主机地址。

这些选项允许您自定义EasyOCR模型连接的行为,以满足您的特定需求。

自定义

可以通过在./easyocr目录中添加自定义模型和逻辑来定制ML后端。