EasyOCR 模型连接

EasyOCR模型连接是一个强大的工具，它将EasyOCR的功能与Label Studio集成在一起。该工具旨在协助机器学习标注任务，特别是涉及光学字符识别(OCR)的任务。

该连接的主要功能是从图像中识别并提取文本，这在许多机器学习工作流程中都是关键步骤。通过自动化这一过程，EasyOCR模型连接能显著提高效率，减少手动文本提取所需的时间和精力。

在Label Studio的背景下，这种连接增强了平台的标注能力，使用户能够自动为图像中的文本生成标签。这在数据标注、文档数字化等任务中尤其有用。

开始之前

在开始之前，您必须安装Label Studio ML后端。

本教程使用easyocr示例。

标注配置

EasyOCR模型连接可与Label Studio中默认的OCR标注配置一起使用。该配置通常涉及定义要使用的标签类型（例如文本、手写等）以及这些标签应应用的图像区域。

在设置标注配置时，选择计算机视觉 > 光学字符识别。该模板已针对OCR任务预先配置，包含用于标注图像中文本的必要元素：

<View>
  <Image name="image" value="$image"/>

  <Labels name="label" toName="image">
    <Label value="Text" background="green"/>
    <Label value="Handwriting" background="blue"/>
  </Labels>

  <Rectangle name="bbox" toName="image" strokeWidth="3"/>
  <Polygon name="poly" toName="image" strokeWidth="3"/>

  <TextArea name="transcription" toName="image"
            editable="true"
            perRegion="true"
            required="true"
            maxSubmissions="1"
            rows="5"
            placeholder="Recognized Text"
            displayMode="region-list"
            />
</View>

警告！请注意当前EasyOCR模型连接的实现不支持直接上传至Label Studio的图片。该功能设计用于处理托管在互联网上公开可访问的图片。因此，若要使用此连接，请确保您的图片可通过URL公开访问。

使用Docker运行(推荐)

使用预构建的镜像在http://localhost:9090上启动机器学习后端：

docker-compose up

验证后端是否正在运行

$ curl http://localhost:9090/
{"status":"UP"}

在Label Studio中创建一个项目。然后从项目设置的模型页面，连接模型。默认URL是http://localhost:9090。

从源码构建（高级）

要从源代码构建ML后端，您需要克隆代码仓库并构建Docker镜像：

docker-compose build

不使用Docker运行（高级）

要在不使用Docker的情况下运行ML后端，您需要克隆代码库并使用pip安装所有依赖项：

python -m venv ml-backend
source ml-backend/bin/activate
pip install -r requirements.txt

然后你可以启动ML后端：

label-studio-ml start ./easyocr

EasyOCR模型连接提供了多个配置选项，可在docker-compose.yml文件中设置：

BASIC_AUTH_USER: 指定模型服务器的基础认证用户。
BASIC_AUTH_PASS: 指定模型服务器的基础认证密码。
LOG_LEVEL: 设置模型服务器的日志级别。
WORKERS: 指定模型服务器的工作线程数量。
THREADS: 指定模型服务器的线程数。
MODEL_DIR: 指定模型目录。
LANG_LIST: 指定OCR模型使用的语言列表，以逗号分隔（默认值：mn,en）。
SCORE_THRESHOLD: 设置分数阈值以过滤掉噪声结果。
LABEL_MAPPINGS_FILE: 指定包含从COCO标签到自定义标签映射的文件。
DEVICE: 指定要使用的设备（cpu、cuda:0、cuda:1等）。
HEIGHT_THS: 设置框高度的最大差异。文本大小差异很大的框不应合并。
LABEL_STUDIO_ACCESS_TOKEN: 指定Label Studio的访问令牌。
LABEL_STUDIO_HOST: 指定Label Studio的主机地址。

这些选项允许您自定义EasyOCR模型连接的行为，以满足您的特定需求。

自定义

可以通过在./easyocr目录中添加自定义模型和逻辑来定制ML后端。

专为各种规模的团队设计版本比较