EasyOCR 模型连接
EasyOCR模型连接是一个强大的工具,它将EasyOCR的功能与Label Studio集成在一起。该工具旨在协助机器学习标注任务,特别是涉及光学字符识别(OCR)的任务。
该连接的主要功能是从图像中识别并提取文本,这在许多机器学习工作流程中都是关键步骤。通过自动化这一过程,EasyOCR模型连接能显著提高效率,减少手动文本提取所需的时间和精力。
在Label Studio的背景下,这种连接增强了平台的标注能力,使用户能够自动为图像中的文本生成标签。这在数据标注、文档数字化等任务中尤其有用。
开始之前
在开始之前,您必须安装Label Studio ML后端。
本教程使用easyocr
示例。
标注配置
EasyOCR模型连接可与Label Studio中默认的OCR标注配置一起使用。该配置通常涉及定义要使用的标签类型(例如文本、手写等)以及这些标签应应用的图像区域。
在设置标注配置时,选择计算机视觉 > 光学字符识别。该模板已针对OCR任务预先配置,包含用于标注图像中文本的必要元素:
<View>
<Image name="image" value="$image"/>
<Labels name="label" toName="image">
<Label value="Text" background="green"/>
<Label value="Handwriting" background="blue"/>
</Labels>
<Rectangle name="bbox" toName="image" strokeWidth="3"/>
<Polygon name="poly" toName="image" strokeWidth="3"/>
<TextArea name="transcription" toName="image"
editable="true"
perRegion="true"
required="true"
maxSubmissions="1"
rows="5"
placeholder="Recognized Text"
displayMode="region-list"
/>
</View>
警告!请注意当前EasyOCR模型连接的实现不支持直接上传至Label Studio的图片。该功能设计用于处理托管在互联网上公开可访问的图片。因此,若要使用此连接,请确保您的图片可通过URL公开访问。
使用Docker运行(推荐)
- 使用预构建的镜像在
http://localhost:9090
上启动机器学习后端:
docker-compose up
- 验证后端是否正在运行
$ curl http://localhost:9090/
{"status":"UP"}
- 在Label Studio中创建一个项目。然后从项目设置的模型页面,连接模型。默认URL是
http://localhost:9090
。
从源码构建(高级)
要从源代码构建ML后端,您需要克隆代码仓库并构建Docker镜像:
docker-compose build
不使用Docker运行(高级)
要在不使用Docker的情况下运行ML后端,您需要克隆代码库并使用pip安装所有依赖项:
python -m venv ml-backend
source ml-backend/bin/activate
pip install -r requirements.txt
然后你可以启动ML后端:
label-studio-ml start ./easyocr
EasyOCR模型连接提供了多个配置选项,可在docker-compose.yml
文件中设置:
BASIC_AUTH_USER
: 指定模型服务器的基础认证用户。BASIC_AUTH_PASS
: 指定模型服务器的基础认证密码。LOG_LEVEL
: 设置模型服务器的日志级别。WORKERS
: 指定模型服务器的工作线程数量。THREADS
: 指定模型服务器的线程数。MODEL_DIR
: 指定模型目录。LANG_LIST
: 指定OCR模型使用的语言列表,以逗号分隔(默认值:mn,en
)。SCORE_THRESHOLD
: 设置分数阈值以过滤掉噪声结果。LABEL_MAPPINGS_FILE
: 指定包含从COCO标签到自定义标签映射的文件。DEVICE
: 指定要使用的设备(cpu、cuda:0、cuda:1等)。HEIGHT_THS
: 设置框高度的最大差异。文本大小差异很大的框不应合并。LABEL_STUDIO_ACCESS_TOKEN
: 指定Label Studio的访问令牌。LABEL_STUDIO_HOST
: 指定Label Studio的主机地址。
这些选项允许您自定义EasyOCR模型连接的行为,以满足您的特定需求。
自定义
可以通过在./easyocr
目录中添加自定义模型和逻辑来定制ML后端。