概述
Tesseract是最古老且应用最广泛的开源光学字符识别(OCR)库之一。Label Studio可以通过其机器学习接口使用Tesseract对图像应用边界框OCR标注。
优势
将Tesseract与Label Studio集成提供以下优势:
- 自动标注: Tesseract通过自动为文本应用边界框标签来加速OCR标注流程。
- 交互式标注: 标注员选择目标文本,由OCR自动标注,仅针对标注员选择的文档部分进行处理。
- 高质量标注:经过30多年的积极开发,Tesseract是最受认可且经过充分测试的OCR库之一。