NEW暗黑模式现已上线 🌓 Label Studio 1.18.0 版本发布
返回集成页面

概述

Tesseract是最古老且应用最广泛的开源光学字符识别(OCR)库之一。Label Studio可以通过其机器学习接口使用Tesseract对图像应用边界框OCR标注。

优势

将Tesseract与Label Studio集成提供以下优势:

  • 自动标注: Tesseract通过自动为文本应用边界框标签来加速OCR标注流程。
  • 交互式标注: 标注员选择目标文本,由OCR自动标注,仅针对标注员选择的文档部分进行处理。
  • 高质量标注:经过30多年的积极开发,Tesseract是最受认可且经过充分测试的OCR库之一。

相关集成

TensorFlow

开源深度学习框架

Flair

命名实体识别

Hugging Face

Label Studio 在 Hugging Face Spaces 中

LangChain

评估LLM输出质量