OCR

OCR(Optical Character Recognition,光学字符识别)任务旨在将图像中的文本转换为可编辑的文本形式。该任务会定位到图像中文本的位置,并将其识别出来。

表 183 OCR 模型介绍

预置模型

模型特点

abcnet_resnet50

ABCNet 是一种用于文字检测与识别的端到端模型。它通过参数化的贝塞尔曲

线来拟合任意形状的文本,同时设计了一种新颖的特征对齐层 BezierAlign 来

对齐文本实例内部的特征。该方法具有良好的精度,并可以实现实时推理。

该模型使用 resnet50 作为 backbone 提取图像特征。