对于多证卡的复杂版面均有普适性
更新日期:2022-02-18     浏览次数:240
核心提示:2.1系统组成端到端证卡识别系统的框图如图1所示。相较于以往的证卡识别算法[6],本文主要采用了一种更为方便普适的结构化分析方法,抛弃了如图1-A和1-

2.1 系统组成

端到端证卡识别系统的框图如图1所示。相较于以往的证卡识别算法[6],本文主要采用了一种更为方便普适的结构化分析方法,抛弃了如图1-A和1-B以往繁杂的模板制作、脆弱的模板匹配和繁杂的边界距离纠正,采用多任务深度学习算法,将目标检测和结构化分析融合到同一深度网络中,一举解决文本区域定位和多粒度的版面分析。具体而言本文系统按照传统OCR识别方法框架进行改进,如图1-C所示,基本分为多任务检测、文本行识别和结构化分析几个主要步骤,首先采用改进East算法[7]获取文本四点位置、角度和所属类别,然后使用仿射变换和透射变换[8]对文本区域进行裁剪和旋转正定变换,根据每个文本框所述类别调用现有的识别API得到高精度识别结果,最终结合文本类别和识别内容输出结构化证卡识别结果。