对于多证卡的复杂版面均有普适性

2.1 系统组成

端到端证卡识别系统的框图如图1所示。相较于以往的证卡识别算法^[6]，本文主要采用了一种更为方便普适的结构化分析方法，抛弃了如图1-A和1-B以往繁杂的模板制作、脆弱的模板匹配和繁杂的边界距离纠正，采用多任务深度学习算法，将目标检测和结构化分析融合到同一深度网络中，一举解决文本区域定位和多粒度的版面分析。具体而言本文系统按照传统OCR识别方法框架进行改进，如图1-C所示，基本分为多任务检测、文本行识别和结构化分析几个主要步骤，首先采用改进East算法^[7]获取文本四点位置、角度和所属类别，然后使用仿射变换和透射变换^[8]对文本区域进行裁剪和旋转正定变换，根据每个文本框所述类别调用现有的识别API得到高精度识别结果，最终结合文本类别和识别内容输出结构化证卡识别结果。