2基于浅层学习的手写汉字生成
基于浅层学习的汉字生成方法通常是首先将汉字的显式特征如笔画和结构等特征提取出来,然后通过机器学习算法生成目标字体。笔画的特征提取通常有以下几个常用的属性:笔画的相对位置,笔画的长度,笔画形状等。对于汉字的层次结构通常是由基本笔画构成相应的偏旁部首再构成汉字等形式。此外,基于浅层学习的手写汉字生成工作离不开相应的算法,其中主要包括组成成分分析,小波变换,遗传算法等经典的算法。下面将详细介绍几类典型的基于浅层学习的手写汉字生成方法。
2.1通过笔画特征实现手写汉字生成
Liu和Xu等人所发表在IEEE的文章 [16]中提到的方法是首先将整个汉字分割成多个组成部分,例如笔画、部首和频繁出现的汉字等成分,然后算法提取频繁字符成分和分析研究字符多个组成部分之间的空间关系,通过模仿汉字的组成部分以及他们之间的空间关系实现手写汉字的生成,使得计算机能够自动的从一组训练样本中生成满足一定审美要求的汉字。接下来详细介绍基于提取笔画特征的方式实现手写汉字生成。
常见的汉字笔画的特征主要有测量笔画的相似性及根据汉字内部两个笔画之间的空间关系定量表示汉字的拓扑结构等。在文献[16]中测量笔画的相似性是将从汉字中分解出来的单个笔画分为24种,然后给出任意两个笔画,测量它们笔画之间的相似性。在文献[16]中采用的表示方式不仅能够描述笔画之间的空间关系,还可以表示参数化字符的拓扑结构、布局以及两个笔画相对分布长度。