周围环境等等的干扰因素都极大,所以必须要对图像进行预处理,包括去噪,目标区域要进行增强,二值化从而分离前景与背景等操作。因为很多图像中的文字区域都是倾斜的,故需进行切斜校正,对处理后的图像由于进行了二值化,所以可以大致的将文字区域和背景区域分离开,通过设定一个阈值,遍历整幅图像的像素值,累加和阈值进行比较得到大致文字区域并进行切分。
现在可以得到大致区域,但还是比较粗糙,接着进行分水岭算法,但由于分水岭算法对微弱边缘具有太好的响应,所以会造成过度切割,也就是同一个字也许被切割成了多个字,这时可以使用最大值抑制算法对刚刚分水岭算法得到的图像进行处理,设置一个置信度阈值,和此阈值进行比较,使那些置信度比较低的部分丢弃,保留置信度高的部分。接着再利用k-means聚类算法对最大值抑制后进行切割,将顽固的过度分割的部分进行合并,从而极大地提高分割的准确率,最后得到分割图像进而可以识别。