票据影像交换中支票号码自动识别的实现
圜删…
?湖北民族学院理学院杨芹
为降低银行同城票据清算业务成本,进一步提高 同城票据清算效率,有效防范和化解同城票据清算风 险,确保同城票据清算资金和同城清算票据的安全,恩 施州中心支行在同城清算贷方结算凭证和部分借方清 算凭证完全截留的基础上,决定开发同城票据影像交 换系统以实施同城清算借方票据的完全截留.恩施州 同城支票影像交换系统将已通过恩施州同城票据实时 清算系统完成清算的支票,综合运行影像技术,数据
数据通信技术,将纸质支票转化为影像,实 加密技术,
现纸质支票截留,利用信息网络技术将支票影像传递 至出票人开户行作为事后查考依据的业务处理系统. 在该系统中,确保清算数据与影像的一致是关键,数据 与影像的配对也至关最要,如果完全通过人工工作量 将会很大,准确率很低.在此情形下,我们对国内OCR 技术市场进行深入的了解.
一
.
OCR的简单原理
字符识别(oct)中的算法主要有基于模板匹配的 OCR算法以及基于人工神经网络的OCR算法.基于模板 匹配的主要特点是实现简单,当字符较规整时对字符 图像的缺损,污迹干扰适应力强且识别率相当高.人民 银行恩施州中心支行科技部门在影像交换中支票号码 使用的字符识别f()CR)中的算法即是模板匹配法.
基于模板匹配的OCR的基本过程为:首先对待识 96l;oMPUTERoFHuANAN 别字符进行二值化并将其尺寸大小缩放为字符数据库 中模板的大小,然后与所有的模板进行匹配,最后选最 佳匹配作为结果.
只要识别0—9这1O个阿拉伯数字字符,无须建立庞 大的字符模板,即可以实现.支票图像(如图1所示)中 支票号码在支票右上角,由8位数字组成.要利用图像 数字的字模模板匹配法识别这8位数字图片,继而转化 为文本文字.
图1支票图像
二.票据影像支票号码识别技术实现方法
(一)建立图像数据点阵字模模板
首先要从几个支票图像中分别抠出图像(如图2所 示),通过对这10个字符图像进行必须的滤波,归一和 二值化处理,去掉芜杂的背景干扰,得出如图3所示的 l0个字符清晰图像.
需要指出的是,全国票据影像交换系统使用扫描 图2抠出的图像
图3清晰的图像
仪扫出来的图像一般大小均在1300x650像素点左右, 所以取出的10个字符图像模板需要对大小,背景等进 行设定.
(二)自动切取票据影像支票号码字符图像
确定8个字符图像框的大小后,图像框的右上定位 必须控制在(40,40,100,180)这个区域围,从而基本 解决图像框位置的定位问题.再根据定位好的图像框 范围切取8位支票号码的图像,把这8个字符图像从支 票图像中以大小为23×40的像素点分割出来,再建立8
个字符图像数据点阵.
(三)比较匹配解决图像的偏移和扭曲
通过比较查找图像模板矩阵点的和',值的最小 值,也就是说图像像素点的纵横坐标的最小值,假设比 较出的值分别为x.和y,,只要把所有图像模板矩降的 和',值统一减去对应的.和y后,图像点阵字模就全都 移动到图像的左上方向,从而顺利解决图像的偏移和 部分扭曲问题.
(四)模板匹配存在问题及解决办法
对因扫描等过程中产生的扫描图像与原始图像之 间的差异,即降质或退化,需要在图像处理之前进行 预处理,可以根据图像色质的深浅程度确定进行二值 化处理的临界值,临界值范围也是图像的灰度值范围 0-255,一般图像背景色质深的临界值就要设置小点, 对比较清晰的图像背景的临界值设为125左右. 三蔡摇影像交换支槊号码自动识别的优点 经测试,该票据影像交换支票号码自动识别方法 有以下的优点:一是尽量利用c++里面的函数库,程 序
简单易行;二是仅需识别0,9十个阿拉伯数字 字符,无须建立庞大的字符模板,模板建立简单,识 别准确率高;三是一旦把程序代码编译成动态连接库 朗辅粱春丽
用
COrn
国栏目编辑.粱春丽E—malanzI505@163?蔓 (Dynamic—LinkLibrary,DLL),就可以被应用程序或其他 DLL中调用,实现共享代码和资源.
,
厘舞曩
该功能代码精简,调用灵活,较好地解决了恩施州 同城票据影像交换中数据与影像的配对,提高了工作 效率和数据与影像的配对准确率.经测试,对200DPI 影像JPG格式文件的成功识别率达99.5%以上. 如果将此识别功能应用到票据影像事后监督,国 库退税票据核销等机打或印刷票据,录入,复核完全依 靠人工的系统,不但可大大提高工作效率,而且准确率 将会更高.
参考文献:
【1]叶俊民,汪望珠.面向对象软件
[m】.第二版.北京 清华大学出版社,2006.
【2]郑阿奇,彭作民.ViSUa1Basic.NET程序设计教程 [M].机械工业出版社,2007.
[3]郑阿奇SQLServer教程[M].北京清华大学出版社, 2005.
[4】胡胜利.动态报
在VB6.0中的设计和实现[J】.江苏 技术师范学院,2002.
[5]李占宣.数据库中面向复杂应用的查询方法[J].电脑学 习.2009.
nNA札coM职盖墓I97