为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

基于字符特征的数字字符识别算法

2017-11-26 7页 doc 30KB 30阅读

用户头像

is_731942

暂无简介

举报
基于字符特征的数字字符识别算法基于字符特征的数字字符识别算法 V o l129, N o11 第 29卷第 1期海 洋 测 绘 2009年 1 月J an. , 2009 H YD RO G RA PH IC SU RV E Y IN G A N D C HA R T IG 基于字符特征的数字字符识别算法 原玉磊 ,蒋理兴 ,钦桂勤 ()解放军信息工程大学 测绘学院 ,河南 郑州 450052 摘要 : 提出了一种基于字符特征的数字字符识别算法 ,对识别过程和算法实现进行了详细介绍 。该算法避免 了细化 、轮廓提取和模板匹配等复杂的计算 ,具有计算...
基于字符特征的数字字符识别算法
基于字符特征的数字字符识别算法 V o l129, N o11 第 29卷第 1期海 洋 测 绘 2009年 1 月J an. , 2009 H YD RO G RA PH IC SU RV E Y IN G A N D C HA R T IG 基于字符特征的数字字符识别算法 原玉磊 ,蒋理兴 ,钦桂勤 ()解放军信息工程大学 测绘学院 ,河南 郑州 450052 摘要 : 提出了一种基于字符特征的数字字符识别算法 ,对识别过程和算法实现进行了详细介绍 。该算法避免 了细化 、轮廓提取和模板匹配等复杂的计算 ,具有计算简便 、实现简单的优点 。 关键词 : 数字识别 ;字符特征 ;欧拉数 ;凹陷区 ( ) 文章编号 : 167123044 200901 20056203 中图分类号 : TP751文献标识码 : B 2 预处理和识别算法 1 引 言 211 预处理 ( ) ICR 的一个数字字符识别是图像字符识别 这里进行的预处理 ,主要便于后面特征提取中 重要分支 ,在车牌号码、身份证号码 、支票号码、邮政 进行欧拉数计算和凹陷区特征的分类 。分三步 : 编码以及其他编号识别方面具有重要的实用价值和 ?对字符图像进行二值化处理 ,由于字符图像广阔的市场潜力。因此吸引了大量的研究人员进行 的前景与背景相差比较大 ,可以直接设定阈值进行 深入的研究 ,并提出了不少识别算法。在有关数字 二值化 ; (识别的大型系统中 ,数字识别都采用神经网络 B P ?使用高斯平滑滤波器进行滤波 ,去除噪声 ;) 算法 ,但这种计算量比较大 ,实现起来非常复 ?对图像进行先扩展后收缩 ,扩展的算法为 :如 杂 ,且在纯数字识别的系统中显得大刀小用 ;而很多 果邻点是 1 ,则将该点从 0变为 1;收缩的算法为 :如 纯数字识别算法需要大量的预处理运算 ,包含二值 果邻点是 0 ,则将该点从 1变为 0。对图像进行先扩 化、去噪、规整、细化、轮廓提取、模板匹配等 ,使得识 展后收缩的运算 ,可以有效地填满不希望存在的空 别的运算量大大增加 。 数字字符的识别是图像字 洞 ,这样可以避免欧拉数计算的错误。 符识别中非常简单的 212 识别算法一种 ,因为字符个数少 ,只有 10个 ,可以利用字符间 21211 欧拉数 欧拉数是一种应用广泛的对物体进不同的特征对其进行分类 ,按类型逐级识别 ,直到单 行识别的特 个字符。因此只要找出一种能将 10 个字符分别区 ,定义为连同成分数减去洞数 , E = C - H, 其中 E、征 分开的特征组合 ,就可以将数字字符识别出来 。作 C 和 H 分别为欧拉数 、连同成分数和洞数。欧拉数者根据人眼识别数字字符的过程 ,提出了一种基于 给出的图像拓扑特征具有平稳、旋转和比例不变的 图像欧拉数和字符凹陷区特征的数字字符识别算 特性 ,因此对输入图像的不高。 法。该算法只需对图像进行简单的预处理 ,就可提 根据欧拉数的不同可以将数字字符集合分为 3取特征进行识别。识别过程的框图如图 1。 个子集 :欧拉数为 - 1 的是 8; 欧拉数为 0 的有 0、4、 6、9;欧拉数为 1的有 : 1、2、3、5、7。这样缩小了识别 的范围 ,便于下一步的识别。 21212 凹陷区特征 凹陷区的定义为 : 如果连接一个图像上任意两 点的直线都属于该图像 ,那么该图像为凸图像 ;如果 连接图像上两点的直线有部分不属于图像 ,那么称 图 1 数字识别原理框图该图像为凹图像。在凹图像中 ,任意两点间的直线 中不属于图像部分所在的区域称为图像的凹陷区。 收稿日期 : 2008201211; 修回日期 : 2008 206 219 ( ) 作者简介 : 原玉磊 19842,男 ,河南卫辉人 ,硕士研究生 ,主要从事多传感器组合与集成研究 。 谓字符的左凹陷区是指任意背景点右边均可找到字根据表 1可得字符识别的算法如下 ( ) 符笔划的凹陷区 ,右凹陷区就是任意背景点左边均1 求欧拉数 可找到字符笔划的凹陷区。这样就可以将欧拉数为如果为 - 1 ,则字符为 8 ,退出 ;0 的 0、4、6、9 ,欧拉数为 1中的 1、7识别出来了 : 0、1 ( )如果为 1 ,到第 3 步 ; 没有凹陷区 , 7、9 只有左凹陷区 , 6 只有右凹陷区 , 4 ( )如果为 0 ,到第 2 步 ; 同时有左右凹陷区。字符 2 到 9的凹陷区示意图如 ( )2 求左右凹陷区 图 2 所示 ,其中蓝色的为一般的凹陷区 ,红色的为左 没有凹陷区 ,字符为 0 ,退出 ; 有左凹凹陷区 ,绿色的为右凹陷区 。 陷区 ,字符为 9 ,退出 ; 有右凹陷区 , 字符为 6 ,退出 ; 同时有左右凹陷区 , ( )字符为 4 ,退出 ; 3 求左右凹陷区 没有凹陷区 ,字符为 1 ,退出 ; 有 左凹陷区 ,字符为 7 ,退出 ; 同时 图 2 数字 2到 9的凹陷区图示( ) ( )有左右凹陷区 ,到第 4步 ; 4 判断有无右上凹陷区 这样 10 个字符中就只剩下了 2、3、5 三个字 有 ,字符为 5 ,退出 ;符 。对这三个字符的识别是在左右凹陷区的基础 无 ,看竖线与边缘交点 ;上结合上下凹陷区进行的 。对于字符 5 来说 , 从 有 4个的 ,字符为 3 ,退出 ;上往下数的最上面的凹陷区的第一行在前景的右 侧 ,可称之为右上凹陷区 ,而字符 2 和字符 3 则都 全为 2个 ,字符为 2 ,退出 ;是左上的凹陷区 。字符 2 与字符 3 可通过左凹陷 区的特征区别开 , 过左凹陷区内的点作与左凹陷 3 算法实现区左侧边缘线平行的竖线 , 这些竖线与左凹陷区 边缘交点的个数是不同的 , 字符 2 的所有竖线与 311 欧拉数的计算 边缘都只有两个交点 , 字符 3 的右面一部分竖线 由欧拉数的计算公式 : 欧拉数 =连通 与边缘线有 4 个交点 。 洞数 ,可知要计算欧拉数 ,只需求出图像的 到此 , 10 个数字字符已经全部可以识别出来 数和洞数 ,下面分别介绍计算图像连通成了。欧拉数结合凹陷区特征对字符进行识别 ,过程 数的算法。 (见表 1 凹陷区中的 1表示有 , 0 表示无 ,对已识别出 ( )1 计算连通成分数的算法 从 ) 的字符 ,不再标出其他特征 。 左至右 、从上到下扫描图像 ; 如 表 1欧拉数结合凹陷区特征进行字符识别过程果像素点为一 ,则 : 数字字符 欧拉数 左凹陷区 右凹陷区 右上 竖线交点 如果上面点或左面点有一个标记 ,则 标记 ; 0 0 0 0 如果两点有相同的标记 ,复制这一标 1 1 0 0 如果两点有不同的标记 ,则复制上点 将 2个 两个标记输入等价表中作为等价标记 ; 2 1 1 1 否则给这一个像素点分配一新的标记有 4个 3 1 1 1 标记输入等价表 ; 4 0 1 1 ( )如果考虑更多的点 ,则回到第 2 步 ; 5 1 1 1 1 在等价表的每一等价集中找到最低的 扫描图像 ,用等价表中的最低标记取6 0 0 1 价标记。 7 1 1 0 ( )2 计算图像洞数的算法 计算原图 8 - 1 像与边缘的相交处的个数 ) 为 0, 则置 N 为 1 ;9 0 1 0 对图像求反 , 即像素值为 1 的像素值 58 海洋测绘第 29 卷 0 的设为 1; 结 论4 计算求反后图像的连通成分数 M ; ()M - N 即为原图像的洞数。 作者在 M a tlab中对该算法进行了模拟 ,通过对 312 凹陷区的计算 大量字符的识别 ,证明了本算法的可行性和正确性。 对于字符图像 ,从所有背景点向上 、下 、左 、右 、 本文提出的基于欧拉数和凹陷区特征的字符识左上、右上、左下 、右下八个方向发出 8 条射线 。判 别算法 ,实际是对人脑识别系统的一种模拟。人脑 断射线是否与字符相交 ,有多少条射线与字符相交 , 在识别字符时 ,首先注意的是前景与背景的关系 ,然 ( 则该背景点的值就置为多少 ,这里设置值为 5 设为后是字符的笔画走向 。在提取出这些特征后 ,根据 ) 5 是为了便于后面凹陷区的分类 的背景点为凹陷 记忆库中的模型判断是什么字符。因此 ,本算法也 区点 ,从而得到字符图像的凹陷区矩阵 。 可用于其他的计算机识别中。 对凹陷区中的每一个点所在的图像行进行搜 索 ,其实是对凹陷区范围从上到下按行搜索。如果 参考文献 :有一个点 ,其同行的右边某一点属于前景点集 ,则该 字符图像具有左凹陷区 ;如果有一个点 ,其同行的左 1 ] [ 武 强 , 童学锋 , 季 隽. 基于人工神经网络的数字字 ( ) 符识别 [ J ]. 计算机工程与应用 , 2003, 19 14 : 112 , 边某一点属于前景点集 ,则该字符图像具有右凹陷 114. 区。由于前面设置背景点值为 5 的点集为凹陷区 , 龚才春. 刘荣兴. 基于整体特征的快速手写体数字字 [ 2 ] 所以在字符图像中不可能出现某一行凹陷区点的左 ) ( 符识别 [ J ]. 计算机工程与应用 , 2004, 19 : 82,83. 贾右都有属于前景点集的情况。 以凹陷区范围内最云得. 机器视觉 [M ]. 北京 :科学出版社 , 2000. 林小竹 , [ 3 ] 沙 芸 , 籍俊伟 , 等. 计算二维图像欧拉数的 上面一点为基准作水平线 , [ 4 ] ( ) 新公式 [ J ]. 微电子学与计算机 , 2005, 22 11 : 158 , 如果与前景的交点在凹陷区右侧 ,则该字符有右上 161. 凹陷区 ;如果与前景的交点在凹陷区左侧 ,则该字符 芮 挺 , 沈春林 , 丁 健 , 等. 独立分量重建模型的手 有左上凹陷区。同样由于设置背景点值为 5的点集 写数字字符识别 [ J ]. 计算机辅助与图形学学报 , [ 5 ] ) ( 2005, 3: 455,459. 为凹陷区 ;图像中不可能出现左右都与前景有交点 李仁良 ,高大启. 一种基于独立分量分析的数字字符识 或者都没有交点的情况 。 ) ( 别方法研究 [ J ]. 计算机工程与科学 , 2006, 2: 74,76. 求左凹陷区竖线与边缘线的交点时 ,对每一竖 [ 6 ] 申小阳 , 唐轶峻 , 姜柏军 , 等. 仪表的数字字符识别系 线按行搜索 ,如果某一行像素对应矩阵的值与上一 ) ( 统 : [ J ]. 仪表技术与传感器 , 2006, 5 55,57. [ 7 ] 行不同 ,则认为该像素是竖线与边缘的交点 ,交点个 数加一 ,直到图像最后一行 。 D ig ita l C ha rac te r R ecogn ition A lgo rithm B ased on C ha rac te r Fea tu re YUA N Y u 2le i, J IAN G L i2x ing, Q IN G u i2q in ( )Ins titu te of S u rvey ing and M app ing, Info rm a tion Eng inee ring U n ive rs ity, Zhengzhou, H enan, 450052 A b s tra c t: A d ig ita l cha rac te r recogn ition a lgo rithm is p rop osed, the p rocess of the recogn ition and the rea liza tion of the a lgo rithm is in troduced. T h is a lgo rithm is conven ien t fo r op e ra tion and s im p le fo r rea liza tion, avo id ing som e com p lica ted op e ra tion such as th inn ing, ou tlin ing and tem p la te m a tch ing. Ke y w o rd s: d ig ita l recogn ition; cha rac te r; E u le r num be r; concave f ie ld
/
本文档为【基于字符特征的数字字符识别算法】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索