为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

消除手写汉字的毛刺及毛刺粘连

2018-04-05 7页 doc 60KB 32阅读

用户头像

is_281650

暂无简介

举报
消除手写汉字的毛刺及毛刺粘连消除手写汉字的毛刺及毛刺粘连 Vol . 23 No . 2 第 23 卷 第 2 期南 京 理 工 大 学 学 报 Ap r . 1999 Journal of Nanj ing Un iversity of Sc ience and Technology 1999 年 4 月 Ξ 消除手写汉字的毛刺及毛刺粘连 ΞΞ 薛炳如杨静宇娄震胡钟山 () 南京理工大学计算机科学与技术系 ,南京 210094 摘要 在手写汉字中 ,毛刺是常见的噪声之一 ,笔划间的毛刺还经常出现粘连现 象 ,这些粘连严重影响了基于轮廓和骨架的特征提...
消除手写汉字的毛刺及毛刺粘连
消除手写汉字的毛刺及毛刺粘连 Vol . 23 No . 2 第 23 卷 第 2 期南 京 理 工 大 学 学 报 Ap r . 1999 Journal of Nanj ing Un iversity of Sc ience and Technology 1999 年 4 月 Ξ 消除手写汉字的毛刺及毛刺粘连 ΞΞ 薛炳如杨静宇娄震胡钟山 () 南京理工大学计算机科学与技术系 ,南京 210094 摘要 在手写汉字中 ,毛刺是常见的噪声之一 ,笔划间的毛刺还经常出现粘连现 象 ,这些粘连严重影响了基于轮廓和骨架的特征提取 ,从而影响手写汉字的识别 率 。该文通过定义边缘端点 、边缘歧点和边缘直角点 ,提出了一种迭代算法消除毛 刺以及毛刺粘连 。实验明 ,该算法是稳定的 ,并且行之有效 。 关键词 图像清晰化处理 ,字问题 ,边缘 ,识别 ,消法 ;手写体汉字 分类号 O 35712 ,O 在手写汉字中 ,毛刺是常见的现象 ,毛刺的成因有很多 ,对于无底纹的纸张 ,毛刺形成的主要原因是墨水的渗透以及书写者的连笔书写习惯 ,而对于有底纹的纸张 ,底纹也是毛刺形 成的一个重要原因 。笔划之间的毛刺还经常出现粘连 ,图 1 示出手写汉字的毛刺以及笔划 () ( ) () 间的毛刺粘连 ,其中 a是在无底纹纸张上书写的汉字 ,而 b是在有底纹 水平细线纸张上 书写的汉字 。目前虽有众多研究者从事手写汉字识别的研究 ,但没有考虑毛刺噪声的存在 , ( ) 本文提出一种消除毛刺噪声的算法 。在图 1 a中 ,笔 ( ) 划间的毛刺多处出现粘连 ,而在图 1 b中 ,有些毛刺 没有和汉字笔划连接 ,即存在孤立的毛刺 。由于毛刺 以及笔划间的毛刺粘连严重影响了手写汉字的轮廓 和骨架 ,而基于轮廓和骨架的许多特征又是汉字识别 ()( )a b 1 ,3 中结构的重要组成部分,因此如何有效消除 1 手写汉字的毛刺及毛刺粘连图 这些毛刺以及毛刺粘连成为手写体汉字识别中预处 Fig11 Glitch and glitch join in 理的重要任务之一 。本文基于二值图象通过定义边 handw riting Chinese characters 缘端点 、边缘歧点和边缘直角点 ,提出了一种迭代算 法 ,该算法可以有效地消除上述的毛刺以及笔划间的毛刺粘连 ,并给出实验结果及结论 。1 定义及算法 ( ) ( ) 在下述讨论中 , 假定 : 120 , 前景即汉 图象为二值图象 ; 图象的背景为白象素 , 值为 ( ) 字为黑象素 , 值为 1 ; 3在 3 ×3 窗口中的象素如图 2 所示 , 象素 x , x , , x 称为象素 p 1 2 8 Ξ 本文于 1998 年 6 月 3 日 收到 ΞΞ 薛炳如 男 31 岁 博士生 [ 4 ] ( ) 的 8 - 邻居 , 并以集合 N p表示 , 它们和象素 p 是 8 - 近邻的 ;x x x 432 象素 x , x , x , x 称为象素 p 的 4 - 邻居 , 它们和象素 p 是 4 -1 3 5 7 x x p 51 ( ) ( ) 近邻的 。象素 p 的 8 - 邻居中的黑象素和用 bp bp表示 , 8 8 x x x 6788 ( ) = x , 类似的 , 象素 p 的 4 - 邻居中的黑象素和用 bp 表 i 4 6 图 2 3 ×3 窗口中i = 1 4 ( )的象素集合 N p( ( ) ) 示 , bp= x ; 4汉字的边缘为 8 - 连接的 , 即任意 2 个4 6 2 i - 1 ( )Fig12 Pixel set N P i = 1 相邻的边缘象素都是 8 - 近邻的 。 in 3 ×3 window ( ) 很显然 , 如果象素 p 满足如下 2 个条件 , 则它是 8 - 连接的边缘象素 : 1象素 p 为黑 ) ( ) ( 象素 ; 2象素 p 的 4 - 邻居中至少有一个为白象素 , 即 bp?3 。4 ( ) 若 p 是黑象素 , 且 p 至多有 1 个 4 - 近邻的黑象素 , 即 bp?1 , 则 p 是边缘定义 1 4 端点 。 定义 2 若 p 是边缘象素 , 且 p 至少有 3 个 8 - 近邻的边缘象素 , 则 p 是边缘歧点 。 定义 3 若 p 是边缘象素 , 且 p 有且仅有 2 个 4 - 近邻的边缘象素 , 并且该两象素是 8 - 近邻的 , 则 p 是边缘直角点 , 如图 3 所示 。 x x x x x x x x x x 1 1 4242432432 x x x x p 1 1 p 1 p p 1 5115 x x x x x x x x x x 1 1 6786786868 图 3 边缘直角点 Fig. 3 Rectangular edge point 图 3 中 , 若 p 为边缘象素且图中的黑象素也是边缘象素 , 则 p 为边缘直角点 。显见 , 边 缘直角点的 2 个 4 - 近邻边缘象素不是边缘歧点就是边缘端点 。 ( 通过观察发现 , 手写汉字中的毛刺的宽度通常都小于 4 个象素 宽度大于等于 4 个象素 ) 的可认为是笔划。因此 , 基于上述的 3 个定义 , 得出了这样的结论 :对于一个象素宽的毛 刺 , 如果没有粘连 , 则至少存在一个边缘端点 , 如果出现粘连 , 则至少存在 2 个边缘歧点 ; 对 于 2 个象素宽的毛刺 , 不管是否出现粘连 , 既是边缘歧点又是边缘直角点 。根据这个结论 , 对于一个象素宽的毛刺 , 只要迭代地删除边缘端点就能删除它们 ; 对于一个象素宽的毛刺粘 连 , 删除掉一个边缘歧点后就成为不粘连的毛刺 ; 对于 2 个象素宽的毛刺 , 不管是否出现粘 连 , 由于其既是边缘歧点又是边缘直角点 , 因此可以一次性并行地删除它们 。对于 3 个象素 宽不粘连的毛刺 , 删除掉 2 个边缘直角点后出现一个边缘端点 , 再删除掉新出现的边缘端点后又出现 2 个新的边缘直角点 , 如此循环迭代即可删除掉该类毛刺 。在算法中 , 由于删除一 个边缘歧点或边缘直角点可能导致新的边缘端点 、边缘歧点和边缘直角点出现 , 因此算法要 ( ) 算法开始 ;迭代进行 。消除手写汉字的毛刺及笔划间的毛刺粘连的完整算法描述如下 : 1( ) ( ) ( ) ( ) 2迭代删除边缘端点 ; 3边缘检测 ; 4删除边缘直角点 ; 5如果至少删除了一个边缘 ( ) ( ) ( ) 直角点 , 则转到 3, 否则继续 ; 6删除边缘歧点 ; 7如果至少删除了一个边缘歧点则转 ( ) ( ) 到 2, 否则算法结束; 8算法结束 。 薛炳如 杨静宇 娄 震 胡钟山 消除手写汉字的毛刺及毛刺粘连总第 104 期143 ( ( ) ( ) ) 从步骤 3到 5是为了删除 2 个象素宽的笔刺 ; 另外 , 由于边缘直角点的 2 个 4 - 近邻边 缘象素可能是边缘歧点 , 因此在删除边缘歧点之前先删除边缘直角点 。 2 实验及结论 因算法的终止条件是不存在边缘歧点和边缘直角点 , 边缘端点又在循环体内被迭代删 除 , 故经过算法处理后 , 手写汉字的毛刺及毛刺粘连被完全消除 。图 4 示出部分实验结果 。 ( ) a未经算法处理过的手写汉字 ( ) b消除毛刺后的结果 图 4 实验结果 Fig. 4 Experiment result s ( 在笔者自建的手写汉字库 部分样本采自无底纹的纸张 ,部分样本采自有水平底纹的 ) 支票 ,扫描分辨率为 200 dpi中 ,所有毛刺无一例外地被上述算法消除 。实验结果表明 ,本 算法可有效地消除手写汉字的毛刺及毛刺粘连 。经算法处理后的手写汉字由于不存在边缘 端点和边缘歧点 ,故提取轮廓的轮廓跟踪算法变得极其简单 ,不再需要回溯即能正确抽取出 轮廓 ,这一点非常引人 。本算法的局限性是必须保证手写汉字的笔划具有至少 4 个象素的 宽度 ,否则部分笔划可能会被当作毛刺消除掉 ,这个问题可以通过提高分辨率得到解决 。 参 考文献 1 Mori S , Suen C Y , Yamamoto K. Historical review of OCR research and develop ment . Proc I EEE , 1992 ,80 :1 029,1 058 Hilderbrandt T H ,Liu W T. Op tical recognitio n of handwrit ten Chinese characters : advances since 2 () 1980 . Pat tern Recognitio n , 1993 , 26 2:205,225 Φ Trier D ,J ain A K , Taxt T. Feat ure ext ractio n met hods for character recognitio n —a survey. 3 () Pat tern Recognitio n , 1996 ,29 4:641,662 L am L ,L ee S W , Suen C Y. Thinning met hodologies — a co mp rehensive survey. I EEE Trans4 Pat tern Anal Mach Intell ,1992 , 14 :869,885 El iminate Gl itch and Gl itch Join in Handwriting Chinese Characters Xue Bi ngru Yang J i ngyu Lo u Zheng Hu Zho ngshan ( )School of Co mp uter Sciences and Technology ,N U S T ,Nanjing 210094 ABSTRACT Glitch is a co mmo n kind of noise in handw riting Chinese characters. Glitches be2 t ween st ro kes always join toget her , w hich can serio usly affect t ho se feat ures ext racted f ro m co nto ur and skeleto n ,t hus affecting t he recognitio n rate . Based o n t he definitio ns of edge end point , edge fo r k point and rectangular edge point ,an iterative algo rit hm is p ropo sed to eliminate glitches and glitch joins in handw riting Chinese characters in t his paper . Experiment s show t hat t he algo rit hm is stable and effective . KEY WO RDS sharp p rocessing of image ,wo rd p ro blems ,edge ,recognitio n ,eliminatio n ; hand2 w riting Chinese character () 上接第 140 页 The Signal Processing of Ra dar Moving Targets Using Polynomial Wigner2ville Distribution Cheng Zhifeng So ng Yaoliang Shi Xiangquan ( )School of Elect ro nic Engineering and Op toelect ro nic Technology ,N U S T , Nanjing 210094 ABSTRACT The general mat hematical mo del fo r moving target s is established by using poly2 ( ) no mial exp ressio n . Polyno mial Wigner2Ville Dist ributio n PWVD is int ro duced to analyze moving target s in time - f requency rep resentatio n . The t heo retical analysis and co mp uter simu2 latio n show t hat PWVD can overco me t he nat ural limitatio n of quadratic WVD in rep resenting t he moving target s and t hat it is p ractical . KEY WO RDS signal p rocessing , radar echo , radar target s ; spect ral analysis , time2f requency analysis ?简讯? 高技术弹药研制取得突破性进展 日前 ,兵总科技局给我校发来了贺信 ,对我校参加研制的高技术弹药所取得的成绩表示祝贺 。贺信中说 ,我校参研的国防重点项目经过首次试验 ,取得了突破性进展 ,这标志着我国高技术弹药的研究工作经 科研人员 10 多年的辛勤劳动 ,走通了整个原理 ,向型号科研和装备部队迈出了坚实的一步 ,使我国高技术 弹药发展进入了一个崭新的阶段 。
/
本文档为【消除手写汉字的毛刺及毛刺粘连】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索