为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 基于神经树的英文字符识别技术的研究(可编辑)

基于神经树的英文字符识别技术的研究(可编辑)

2017-09-25 36页 doc 67KB 4阅读

用户头像

is_153723

暂无简介

举报
基于神经树的英文字符识别技术的研究(可编辑)基于神经树的英文字符识别技术的研究(可编辑) 基于神经树的英文字符识别技术的研究 山东师范人学硕学位论文 摘要 字符是信息交流的重要工具,如何有效的将脱机手写体字符输入计算机已经 成为国家信息化进程的一个瓶颈。字符识别是模式识别领域的重要研究方向。字 符识别技术的用途非常广泛。可用来进行文本和数据的自动阅读以及作为一种高 效快速的信息自动录入手段;它可代替人和控制器工作,自动地把字符和其他信 息进行识别后录入计算机。字符识别技术能解决大量字符的自动录入问题,有效 节约了人们从事字符录入的大量时间,并且使人们从...
基于神经树的英文字符识别技术的研究(可编辑)
基于神经树的英文字符识别技术的研究(可编辑) 基于神经树的英文字符识别技术的研究 山东师范人学硕学位论文 摘要 字符是信息交流的重要工具,如何有效的将脱机手写体字符输入计算机已经 成为国家信息化进程的一个瓶颈。字符识别是模式识别领域的重要研究方向。字 符识别技术的用途非常广泛。可用来进行文本和数据的自动阅读以及作为一种高 效快速的信息自动录入手段;它可代替人和控制器工作,自动地把字符和其他信 息进行识别后录入计算机。字符识别技术能解决大量字符的自动录入问题,有效 节约了人们从事字符录入的大量时间,并且使人们从这种繁琐的工作中解脱出 来。因为阿拉伯数字和英文字母是全世界通用的一套字符,而且在许多应用场合, 如报表、帐单、支票等,手写体很难被印刷体所替代,并且对识别的可靠性要求 极高。因此,进行脱机手写体英文字符识别技术的研究具有深远的理论意义和重 要的实用价值。字符识别过程要经过预处理、特征提取、分类识别等几个主要步 骤。预处理就是对字符图像进行二值化、平滑、细化等处理,特征提取就是提取 出能有效代表字符图像的特征。分类识别就是分类器对字符进行识别。由于 神经树的结构特征,它也具有一定的特征提取功能,在进化树结构的过程当中, 一些重要的特征作为树叶子结点会被复制传递,最终进化得到的神经树的叶子结 点就是提取到的重要特征。所以,本文采用神经树为分类器对脱机手写体英文字 母进行识别,用以进一步提高字符识别效率。 本文的研究对象是神经树识别模型设计,识别对象为特定字符集内的英文字 符个大写英文字母。主要研究工作是围绕基于神经树的手写体字符识别 技术的应用展开的。首先,本文总结了手写体字符识别的研究背景、现状及 其研究意义,其次对手写体字符图像的二值化、平滑、细化及特征提取等过程进 行了分析。再次对神经树的基本理论和基于神经树的手写体识别模型进行了研 究,重点研究了树结构的优化算法和其参数的优化算法。最后建立了一个基 于神 经树的脱机手写字母识别系统。该系统主要由预处理模块、特征提取模块和神经 树识别模块组成。主要工作包括以下两个方面: 建立了神经树识别模型, 并在环境下进行了仿真试验,对其识别效果与网络进行了比较,根据 试验结果,分析了该识别模型的性能,表明该模型提高了手写体字符的识别效率。 通过在.环境下仿真试验,搭建了基于神经树的手写体英文字符识 别系统,完成了从字符输入、预处理、特征提取、计算机识别和输出识别结果的 全过程。试验结果表明它在手写体字符识别过程中能对大量数据进行快速处理, 并达到良好的识别效果。 关键词: 手写体字符识别,预处理,特征提取,神经树,粒子群 中图分类号:山东帅范人学颁学位论文 肌, 行.砌 靠二 锄 肌.. . 印 .肌 印臼 , 骶 ,唱. 西 ,,,., , 印 . 两, 打,二 .,?, , ?, 旬 印. 如. . , , .姗 . 骶 瑚, 矽伊. 仃,; 咖黟 峭 . .. 咖 ,印 卸鲫 鲈. ,订 , ?. 叫 印 . 飙 锄 昏 眦 . . 锄 , ’. : 仃 【矽,趾 廿?眦. 虢 ’. . , 伍 . 山东师范人学颂学位论文 . , 曲仃. 锄,,., , 印. 嘶 锄锄 印 宅.: ,, , :独创声 明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其 他人已经发表或撰写过的研究成果,也不包含为获得??注:如没 有其他需要特别声明的,本栏可空或其他教育机构的学位或证书使用过的材 料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并 表示谢意。 导师签 / 学位论文作者签名:夕夸殊品 、 学位论文版权使用授权书 本学位论文作者完全了解邋有关保留、使用学位论文的规定,有权保留 并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借 阅。本 人授权趱可以将学位论文的全部或部分内容编入有关数据库进行检索,可以 采用影印、缩印或扫描等复制手段保存、汇编学位论文。保密的学位论文在 解 密后适用本授权书 导师签字 学位论文作者签名:夕々承渗 签字日期: 签字日期: 、年‘夥日 年‘月岁日山东师范大学硕:学位论文 第章绪论 .本课题的研究背景及意义 ..课题的研究背景 在当今信息技术高度发展的时代,人类越来越多地依赖计算机获取各种信 息,大量的信息处理工作也都转移到计算机上进行。现代社会的信息量空前丰富, 但其中大部分信息都以印刷体或手写体的形式进行保存和传播的,将许多纪录在 纸上的文字信息输入计算机是非常繁琐的工作。因而,如何快速高效地将这些信 息输入计算机成为了影响社会信息化进程的一个瓶颈。实现计算机的自动录入是 解决该瓶颈的关键所在。围绕这一问题人们进行了大量的研究,现在普遍采用的 技术是光学字符识别 ,技术。它是模式 识别的一个重要分支,通过输入设备将纪录在纸上的印刷体或手写体的文稿以图 像的形式输入电脑,然后识别成相应的计算机可以处理的字符的一项实用技术 【】 模式识别是在六十年代初迅速发展起来的一门学科。由于它研究的内容是如 何用机器来实现人对事物的学习、识别或判断能力,因而受到了很多科技领域研 究人员的注意,成为人工智能研究的一个重要方面。一个模式识别系统的基本职 能是对系统所要处理的模式归属哪一类作出判别,从该系统的模式输入到系 统作 出判别之间,主要包括信息、预处理、特征抽取和分类几大环节。字符识别 是模式识别领域中的一个非常活跃的分支。从年代开始,许多的研究者就在 这一研究领域开展了广泛的探索他,。字符识别从采用的设备来划分,可分为脱 机识别和联机识别,脱机字符又分为印刷体和手写体字符识别,从对书写者的要 求来分,手写字符又分为限制性和非限制性的手写体字符识别。在联机手写字符 识别中,计算机能够通过与计算机相连的手写输入社别中获取字符的笔画顺序以 及字符的形状,所以相对与脱机识别来说它更容易识别。但联机字符识别要求输 入者必须在指定设备上书写,然而人们在生活中大部分情况下无法满足这一要 求,比如人们填写各类贸易单据或开具发票等。如果需要计算机去识别这些已经 成为文字的东西,就需要用脱机字符识别。所以脱机识别应用更广泛。脱机识别 技术伴随着计算机技术的飞速发展,多年来不断改善,现在已经广泛应用于各个 领域,使大量的文档能够快速。高效地及时录入计算机,实现信息处理的电子化。 脱机手写体字符识别是的一个分支,在整个领域中,脱机手写体字符识 别是比较困难的,因为不同的人的书写方法不同。而且在实际应用中,对英文字山东师范人学硕学位论义 母及数字的识别率要求较高。 如果能通过对手写体英文字母及数字的识别技术 实现信息的自动录入,将会产生巨大的社会和经济效益。因此,手写英文字母识 别的研究有着重大的现实意义。 ..课题的研究意义 字符识别技术的用途非常广泛口川。可用来进行文本和数据的自动阅读以及 作为一种高效快速的信息自动录入手段:也可以用来阅读邮件邮编,用来实现邮 件的自动分拣;也可用于文件的自动检索;可用.束进行车辆牌照的识别;还可以 用来识别传真的签名以及身份证、支票、贸易单据等。它可代替人和控制器工作, 自动地把字符和其他信息进行识别后录入计算机。字符识别技术能解决大量字符 的自动录入问题,有效节约了人们从事字符录入的大量时间,并且使人们从这种 繁琐的工作中解脱出来。因为阿拉伯数字和英文字母是全世界通用的一套字符, 而且在许多应用场合,如报表、帐单、支票等,手写体很难被印刷体所替代,并 且对识别的可靠性要求极高。因此,进行脱机手写体英文字符识别技术的研究具 有深远的理论意义和重要的实用价值。 .字符识别的国内外研究发展及现状 早在年,德国人就试图用模板匹配的方法来识别十个印刷 体阿拉伯数字。当时,他使用了块模板对应个数字,依次把待识别的数字 投影到这块模板上,当模板透过光达到最小时数字遮挡了模板的透光部分, 投影的数字就被识别成这块模板上的数字。年等人首次利用计 算机进行光学字符识别,他们用飞点扫描器对输入模式进行扫描,并将其与存储 。 在计算机中的模式进行比较,并作出判断 最早的系统出现于世纪年代初引,它们只能识别有限字型的字符。 其中最具代表性的是,它能识别特定字体的字符。另一个具有代表性的 系统是,同一样,它也只能识别一些特定字体的字 符。另外,还有一些系统如的,,和的一等等, 他们只能识别字体非常特定的字符。由于此时期的系统只能识别有限字体字 型的字符,因而对于输入要求很高,用途并不广泛。 七十年代初,等介绍了一种抽取拓扑特征的特征抽取法以及多级结构 链接的识别方法。随后,日本对汉字识别进行了研究,主要是对印刷体汉字,手 写印刷体汉字及在线手写汉字识别的方面的研究,并于年进行了印刷体汉 字识别的公开表演引。这个时期的系统的主要特点是能够识别比较工整的手 写体字符。一个著名系统是,它利用了数字技术和模拟技术实现了这一 山东师范人学硕:学位论文 功能。第一台邮政编码自动分拣机有日本的公司研制成功,后来 也推出了自己的邮政编码自动分拣机。 八十年代以后,随着个人计算机的出现,平板式扫描仪的商品化,字符 识别技术得到了蓬勃发展。许多研究者将人工神经网络、小波变换、分形、模糊 理论、支持向量机等新技术及研究手段引入到技术的研究中,并取 得了不错的成果。此时的系统的目标是使计算机能处理更复杂的一般情况, 经过多年的研究和发展,目前,印刷体字符识别和能够借助笔画顺序特征的联机 手写体字符识别已经进入到广泛的应用阶段,已经出现了非常多的识别效果很好 的商业产品。 在我国,最早的手写体字符识别系统起源于七十年代,胡启恒院士等科技工 作者于年开始研制手写体数字识别系统,最终成功的应用于邮局的信件自 动分拣系统之中。七十年代末,复旦大学成功研制出了我国第一台印刷体字 符识 别机,该机可识别西门子打字机打印的字符。与此同时,中国科学院自动化研究 所也开展了手写数字识别的研究工作,研制了国内第一台邮政编码的识别样机。 八十年代不始,清华大学、北京大学等高校开始系统的对字符识别技术进行研究 并取得成果口。此后,字符识别的研究进入了高潮,特别是印刷体汉字识别技术 研究获得了丰硕的成果。目前,在印刷体汉字识别方面,我国有多种汉字识别产 品己被广泛使用,如“汉王、“尚书”、“清华紫光”等。其中“汉王文字识别 系列产品应用的最为广泛,“汉王系列文字识别产品从联机手写汉字输入识别 系统,发展成为手写体、印刷体、简体、繁体、数字识别及日文、韩文等多文种 的识别系统,技术水平上一直处于国际领先地位。但是识别没有限制的脱机手写 体字符,目前识别效果都不太令人满意,只能浣还处于刚刚不端阶段。 总的来说,目前国内外对手写体字符识别己达一定水平,但识别速度和识别 精度仍有待提高,故有必要进一步研究手写体识别的有关问题。 .字符识别方法 字符识别方法根据特征提取的方法、判别方法和准则以及所用的数学工具不 同,分成了种类繁多、形式特别的文字识别方法。用于文字识别的方法可以大致 分为统计模式识别、结构模式识别和人工神经网络识别纠?。 基于统计特征的字符识别方法一般选取同一类字符中共有的、相对稳定的并 且分类性能好的统计特征作为特征向量。常用的统计特征有字符二维平面的位置 特征、字符在水平或者垂直方向投影的直方图特征、矩特征和字符经过频域变换 或其它形式变换后的特征等。大量字符的统计特征经过提取、学习、分类形成关 于字符原型知识构成识别字符的模板信息,这些模板信息存储在识别系统中。未 山东师范人学硕学位论文 知图像在识别时首先提取相同的统计特征,然后与识别系统存储的字符原型知识 匹配比较,根据比较结果确定字符最终分类,达到识别的目的。 其中,基于字符像素点平面分布的识别算法,因为算法简单、实现方便的特 点而成为最常用的匹配方法。这种算法一般先将字符图像归一化为模板的几何维 数,然后根据像素点的位置逐个匹配,求出模板和图像的某种距离指标。由于要 对每个像素点逐个匹配,造成算法实现计算量大,且对噪音、字符的偏移和变形 非常敏感,因此对输入的待识别图像要求较高。根据算法的不足,不断有学者提 出改进的思路,产生了所谓序贯相似性算法。和珈在 年提出来用二维图像的投影代替图像点阵信息的思路。二维的图像被一维的投影 代替,计算量减少,同时也消除了文字在投影方向偏移的影响,但是对于字符 的旋转变形却无能为力。基于统计特征的字符识别技术对于形近字符区分能力 弱,因此,通常应用于字符的粗分类。对于识别字符集比较小、输入图像质量比 较高的图片例如打印的数字字符集也可以担当主要的识别任务。 实际应用中,更一般的情况是相近字符的识别和像手写字符那样字型变化很 大的字符的识别,因此,发展出了基于结构的字符识别技术。这种技术首先要提 取字符的结构。根据识别策略的不同,结构的选择也有所不同。可以选择字根、 笔划,也可以选择比笔划更小的笔段。提取出的结构又称作字符的子模式、部件、 基元,所有基元按照某种序排列起来就成了字符的特征。基于结构的文字识别实 际上是将字符映射到了基元组成的结构空间进行识别。识别过程是在提取基元的 基础上,利用形式语言和自动机理论,采取词法分析、树匹配、图匹配和知识推 理的方法分析字符结构的过程。常用的结构特征有:笔划的走向、孤立的点,以 及是否含有闭合笔画等。 与统计识别方法相对应,字符的结构识别技术更加便于区分字型变化大的字 符和字型相近的字符。但是由于对结构特征的描述和比较要占用大量的存储和计 算资源,因此算法在实现上相对复杂、识别速度慢。 迄今为止,人类识别文字的能力远远胜于计算机,无论是变形的字符、模糊 的字符,甚至是破损的字符,人类都能很好地识别。基于人工神经网络的字符识 别技术目的就是力图通过对人脑功能和结构的模拟来实现字符的高效识别。经过 近几年的迅速发展,人工神经网络在字符识别方面得到了广泛的应用。在 系统中,人工神经网络主要充当分类器的功能。网络的输入是字符的特征向量, 输出是字符的分类结果,即识别结果。由于识别策略的不同和对问题理解水平的 限制,输入的特征向量所包含的信息常常是冗余的,甚至是矛盾的。经过反复 学 习,神经网络可以智能地将特征向量优化,去除冗余、矛盾的信息,强化类间的 差异。其次,由于神经网络采用分布式的网络结构,本身具备可以并行的条件, 可以加快大规模问题的求解速度。 山东师范人学硕学位论文 由于人工神经网络是对生物的神经网络的一种极端的简化,以及人们对大脑 活动的认知还停留在初级阶段,人工神经网络在学习效率和算法收敛性等方面还 存在很多筮待解决的问题。 人工神经网络方法用于字符识别的研究主要包括以下几个方面: 神经网络用于特征抽取与选择:通常直接将字符点阵信息送入网络进行 学习训练,由网络抽取得到的特征不具有明显的物理含义。 神经网络用于学习训练及分类器的设计:这是目前人工神经网络在文字 识别领域的主要研究方向,也是最为成功的应用。 神经网络用于单字识别后处理。通常,用于字符识别的人工神经网络模 型有:神经网络、前向多层神经网络如算法、网络等、网 络、自组织特征映射网络、认知器模型等等。目前常用的做法是将神经网络方法 和传统的识别方法结合起来使用,互相取长补短,如先用传统的方法抽取较为稳 定的特征,然后再用神经网络进行自组织聚类学习并设计性能良好的分类器 等。 .本文主要研究内容及结构安排 本文着重研究了手写体字母识别的特征,针对传统手写体字母识别方法的复 杂性和局限性,采用了一种基于神经树算法的手写体字母识别方法,将特征 信号 构成的特征向量输入神经树进行集成分类,使用训练好的神经树进行识别。 本论文共分六章加以阐述,其结构如下: 第一章,介绍了课题研究的背景与意义、国内外研究现状、主要研究内容等, 主要包括字符识别的研究背景和现状,指出本文的主要研究内容是用灵活神 经树 算法对手写字母进行识别,在一定程度上解决了该算法中参数优化问题。 第二章,介绍了传统的字符识别的步骤,包括输入、预处理、特征提取、分 类、输出等,并详细介绍了预处理的方法。 第三章,全面介绍了各种特征提取的方法。 第四章,全面介绍了灵活神经树算法的发展和基本原理,探讨了用神经树算 法有效地解决字符识别问题的可行性。 第五章,针对神经树识别模型,在环境下进行了仿真实验。给出了 实验内容及其结果分析。并与网络识别模型进行了比较,验证了神经树算法 的有效性。 第六章,针对手写英文字母,在.环境下的编程进行了仿真实验。 给出实验环境、实验内容及其结果;并对所做的工作进行了总结,指出了本文 的 局限性和进一步研究的内容。山东师范人学硕:学位论义 第二章字符预处理技术 预处理是字符识别的重要一环,它可以把原始图像转换成识别器所能接受 的形式二值化,消除一些与类别无关的因素尺寸和位置的归一化。由于一 般都在预处理后的图像上提取特征,因此如果这个步骤结果不理想,往往会给后 面的识别环节带来无法纠正的错误。这罩我们处理的对象是在实际中可能出现的 各种风格和书写条件下的手写字母及数字,所以预处理必须在手写字母识别应用 系统设计时高度重视引。预处理主要包括灰度二值化、去噪、分割、倾斜度较正、 归一化、锐化、细化处理等过程。下面将分别介绍在预处理中必须考虑的几个过 程。 .灰度二值化 脱机手写体识别只需要处理图像中的字型信息,对颜色等信息不做处理, 所以进行二值化处理可以去掉不必要的信息,提高识别的速度。将字符彩色图片 灰度化,再把灰度图像处理成二值,或,图像的过程,称为对字符 图像的狄度二值化 。对图像二值化能显著地减小数据存储的容量,降低后续 处 理的复杂度。 设经过扫描输入电脑后的字符图像点阵为: . ,,,?:,,? 式.中,是图像中像素点在通道上的分量值。彩色图像中的每个 像素的颜色有、、三个分量决定,而每个分量有种值可取,而灰度图像 是、、三个分量相同的一种特殊的彩色图像,其一个像素点的变化范围为 种。 将彩色图像,的灰度化处理成灰度图像,可用两种方法来实现: 第一种方法使求出每个像素点的、、三个分量的平均值,然后将这个平均值 赋予给这个像素的三个分量;第二种方法是根据的颜色空间中,的分量的 物理意义是点的亮度,由该值反映亮度等级,根据和颜色空间的变化关 系可建立亮度与、、三个颜色分量的对应:...,以 这个亮度值表达图像的灰度值乜倒。 二值化图像就是再将灰度图像,进行二值化处理,就是将图像上的点的 灰度置为或,也就是将整个图像呈现出明显的黑白效果。即将个亮度 等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部 特征 的二值化图像。为了得到理想的二值图像,一般采用封闭、连通的边界。由 于字 符笔面内部有均匀一致的狄度值,使用阈值法就可以得到比较的分割效果。 字符 山东师范人学硕学位论文 灰度图像,中灰度小于阈值的像素被判定为字符笔画,灰度值置为。否 则这些像素点被认为是背景,其灰度值用表示。动态调节阈值可动态观察其 二值化图像的具体结果。 对字符图像二值化,要求二值化后的图像能忠实地再现原字符。基本要求为: 笔画中不能出现断点:二值化的笔画基本保持原来文字的结构特征; 二值化的关键在于阈值的选择,根据二值化阈值的选取可以分为三类?引: 全局阈值。全局阈值根据图像的直方图或灰度空间分布确定一个闽值, 以此实现灰度图像到二值图像的转换。典型的全局阈值方法包括方法、最 大嫡方法等全局阈值法,这些算法简单,对于背景和目标明显分离、直方图分布 呈双峰的图像分割效果良好。 局部阈值。局部阂值法是由点像素灰度值和此像素邻域的局部灰值特性 来确定像素阈值的,此法能适应较为复杂的情况,但它运算时间开销大,而且在 某些情况下会产生失真。 动态阈值陋?。动态阈值是一种自适应的二值化方法,它利用了像素自身 及其邻域狄度变化特征,能够更好地突出背景和目标的边界,分割效果好。 由于字符图像中字母与背景一般区别比较明显,且局部阈值方法和动态阈值 方法处理相应时问开销比较大,因此,在本文中采用人工整体阈值方法作为二值 化的方法。根据实验的结果或先验经验,预先给定一个固定值,就是整体阈值方 法,即根据文本图像的直方图或灰度的空间分布确定一个阈值,并根据此阈值 实现灰度文本图像到二值化文本图像的转化。灰度直方图表示的是不同灰度级的 灰度占有概率,当图像弧度直方图具有双峰形分布时,就可以自动确定阈值。 即直方图峰值法,设图像的灰度级范围为、、??,灰度级的像素数为, 灰度直方图即为灰度级的像素数与灰度的二维关系,它反映了一副图像狄度 分布的统计特性。如果灰度级直方图呈现明显的双峰状,则选取两峰之间的谷底 所对应的灰度级作为阈值。 .消除干扰 在实际图像中,干扰的存在是不可避免的。比如在邮政编码的获取中,信封 自身的底色和定位红框使获得的图像并不只是数字本身。尽管干扰通常只是很小 的一部分,但它们对归一化造成很大威胁:算此法将无法准确判定字的外接边框。 一旦归一化出现大的偏差,识别结果非常有可能出错。因此,在处理中引入干扰 消除算法非常必要引。图像去除噪声的一般要求是:尽量去除噪声而不影响字符 图像。 消除干扰即图像去噪工作也称为图像的平滑或滤波,通常去噪声用滤波的方 山东师范人学顾学位论义 法?有: 邻域平滑法:利用某一像素及其邻域像素灰度的平均值作为该中心像 素的狄度值,该方法简单但缺点明显,它使图像边界变得模糊。 保存边界平滑法:以某一像素作为正方形邻域的中心点,然后选择若 干模板,计算每个模板所含像素灰度的方差,计算方差最小的模板所含像素灰度 的平均值作为该像素的灰度值。该方法既可以达到去噪的目的,又可以同时保存 边界,但计算量庞大。 中值滤波算法:中值滤波算法的思想是首先确定一个以某像素为中心 点的邻域,一般为方形邻域,然后将邻域中的各个像素的灰度值进行排序,取其 中问值作为中心点像素灰度的新值。这里的邻域一般可以称为窗口。当窗口在图 像中上下左右进行移动后,利用中值滤波算法就可以很好地对图像进行去噪处 理,同时使得图像更加平滑。 本文在确定字形的外接边框时,做横向和纵向的投影直方图,把直方图上很 低部分作为噪声区域滤去。图.中显示出这个算法的效果。但这个步骤 也可能把属于字形的一部分笔画切除掉,见图.。为了解决这个矛盾,把 识别置信度分析引入预处理中,见图.。 囤 困 困困囤 去干扰后效呆 原绐图象 直接归一化 原始图象 直接归?化去干扰后效果 理想效果图 可能的副作用 图.、去干扰的效果 置信 图.、 置信度分析的去干扰流程山东师范人学顺学位论义 .字符分割 目前脱机手写体字符识别主要是在字符切分的基础上进行,提取出待识别字 符区域并去噪后的字符分割,就是定位找到要识别的单个字符,对每个待识 别字 符定界,将要识别的字符切分下来,以便于对单个字符的识别。字符分割的确 与否直接关系到字符识别的准确程度。但是由于字符书写时的随意性,要进 行精 确的字符分割时相当困难的。 手写体字符分割困难的主要情况有字符问的粘连、重叠和交叠。所谓粘连就 是指两个字符的轮廓线在一点或几点接触,如果能找到粘连位置,可以采用直线 或直线段将两个字符完全分开。重叠是指两个字符没有接触,属于不同的连通区, 但它们的垂直投影有重叠的情况,这种情况无法用直线将两个字符完全分开。交 叠是指两个相邻的字符不仅轮廓相接,而且共享某一个部分像素区,这种情况处 理起来较为复杂,但并不常见。此外,一个字符的左右部分如果分得太开或者字 符内部的笔画出现断裂,在切分时很容易被分割成两个或两个以上的字符,造成 切分错误。 一般地,现有字符分割的方法可分为四类瞳幻:其中第一类是基于统计方法的 切分,这种方法适用于字符宽度相差不大的场合。它根据字符的总体统计分御特 征,确定字符之间的界线。进行分割判别时以字符的平均字宽作为辅助判别,统 计分布特征的代表性和稳定性对切分的正确性及收敛性起很重要的作用;第 二类 是基于结构的切分,即从字与字之间以及汉字本身的结构入手,综合分析、寻找 切分的规则;第三类是基于识别的切分方法,即在实际切分前,对各种可能存在 的切分结果进行识别,通过对识别结果的判别来选择最终的切分点;第四类是整 体识别法,即以整个词为待识别对象,根据词的整体特征和语义来识别,以避免 切分错误对字符识别造成的损失。 由于采用单一的切分方法难于在切分字符的同时对字符问重叠、粘连、交叠 的现象进行完善处理,现在人们普遍采用多步切分法,即先将所有可能的分割点 找到,然后根据文本中内含的信息在这些点中选出真正的切分点,或补充未被发 现的切分点。 投影法是最常用的传统字符切分方法,具有速度快,实现简单的优点瞄。对 于待识别的区域,若存在多行多列字符,则首先分别对图像点阵区域行轴、 列轴方向上的进行投影,从而可以分别得到横向和纵向的投影图像,即笔 画黑像素的统计直方图。投影图像中,字符点阵区域在直方图上呈现出波峰状, 而字符间的空隙在直方图上呈现出波谷状。一般情况下,字与字之间只有个 别处 粘连,因此在垂直于字串的投影方向上具有较少的厚度,由此可以设置一定的阈 值,将局部极小投影且厚度小于阈值的位置作为候选切分点。 山东师范人学颂学位论义 连通域法也是一种应用比较普遍的字符切分方法暾。该方法首先找到字符图 像中的一点,应用中心为黑像素的模板在字符图像上逐一移动,然后以中心像素 的相邻黑像素作为模板的中心点,继续寻找相邻黑像素;如果找不到相邻的黑像 素,则算法终止,原始起点的连通域即被找寻出来。 笔画跟踪法是一种很有潜力的切分方法,该方法首先按笔画类型提取字符笔 画,定义笔画边界框为包含每个笔画的最小矩形,然后将笔画边界经过细合并、 倾斜笔画合并、重叠笔画合并以及延伸笔画合并等几种基于知识的合并操作后, 得到候选边界框嘲。这些候选边界框有些是字符的边界,有些则还仅仅是字符部 件的边界。最后采用动态规划的方法,同时考虑这些候选边界框的长宽比,决定 字符的最佳切分边界。 粘连字符的切分和过分字符的合并是字符切分中最困难的部分。一般情况 下, 字与字之间一般只有个别处粘连,因此在垂直于字串的投影方向上具有较少的厚 度,可将局部极小投影值点作为初始的候选切分点。由于字形的不同,可能出现 多个波谷,所以可以采用逐次细分的方法,逐级搜索波谷。在每一行字切分完后 需要进行一次校正:首先计算该行的平均字宽,然后逐一比较每一个字宽,计算 与平均字宽的误差。若在一定的误差范围内,则判定为切分正确,否则,判定切 分有误,需要校正。 .倾斜矫正 通常由于扫描图像采集时图像放置的位置有所倾斜或当人们在手写字母时 往往带有不同的倾斜角度,如果不进行倾斜矫正,同一字形在不同倾斜角度下的 图像将体现为不同的模板,势必加大训练负担,降低识别率。为了减弱这个因素 的影响,采用了倾斜矫正,使矫正后字的上端和下端水平位置对齐引。 图像的倾斜主要有水平倾斜和垂直倾斜两种类型嘶。因为垂直方向上的倾斜 并不是很明显,所以通常在实际系统中,对水平方向上的字符倾斜进行几何校正。 要对图像进行校正,就需要确定图像的水平倾斜角度,或者大致确定出图像的 个顶点的坐标,找到编号字符群的四条边缘线。目前常用的检测倾斜度的方法有: 重心法四 该方法通过求二值图像每一列像素的重心点,再利用最小二乘法将所有重心 点连成直线,此直线的倾角即为图像的倾斜角。该方法可简单描述如下:设目 标像素值为,背景像素值为,则一列图像由若干交替出现的连续和连续 组成,其中连续即为目标像素段。将每一目标像素段视为一个质点,像素段的 长度作为质点的重量,像素段中点的纵坐标作为质点的一维坐标:计算每一列 的重心;用最小二乘法将每列重心连成一条直线,此直线的斜率即反映了图像 山东师范人学坝学位论文 的倾斜度。 此方法的缺点在于受噪声干扰比较严重,而且对于有些字符,每一列的重心 并不反映字符纵坐标的中心,容易造成每列的重心上下跳跃,很难连成一条直线。 变换 现在一般检测图像倾斜角度的算法是变换幢引,它是利用图像特性而将 边缘像素连接起来组成区域封闭边界的一种方法。这样方法的实现是基于图像区 域存在有直线,由于图像的上下边框是一对平行线,一般会在二值化过程中转化 为一条近似的直线,利用变换找到这条直线,通过这条直线的信息来寻找 倾斜度,倾斜度的大小就是这条直线与水平线的央角。 利用变换求倾斜角的优点在于它受噪声和曲线间断的影响较小,在求 出倾斜角的同时达到了提取图像四条边框的效果,这对于下一步的字符分割是极 为有利的,但是这种方法也存在着缺点,主要表现在:首先,不容易找到 变换的起点,即图像边缘的拐点:其次,算法的复杂度比较大,在检测直线的过 程中比较耗时:最后,准确性不能保证,由于二值化的影响,不能保证所有的边 缘部分二值化之后的值都是一样的,从而经过曲变换之后的直线的准确性也 值得怀疑。 .字符归一化 为了便于后面的字符特征提取的顺利完成,需要对分割出来的字符进行归一 化处理。字符归一化的目的就是把识别字符变换成统一大小,文字位置通过旋转, 平移得到纠正。字符的归一化主要有位置归一化,大小归一化以及笔划粗细归一 化三种 。归一化是预处理中非常重要的一环,由于原始图像在大小方面存在着 很大的差异,必须进行归一化处理,使其具有相同的大小,以利于特征提取和识 别的进行。 ..位置归一化 为了消除字符点阵位置上的偏差,需要把整个字符点阵图形移动到规定的位 置上,这个过程就叫位置归一化啪。字符图像的位置归一化方法主要有两种:一 种基于重心,即重心归一化,另一种基于字符外框化,即外形归一化。基于重心 的位置归一化方法首先计算字符的重心,然后把重心移到字符点阵的指定位置 上,即重心归一化后字符的中心位于点阵中心。基于字符外边框的位置归一化方 法首先计算字符的外边框,找出中心,然后把字符中心移到指定位置上,即外形 归一化后字符的外形位于点阵的规定位置上。由于质心计算是全局性的,因此抗 于扰能力强,各边框搜索是局部性的,易受干扰影响。大多数字字符笔划分布左东师范人学硕学位论义 右上下比较均匀,字符的中心和字符字形的中心相差不多,基于质心的归一化方 法不会造成字形失真。 ..大小归一化 对不同大小的字符作变换,使之成为同一尺寸大小的字符,这个过程被称为 大小归一化。其目的是为了消除字符大小对识别造成的影响,便于在识别中确定 判据和准则。经过大小归一化后,字符点阵的外形大小一致。 常用的大小归一化方法凹有两种:一种是将字符的外接边框按比例线性放大 或缩小成为规定尺寸的文字。另一种是根据水平和垂直两个方向文字黑像素的分 布进行大小一化。 数字图像大小归一化算法的关键在于找出大小因子,归一化的方法通常可分 为两类:基于特征的归一化方法和基于像素的归一化方法。基于特征的归一化方 法是根据需要归一化图像的重要相同特征之问的几何关系确定归一化变化因子, 因此这类方法首先必须提取特征,如角、点、曲率和边等:基于像素的归一化方 法常常根据需要归一化图像的变换,相关函数,或者各阶力矩之间的关 系来确定归一化变化因子。 .锐化 字符锐化的目的是使模糊的字符变得清晰乜。通常计对引起字符图像模糊的 原因而进行相应地锐化操作属于图像复原的内容。从频谱角度来分析,字符图像 模糊的实质是其高频分量被衰减,因而可以通过高通滤波操作来使图像清晰。需 要注意的是,能够进行锐化处理的图像必须要有比较高的信噪比,否则锐化后图 像信噪比反而更低,从而使噪声的增加比信号还要多,因此一般的做法是先去除 噪声后再进行锐化处理。图像锐化的方法很多,有微分法、高通滤波法和掩模法 等等。 .笔画粗细的调整 由于用力大小的不同,书写工具的不同或扫描条件的差异引。同一字形的笔 画可能体现为不同的粗细,为了消除这种影响,一种可能的途径是通过细化提取 骨架。细化就是将二值化的文字点阵逐层剥去边缘轮廓上的点,变成笔画宽度只 为的文字骨架图形。它既是压缩冗余信息的需要,又是对模式进行结构分析的 需要,是字符识别预处理的一个十分重要的环节。字符细化的基本要求如下:要 保留原有字符笔划的连续性,不能使本来连续的笔划断不;细化最后的结果要为 山东师范人学顾学位论文 单线,即笔划宽度只有一个像素;细化后的骨架应尽量接近原来笔划的中心线; 要保持文字原有拓扑、几何特征,不能造成严重的畸变,特别是一些明显的拐角 不应被光滑掉。 在脱机手写体字符识别系统中,字符的字形变化幅度大、粗细不一,给识别 带来了许多困难。因此采用细化方法使得字符图像的粗细归一化是一个十分重要 的预处理步骤。因为细化后的骨架包含了字符图像特征的最本质数字化信息,能 对字符图像进行有效地描述。所以对于手写体字符的细化,一方面要求去除多余 的象素,一方面又要保留字符的基本结构和特征,防止造成字符笔划的断裂、误 连接等失真情况?。。迄今为止.已有很多细化算法产生,大致可归纳为迭代算法 和非迭代算法两大类。这些算法各有优缺点,适用于不同领域。常用的细化算法 是索引表细化算法、经典细化算法、快速并行细化算法、细化 算法、细化算法和细化算法等。 但细化会带来一系列副作用:信息丢失,产生伪笔画等,而且由于细化一般 通过反复扫描完成,速度较慢。 细化算法“羽 细化算法适用于输入图像为和的二值图像。像素值为的区 域是需要细化的部分,象素值为的区域是背景。 细化算法可描述如 下: 设为被检测的像素,为像素的灰度值,以,,,?,为的 领域像素,%的位置如图.所示: ‰ 他 刀 传 胛 耽 忾 傀 图.像素的的邻域 设集合表示需要细化的像素子集,集合 ??表示背景 像素子集,集合一表示在第次减薄时,中被减掉的像素。 图像细化的减薄条件为: ? ?,其中。。,这里,。为 以,:篮?. 山东师范人学琢学位站立 ?,其中?卜珥 , ?,其中矿力? 这里, 为 :贬 ,其中叫,:主岛,这罩,为 :盘黧“,慨“?州%“刖 ,吩月或耳,,,其中‘表示对的第个邻域像素 剐。 的细化效果见图.所示。 细化后 细化前 图. 鼢细化算法的细化效果 .本章小结 本章从典型的字符识别处理方法出发,分别讨论了图像灰度二值化,图像消 除干扰、倾斜校正,字符锐化、字符细化等算法,结合自己的方法实现了本章涉 及到的字符识别预处理,并字符倾斜校正算法、笔画粗细的调整算法进行了改进。 最终实现字符的预处理,将其保存以用于接下来的字符识别。山东师范人学硕学位论史 第三章特征提取 字符识别是模式识别中一类。模式识别的任务就是根据选择好的特征在 维空间对模式进行分类。很明显,这些特征的提取和选择对识别过程是至关重要 的。如果模式特征选择得好,对不同类的模式就能表现出很大的差别,就能比 较 容易地设计出性能较高的分类器。因此特征提取和选择会直接影响到分类器的构 造和识别的效果。特征提取的目标是找到某种变换,将维或术维的模式类别 空间转换到维数小得多的维特征空间,并同时保留模式识别所需要的大部分信 息。通过特征提取,模式分类可以在维数低得多的空间上进行,从而降低了计算 的复杂度啪。而且,对给定的训练进行特征提取可以获得更精确的分类函数 的描述,以构造更可靠的分类规则。 同样对于手写字符的识别,特征提取可以降低字符信息量、去除无用的冗 余信息,提高识别系统效率,一直是字符识别领域中的关键点。手写体字符的识 别中,常用的特征有结构特征和统计特征。结构特征和统计特征各有其优点:结 构特征能描述字符的结构,对于不同人书写的字符,形体不同,但结构都是一致 的,所以结构特征能克服手写字体因人而引起的畸变;统计特征最大的优点是对 环境噪音不敏感,如若字符的背景噪音通常都是呈高斯分布,用统计特征进行识 别可对此影响忽略不计。 和其他类模式识别一样,手写体字符的特征提取极大程度地影响着分类器 的设计和性能,以及识别的效果和效率。为了保证所要求的分类识别的正确率和 节省资源,希望依据最少的特征达到所要求的分类识别的诈确率,脱机手写体字 符识别时选择的字符特征,应当尽可能满足如下特征提取的原则?引: 字符特征应当能有效反映汉字字符的基本特征,而与字符的位置,与 书写者的书写字符的习惯等无关; 字符特征应当尽量少且简单,尽量减少计算机运算量,加快特征提取 速度; 字符各个特征之间的相关性应当尽可能小; 字符特征应当具有较好的抗干扰能力。 总的来说,对于字符特征的提取,既要使特征易于提取和选择,又要使选 择出来的特征能保证分类的质量,由于特征提取的作用如此关键,就使得特征的 提取和选择成为模式识别的最重要的任务之一,也就成为字符识别过程中最重要 的一个环节之一。 目前对于字符信息提出和使用的特征主要有:点特征、线特征、方向特征、 投影特征、长度特征、面积特征、笔画特征、偏旁部首特征、水平切割特征、边 缘笔画特征、外接同心圆结构特征、上下和左右轮廓特征、密度特征、模糊特征、 山东帅范人学硕学位论义 弹性网格方向分解特征、网格象素概率分布特征、梯度特征、基元矢量与基元之 间的位置关系以及基元长度矢量特征、应用小波变换及弹性网格技术提取的特 征、子块特征、利用各种变换后的字符图像宽度、交叉点、链码等提取的特征、 加权特征点与拐点特征、字符字段和非均匀网络结构浓度特征等等。按使用特征 的不同,大体可以分为结构特征和统计特征两大类,此外将这两种特征进行融合 也是当前的趋势,下面将分别对这三方面进行介绍。 .结构特征 结构特征则是对字符的笔画进行分析得到的,能更好地区分局部细节,一 般包括圈、端点、交叉点、笔画、轮廓等等。结构特征是字符结构的一种模型化 的直接反映。采用结构特征进行字符识别的基本思路是:先抽取笔段或基本笔画 作为结构特征基元,由这些基元再构成部件,由部件的组合来描述字符,最后再 利用形式语言及自动机理论进行识别。在字符识别中用的比较多的结构特征 如下 引. ? ?笔道密度函数 笔道密度函数是指沿某一方向切割字符时交截笔划的次数。其优点是无需 进行细化处理。例如,的数字“”的横向笔道密度函数和纵向笔道密 度函数分别为?,?,.??和?,?,?,其中具体的和 的个数由数字的大小和笔划宽度决定。将函数中相同的项合并起来,则该数 字“ 的横向和纵向笔道密度函数都可以简化为,,’称之为规格化笔道密度。这正 是数字“在拓扑结构上的对称性的具体表现。 ?空洞和缺口 空洞和缺口是字母和数字非常重要的结构特征。字母“川‘“”和数字 “、“、“’’、“”等有明显的空洞。“、“”、“、“、“”等则有明显 的缺口。在判断这些数字时采用这类结构特征是快速有效的。 ?节点特征 节点特征是一种重要的结构特征,它是指笔划的端点、叉点多个笔划相交 的点、拐点有明显书写方向变化的点等。其中,端点反映了字符笔划的起点 和终点信息。常用于字母识别的点特征值有字母字符的端点、拐点、三节点、 四 节点、折点的个数与位置、横向切割交点序列、纵向切割交点序列等。这里 三节 点是指当前点周围有条线与之相连,四节点是指当前点周围有条线与之相连。 在字符细化后是很容易得到点特征的。某点,的交点数由下式计算: . 去?一辟。 东师范人学形:学位论文 其中。,,为点的个相邻点的像素值, 。?,。 时,该点为端点; 时,该点为三节点; 时,该点为四节点。 通过计算字符局部区域内的点特征,可以得到字符的局部点特征。局部点 特征在对相似的字符进行细分类时非常有效。相对来说,拐点的提取比叉点提取 复杂,最经典的方法是多边形近似法。即先提取笔划的两端点,然后根据每一点 到两端点所连直线的距离大小来确定该点是否为拐点。此外,也可以根据该点邻 域的书写方向变化率来对拐点位置进行简单的判断。 ?浮动模板特征 所谓浮动模板实际上就是一系列具有特定位置关系的像素集合。使用浮动 模板时,将模板按所要检测的方向顺着图像边缘移动,通过模板是否能与图 像边 缘重合来取值。浮动模板特征主要用于对相似模式的细分。 ?笔划及笔段特征 笔划及笔段特征的提取通常是在字符细化的基础上进行的。这些提取一般 都是从笔划的端点或叉点等特征点不始,沿某一方向跟踪直至遇上另一特征点为 止。跟踪所得的结果为一个子笔段。由于每次只沿一个方向跟踪,因而跟踪过程 比较简单。但是因为细化方法本身的局限性,提取的某些特征点不可避免地存在 错误。如把一个四叉点分成两个三叉点等。这类错误相应地造成了笔划段断裂, 因而需根据笔段连续性等先验知识对跟踪的结果进行合并。 基于结构的识别方法目前比较少见,因为它的识别率与识别速度都不如基 于统计的识别方法。主要原因有:它对噪声相当敏感;难以从大图像中正确分离 出具有确定含义的部分;手写字符变化很大,难以找出其独有的特征。对这些缺 陷,也有相应的弥补方法,如对于麻点噪声,可以通过大小、拓扑结构等几何特 征有效地消除。对于粘连、断开,也可以通过几何特征区分,但难以保证正确识 别,一旦分类错误,会导致之后的操作作废,或走入歧途。如果拒绝识别,可以 重新尝试,如果误识,可以通过分析加以矫正,但这种矫下有其局限性。 。统计特征 字符的统计模式识别是将字符点阵看作一个整体,其所用的特征是从这个 整体上经过大量的统计而得到的。也可以说统计模式识别方法是对大量的样本计 算它们的统计特征的分布,构造分类器,依此进行判别。判别的核心模块是统计 特征的抽取和分类。用于脱机手写字符别的统计特征,根据特征抽取区域的不同 又可粗略地分为全局统计特征和局部统计特征两大类。全局统计特征是将整个字 山东师范人学硕:学讧沦义 符点阵作为研究对象,从整体上抽取特征;局部统计特征是将字符点阵图象分割 成不同区域或网格,在各个小区域内分别抽取统计特征。常见的统计特征是下面 的一些特征‘九: ?外围特征 字符的轮廓包含了丰富的特征,即使在字符内部笔划粘连的情况下,轮廓 部分的信息也还是比较完整的。这种特征非常适合于作为粗分类的特征,但细分 的能力不强。 ?宽度特征 宽度特征分为全局宽度特征和局部宽度特征。我们从字符点阵的左右两个 方向分别扫描字符,将每一行分别碰到的非背景像紊记为和,则字符 的宽度为一。通过判断字符宽度小于某个闽值的行数所占总行数 的比例来对该特征加以取值,这样就得到了全局宽度特征。局部宽度特征则 是看 宽度小于某一阈值的行所占某一部分的比例。 ?跳变特征 跳变特征是指字符的边缘发生不连续变化所表现出来的一种特征。通过对 相邻两行或者两列进行比较,若变化大于某一阂值,则发生跳变。跳变特征又 可分为左右跳变特征。 ?交截特征 交截特征是指某一行背景像素与目标像素交替出现的次数。交截特征可分 为横向交截特征和纵向交截特征。 ?变换特征 变换特征是指对图像进行某种变换,如? 变换, 变换,小波变换等对字符点阵进行变换。由于手写体字符的变化较大, 因此变换特征不是很适用。 ?几何矩特征 .. 提出利用矩不变量作为特征的想法,引起了研究矩的热潮。研究人 员又确定了数十个移不变、比例不变的矩,如矩、矩等。人们都希 望找到稳定可靠的、对各种干扰适应能力很强的特征,在几何矩方面的研究下反 映了这一愿望。以上所涉及到的几何矩均在线性变换下保持不变。但在实际环境 中,很难保证线性变换这一前提条件。 ?笔划密度特征 笔划密度的描述有许多种,一般认为字符笔划密度特征是指:在字符图像 的某一特定范围内,以固定扫描次数沿水平、垂直或对角线方向扫描时的穿透次 数。这种特征描述了印刷体字符的各部分笔划的疏密程度,为识别工作提供了比 较完整的信息。在图像质量可以保证的情况下,这种特征相当稳定,适合于脱机 山东师范人学硕:学位论文 手写体字符的识别。 此外,还有特征点特征,微
/
本文档为【基于神经树的英文字符识别技术的研究(可编辑)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索