为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

导航电子地图中的语音匹配与模式识别

2018-02-01 10页 doc 26KB 54阅读

用户头像

is_995397

暂无简介

举报
导航电子地图中的语音匹配与模式识别导航电子地图中的语音匹配与模式识别 摘要 GPS是全球卫星定位系统的简称。GPS导航定位技术以其高精度、全天候、高效率、多功能、操作简便等特点已经在测绘、交通、城建、国土资源管理等各个领域得到了广泛的应用。它的平面相对定位精度已经完全能够满足工程的需要,因此,GPS被广泛的应用于工程测量的各个领域。 隧道控制网布设常规方法受到通视条件、图形条件、地形条件等诸多因素的影响,从而使控制网的选点、布网及观测等诸多过程受到限制。随着隧道建设技术以及施工工艺越来越先进,隧道建设地点周围的地理环境又极为复杂,传统经典的测量手段己经很...
导航电子地图中的语音匹配与模式识别
导航电子地图中的语音匹配与模式识别 摘要 GPS是全球卫星定位系统的简称。GPS导航定位技术以其高精度、全天候、高效率、多功能、操作简便等特点已经在测绘、交通、城建、国土资源管理等各个领域得到了广泛的应用。它的平面相对定位精度已经完全能够满足工程的需要,因此,GPS被广泛的应用于工程测量的各个领域。 隧道控制网布设常规方法受到通视条件、图形条件、地形条件等诸多因素的影响,从而使控制网的选点、布网及观测等诸多过程受到限制。随着隧道建设技术以及施工越来越先进,隧道建设地点周围的地理环境又极为复杂,传统经典的测量手段己经很难满足隧道建设的需要。GPS技术的迅速发展,为GPS测量在隧道控制测量中提供了广阔的应用前景。本文结合GPS定位测量的各种优点,将GPS相对定位技术引入隧道控制网的测量,无论对GPS技术本身的发展还是对隧道测量控制都具有极为重要的意义。 本文主要就GPS技术在隧道测量控制的应用进行了研究。从GPS基本原理出发,论述了GPS隧道控制网的布设,特别对隧道控制网、选点、布设以及精度做了详细的论述。文章还简要介绍GPS数据处理的方法和流程,并同过TGO测量软件对测量数据进行了解算,得到了符合要求的测量结果。 文章分为五个部分。第一章绪论简要介绍了GPS系统。第二章介绍了GPS的原理与方法以及误差来源。第三章主要介绍了GPS隧道控制网的布设方法。第四章结合工程实例讲述GPS隧道控制网的测设以及数据处理,通过实例来验证GPS在隧道平面控制测量中应用的可靠性,展现了GPS技术在大型隧道控制测量方面应用的广阔前景。第五章对全文进行了总结。 关键词:GPS;隧道;控制网;误差;平差 导航电子地图中的语音匹配与模式识别 张 翎 (南京师范大学地理科学学院, 南京210046) 摘 要:针对目前在导航电子地图系统中仍然采用鼠标、键盘、触摸屏等传统输入方式的不足,本文研究了语音控制技术在导航系统中的初步应用方法。由于在导航系统应用中存在的噪声大、孤立词和模糊语音等问,本文在采用通用的语音识别模块的基础上,首次提出了 基于拼音音节字符串有效字符的相近匹配度算法,建立了灵活、可扩充的模糊拼音库,实验 证明该方法显著地提高了语音的匹配率;运用人工智能技术和模式识别方法,建立了导航应 用的句法-关键词库,基本实现了基于自然语言的人机交互功能,并将该技术实际应用于 导航电子地图系统中,完善了语音的输入功能,提高了操作效率和系统的智能化程度,为导 航电子地图系统的进一步应用提供了快捷、有效的交互平台。 关键词:语音 导航 电子地图 模式识别 Matching and Pattern Recognition of Voice For Electronic Navigation Map System Zhang Ling (Nanjing Normal University, Nanjing 210046) Abstract: This paper probes into a basic application of voice control technology in electronic navigation map system. Because there are some problems in the application of navigation system, such as noise, isolated words and blurry voice, this paper, that is based on a current voice recognition module, firstly puts forward a method of the similar matching-degree calculation on geographical information which adopts faintness matching on pinyin string to improve their matching rates, sets up a rule database of syntax and keywords, basically realizes the interaction function of person and computer. The method has been successfully applied in navigation electronic atlas, which improves the input function of voice, and increases intelligent extent of electronic map application. Key words: voice; navigation; electronic map; pattern recognition 目 录 1 引 言 3 2 研究的理论与技术基础 4 2.1 导航电子地图与语音导航 4 2.2 语音应用的分类 4 2.3 语音应用流程 5 2.4 技术基础 5 2.4.1 语言匹配技术 5 2.4.2 模式识别技术 6 3 若干关键技术研究 6 3.1 主要存在的问题 6 3.2 语言类型的选择 6 3.3 导航句法规则库的建立 7 3.4 拼音字符串的相近匹配度计算 8 4 实验与结果分析 10 4.1 实验数据 11 4.2 实验步骤 11 4.3 实验系统的界面 11 4.4 实验结果分析 12 5 结论与讨论 13 6 谢辞 13 7 参考文献 14 附录: 15 1 引 言 现代社会的发展,已经进入了高信息化时代。信息成为推动人类社会发展的强大动力,而详实、准确的地理信息对人类社会发展产生的巨大推动作用更加毋庸置疑。电子地图的出现使得地理信息的显示更加方便、直观,并且将地图的应用扩展到了更广阔的领域[1]。。 随着计算机科学与技术的发展,我国已经公开出版了不少电子地图产品,如《武汉百事通》、《中国电子地图》、《中国深圳》等,国外也有很多内容丰富、功能强大的电子地图产品,如微软公司出品的《Encarta 97 World Atlas》等。这些产品通过人机交互,可以实现查询、统计、分析、量算、决策和定位导航等功能,一定程度上显示了电子地图反应地理信息的优越性。 电子地图问世的目的是为人类服务的,随着国家道路建设的日益完善、人民生活水平的提高,车辆将进入普通家庭,现有道路设施的合理利用将为建设一个安全、可靠、高效快捷的交通运输系统做出贡献。导航电子地图系统的使用,不但使交通管制游刃有余,对个人而言,出行将更加方便、快捷。但是,现有的导航电子地图在人机交互方面还有一定的欠缺,如没有实现人与计算机之间直接用自然语言进行交流等,还没有使电子地图真正实现人工智能(Artificial Intelligence)。 展望其今后的发展,无论是三维电子地图,网络电子地图,还是智能导航电子地图,以及智能交通系统(Intelligent Transportation System,简称ITS)[9]的实现,都要求以人为本,实现人性化的人机交互。语音在导航电子地图系统中应用的目的是为了使计算机能够模拟人的语言交流过程,并且能够理解和运用人的自然语言,提高交通导航系统的智能化程度,以最终实现人与计算机系统的自然交互。 在语音导航研究方面,目前许多国家、机构都制定了专门的实施计划,如美国DARPA的Communication计划、欧洲的ARISE计划、REWARD计划和VERBMOBIL计划,同时许多著名的学府和研究机构都正在从事这方面的研究,如MIT的SLS实验室、CMU的ISL实验室、Lucent-Bell实验室、日本的ATR实验室、OGI的CSLU中心和Philips公司等。在我国,中科院自动化所、清华大学、武汉大学、北京航空航天大学等都投入了很大的精力开展这项研究,但目前汉语语音导航仍然以导航信息的语音提示为主,尚处于起步阶段,还没有实用性的语音输入与控制的导航系统产品。 本论文的目的是将自然语言交流方法运用于导航系统中,使语音、电子地图和交通导航真正有机地结合起来。本文在现有商品化的语音识别模块基础上,针对噪声环境下中文文字识别率较低的情况下,考虑到导航系统所特有的语言特点,运用模式识别技术和自然语言匹配方法,建立面向导航应用的句法规则,在传统鼠标、键盘、触摸屏等输入方式的基础上增加语音的输入功能,实现语音导航的语义理解和自动操作,并将其实际应用到南京师范大学导航电子地图系统中,以简化系统的命令操作流程,提高应用中的安全性,最终为提高交通导航系统的智能化程度,实现人与计算机系统的自然交互服务,为智能交通系统(ITS)的建立奠定基础。 2 研究的理论与技术基础 2.1 导航电子地图与语音导航 导航电子地图将GPS定位系统与电子地图结合起来,在不断发展的计算机软硬件技术支持下,以电子地图数据库为数据基础,充分利用GPS的高精度定位能力、电子地图的空间分析和直观表达能力,实现地图显示、目标查询、距离量算、路径分析等众多功能,并在实时、有效地获取移动目标(如车辆)所在位置的基础上,进一步实现定位、导航和相关信息服务[1]。 目前,提高导航电子地图的智能化程度是导航系统普遍的研究重点,它包括两层含义,一是导航路径分析、目标搜索、查询方法的智能化,适应各种复杂分析条件和用户要求,以建立有效正确的导航应用,在这一方面已经取得了大量的研究成果;二是系统界面和交互环境的智能化,这是提供系统应用的灵活性,因为导航电子地图系统的应用通常是在动态移动环境下,需要快速、方便和安全的用户输入和实时的结果信息反馈。针对这一要求,传统的鼠标、键盘模式存在严重的缺陷,如输入速度慢、不能在目标动态移动过程中实时进行。 语音技术是人工智能技术的重要组成部分,随着语音识别技术的发展,应用语音提高导航系统的智能化程度已具有一定的研究基础。目前,已有一些商品化的语音软件在国内得到较好的应用,如IBM的ViaVoice、Microsoft的Speech SDK等。语音导航必然成为导航系统的一个新的研究领域。 2.2 语音应用的分类 导航电子地图中的语音所研究的并非完全的自然语言,而是结合导航应用的语音信息,具有专业领域的语言特点和语法规则。从应用的角度出发,可分为以下几类: (1)输出型语音 输出型语音的应用是根据使用电子地图的目的,在显示地图图形的同时,将与主题有关的内容用声音播报出来,使电子地图具有语言表达的功能。该类型的语音通常是系统发送给用户的信息,一般为固定的内容播报,也有系统通过分析生成的内容,如在导航系统中有类似"前方100米向从左边数第3个路口转"的信息反馈,其中的"100"和"3"是由系统分析所得。输出型语音的只能单向的由系统向用户发送语音信息,不能够使用语音输入,还没有实现智能化的人机交互。 (2)输入型语音 输入行语音是指用户通过话筒等声音采集设备将命令或者要执行的操作等语句以语音的方式输入计算机,让计算机系统识别语音以及理解语义来执行命令。它包括非理解型语音和理解型语音两种形式。 非理解型语音是用户向计算机系统发出语音指令来控制导航电子地图系统以达到语音管理的目的。此类输入的语句结构比较简单,一般为一个固定的简短语句组成,如"启动"、"结束"、"放大"、"缩小"等。该类型的语音输入通常是系统规定的关键词,计算机系统无需对输入语句的语法、语义进行理解,只要进行关键词的匹配就可以达到执行相关命令的目的。 理解型语音则是在一定的语法规则的限定下,给用户最大限度的自由,让用户可以自由的说话,通过计算机来理解语音并且执行相关的命令。在面向导航应用的语音输入时,如"南师大在哪里"、"我要到南师大"、"从南师大到南大怎么走"、"离南师大最近的超市在哪里"等这些都属于理解型语音。此类输入的语句比理解型语音输入的语句更为复杂,但是具有更大的灵活性。在处理这种类型的输入型语音时,计算机系统根据导航领域的语法规则来进行语义的理解,再执行相关的操作。 考虑到导航系统应用的实际需要,本文研究将主要集中在理解型输入语音方面。 (3)输入输出型语音 这是将上面两种方式结合起来的一种形式,同时兼顾语音输入和语音输出功能,在一定程度上具有真正意义的人机语音交互能力,也是导航系统语音应用的更高目标。 ////////////////////////////////////////////////////// 5 结论与讨论 本论文实现了用计算机模拟人的语言交流过程,通过建立面向导航领域的语言规则,使计算机通过模式识别理解和运用在导航领域的自然语言,并且通过随机带噪拼音字符串的二次匹配计算匹配率提高了语音的识别率。该技术已经应用于导航电子地图系统,在南京师范大学导航电子地图系统中进行了相关的实验,达到了预期的效果,从而使语音、电子地图和交通导航有机的结合起来,实现了人与计算机系统的自然交互,提高了交通导航系统的智能化程度。 目前,本论文对导航电子地图中的语音应用研究处于初步阶段,功能的实现只是定位与导航。以后通过对导航语言规则的增加,使计算机系统能够理解更为复杂的语句,比如实现空间分析功能"查询南师大周围一公里内所有的公交站点"等。 在语音识别方面,通过基于地理信息的二次匹配度的计算方法在一定程度上提高了语音识别率,但是识别率还没有达到100%的情况。随着语音采集设备和模糊音自适应能力等方面的完善,语音的识别率能够达到更理想的效果[15]。 6 谢辞 本文是在指导导师龙毅教授精心指导下完成的,从论文的选题、实验系统的开发到最后文章的修改定稿,感谢龙毅教授在学业上对我的谆谆教导,导师严于律己,为人师表、严谨的治学态度都使我受益匪浅。 感谢蒋成环、毛凯、张亮、束平、周侗五位师兄,同小组成员崔世林同学,以及全体课题组同学的帮助。 感谢朱春华同学对我论文摘要翻译的帮助。 感谢同宿舍舍友张正荣、张剑和张劲四年来的关心和帮助。 感谢在四年来关心和帮助我的老师们和01级8班的全体同学。 还要感谢养育我成长的我的父母,他们永远是我前进的动力。 感谢所有关心、帮助和合作过的师长、同学和朋友们。 7 参考文献 [1] 武雪玲、任 福(新技术条件下电子地图的现状及发展趋势分析[J](测绘通报,2004, 27(6):75-78( [2] 任天平、门茂琛(语音识别技术应用的进展[J](科技广场,2005:19-20( [3] 张瑞强、王作英、张建平(带拼音纠错的汉语音字转换技术[J](清华大学学报(自然科学版),1997,37(10):9-11( [4] 杨大利、徐明星、吴文虎(噪音环境下的语音识别研究[J](计算机工程与应用,2003,20:1-4( [5] 于鹏、徐义芳、曹志刚(基于加权特征值补偿的说话人识别[J](信号处理,2002,18(6):513-517( [6] 王金明、张雄伟(一种基于自适应模糊滤波的语音增强方法[J](解放军理工大学学报(自然科学版),2003,4(1):17-20( [7] 王卫华、陈卫东、顾 岳(用Microsoft Speech SDK实现语音识别和语音合成[J](电子技术,2000,11:40-41( [8] 李玲慧、毛卉等(基于GIS的数字地图的应用[J] (地域研究与开发,2003,22(6):52-54. [9] 陈则王、袁信(面向ITS的车辆导航与定位技术[J] (交通与计算机,2001,19(6):23-25. [10] 何兆成、刘绪启、洪 波、李 军、黄忠洲、余志(车辆导航系统语音路径引导模块的实现[J] (交通运输工程学报,2003,3(4):108-111. [11] 聂 敏(语音识别及其关键技术[J] (微波与卫星通信,1999,4:53-56. [12] 何湘智(语音识别的研究与发展[J] (计算机与现代化,2002,79(3):3-6. [13] Doh Suk Kim、 Soo Young Lee、Rhee M Kil(Auditory Processing of Speech Signal for Robust Speech Recognition in Real World Noisy Environment[J] (IEEE Transactions on speech and audio processing,1999,(7):55-68( [14] K Shinoda、C H Lee( Astructural Bayes approach to speaker adaptation [J](I EEE Trans.on Speech and Audio Processing,2001,9(3):276-287( [15] E . Eide , H . Gish , P . Jeanrenaud , and A . Mielke . Understanding and Improving Speech Recognition Performance Through the Use of Diagnostic Tools[C] . In : Proc . ICASSP95 , 221 - 224 , 1995 . [16]赵喜林,赵喜玲,江祥奎,模式识别方法及其比较分析[J].信阳农业高等专科学校学报,2004,14(3),37-40. [17]薛强,孙飞云,模式识别与人工神经网络辅助水土流失监测预报初探[J].山西水土保持科技,2004,9(3),17-19. 1
/
本文档为【导航电子地图中的语音匹配与模式识别】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索