为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

科大讯飞5.0语音软件的安装和操作要领

2017-09-20 8页 doc 52KB 43阅读

用户头像

is_037433

暂无简介

举报
科大讯飞5.0语音软件的安装和操作要领科大讯飞5.0语音软件的安装和操作要领 朗读效果排名的话,是这样的(由高至低): a. neospeech liang b. 科大讯飞 小燕 c. neospeech lily d. neospeech hui e. 科大讯飞 小宇 科大讯飞电话语音识别InterReco——应用开发及工具包 为了方便语音识别系统的开发,InterReco提供了一系列的开发接口和应用工具,从而使得应用系统的开发更加高效,主要包含如下: 一、应用开发接口 ?语音识别接口 语音识别接口是InterReco提供的最重要的对外接口...
科大讯飞5.0语音软件的安装和操作要领
科大讯飞5.0语音软件的安装和操作要领 朗读效果排名的话,是这样的(由高至低): a. neospeech liang b. 科大讯飞 小燕 c. neospeech lily d. neospeech hui e. 科大讯飞 小宇 科大讯飞电话语音识别InterReco——应用开发及工具包 为了方便语音识别系统的开发,InterReco提供了一系列的开发接口和应用工具,从而使得应用系统的开发更加高效,主要包含如下: 一、应用开发接口 ?语音识别接口 语音识别接口是InterReco提供的最重要的对外接口,是应用开发人员使用识别引擎进行语音识别开发所必需使用的接口。这个接口提供强大的功能,能够发挥InterReco语音识别系统的优势,通过不同的并发编程模型简化编程复杂度,优化系统性能现。 ?语法接口 语法编译管理接口提供API形式的语法编译和管理的方法,主要用来解决动态语法的编译、加载、激活的过程。用户根据需要使用这些接口可以对自己的应用程序做出恰当的优化,提高应用系统灵活性。语法管理接口允许用户管理和设置语法缓冲的策略。 ?端点检测接口 端点检测是语音识别一个重要的输入环节,该接口允许用户通过编程对端点检测的处理策略,和语音识别引擎进行交互。 ?音频输入接口 该接口提供一套能够使用户把电话语音输入设备挂接到InterReco语音识别引擎的方法,包含各种品牌的电话语音卡和麦克风。通过这个接口,能够消除输入设备的多样化带来的集成复杂度,使得产品在音频输入方面具备优秀的可扩展性。 ?管理维护接口 该接口提供管理维护接口、日志接口、以及其他一些辅助接口。 二、应用优化方法 分析和优化在语音识别的开发、应用过程中扮演非常重要的角色,好的分析和优化工具往往能够决定语音识别的应用是否能够成功。InterReco 2.0中提供的主要分析优化方法有: ?分析识别效果 通过Call-Log纪录,使用分析工具分析统计,得出当前应用的总体识别率、语法内识别率等重要技术指标。这些指标能够反映出当前语音应用的总体识别效果,同时也能够分析应用中存在的问。 ?识别优化 通过识别效果的分析,对识别的语音界面、识别语法、识别模型、系统参数进行优化,以达到提高用户满意度,提升识别效果的目的。 ?自适应 分为无监督和有监督的自适应,识别系统在运行过程中会以一定的间隔对当前的应用场景进行一次无监督的声学模型自适应,这种适应的内容包括:说话人特征自适应,包含口音和方言;通道特征自适应,包含无线通道、VoIP编解码通道;应用特征,包含词汇、环境噪声等。 三、工具包 InterReco提供了丰富的开发调试工具,能够在集成开发的过程中为用户提供全面有效的支持。主要包含: ?识别演示程序 识别演示程序是一个基于对话框风格的Windows GUI界面,其主要功能是在Windows环境下,为用户提供一个简便、友好的方式,使得用户能够使用麦克风完成基本识别功能,或者使用离线识别功能,也可以设置一些系统参数验证其效果。 ?语法调试分析工具 用户来可以直接用文本而不是实际语音对于自己编写的语法进行分析和调试。主要功能有:输出语法的所有定义范围、测试一个说法是否满足语法要求。 ?语法管理工具 管理语法缓存工具,可以使用该工具查看当前InterReco系统语法缓存的详细情况,还可以使用该工具手工删除指定的语法缓存条目,该工具还提供了预先编译语法文件的功能。 ?用户词典工具 用户自定义词典工具。通过该工具,可以对输入词条列表生成发音,并保存为用户自定义词典。 这些开发接口和工具包可以帮助合作伙伴更快速的将语音识别产品集成到各中应用系统中,并作为合作伙伴在语音识别业务设计、调试和效果优化等各阶段的技术助手,帮助合作伙伴更快速的开发成功的语音识别应用系统。 科大讯飞5.0语音软件的安装和操作要领 科大讯飞5.0语音软件(硬盘版),它是目前最好的语音朗读软件,小宇(男声)、小倩(女声)的发音可与真人发音媲美,尤其是小宇(男声)磁性发音效果好,听起来很自然。5.0语音软件操作方便简单,只要把解说词的文本粘贴上去,点合成就可发音读了。下面我就介绍科大语音5.0软件的安装及使用方法。 一、软件大小: 01运行库5.0版(332MB) 语音库(可先下载):02小宇(男声)5.0版(1.12GB) 03小倩(女声)5.0版(583MB)04小燕(女声)5.0版(1.67GB) 05小琳(女声)5.0版(137MB)06英语(女声英语)(223M) 07小美(女声粤语)(983M)。 二、安装方法: 1. 安装运行库:用虚拟光驱软件打开或Winrar解压后打开 InterPhonic5.0运行库.iso,点击 Runtime(Demo)_Chinese (PRC).msi 安装即可 2.把 InterPhonic.5.0演示版2M文本限制破解.rar 的两个文件解压到 【安装目录】\iFly Info Tek\InterPhonic 5.0\bin 覆盖原有文件 3.安装工具包:点击ToolKit_Chinese (PRC).msi安装.运行ToolKit\ToolKit.exe 安装过程中出现绑定运行库 打开上面所说覆盖了的文件 ttsknl.dll 4.安装想要的语音库,任选一个或几个语音库,如双击小倩文件夹里的setup.exe自动安装。 5、如果你想用CSSML编辑器,iFlyTTS.dll文件要到网上另外下载。将iFlyTTS.dll文件粘贴到x:\Program Files\iFly Info Tek\InterPhonic 5.0\bin文件夹里并在CSSML编辑器的查看--选项--语音合成运行库 设成iFlyTTS.dll文件。 配置合成引擎: 请先选择一个引擎, 点击 .列出引擎 来获得 点击 (列出引擎)出现error Cant load specified module因无设定路径 ******(不会用的请看以下 路径)********* 先选ttsknl.dll再>点击 (列出引擎)>确定>便可读出语音 一定要选ttsknl.dll应用程式1.1MB 才能使用语音合成引擎 开始->所有程序->科大迅飞->InterPhonic 5.0->合成演示程序 如果是win7x64,安装完第一步后按下操作: 尝试了一下,果然是这的问题 具体不多说,解决方法如下: 1打开注册表项【HKEY_LOCAL_MACHINESOFTWAREWow6432NodeiFly Info TEK】 2右键导出 3用记事本编辑导出注册表项,搜索【Wow6432Node】并直接替换掉(别键入字符,空格也不行) 4双击确定合并,然后就可以了 此方法只针对64位win7系统,其他未测试,另外这个只是在确定正常安装了运行库的前提下才能保证成功,以上InterPhonic5.0语音合成系统提供了简体中文、繁体中文和英文三种版本,每个版本都配备了相应的安装包,工具界面以及文档。 科大讯飞语音合成需要的文件iFlyTTS.dll,试过科大讯飞5.0版本是绝对可以用的,把解压所得的几个文件剪切到Bin文件夹下就可以了 把这个包中的文件覆盖ToolKitbin路径下的原文件后,CSSML Editor终于可以预览声音了。实在是太有才了,非常感谢~ Vista下能用,安装顺序: 1、首先安装一下:微软TTS5.1语音引擎(中文) 2、再安装:InterPhonic5.0运行库 三、软件的基本操作 1、合成演示程序的操作;(合成语音和文字语音转换) ?点窗口键弹出开始菜单,找到科大讯飞菜单项目,打开合成演示程序。(见图1) ?打开了合成演示的主窗口,我们可以在这里写字,让科大讯飞进行朗读;或把文字粘贴到这里进行朗读;或打开一个文 本文件进行朗读; ?还可以通过快捷键进行操作。 用ctrl加o打开一个文本文件进行朗读;可以直接将编辑器里的文字导出为声音;F4配置合成引擎;F5开始朗读;F6暂停和继续朗读;shift加F5停止朗读;F9将文字导出为 wav格式的声音文件。 ?文本转换为wav声音说明: 只要按F9键就会弹出一个保存的对话框,如同在记事本里保存文本那样写好文件名然后找到要保存到的目标地址,在用空格或回车点保存按钮进行确认,此时便会出现转换的进度,速度很快的,64k的文件在我这里最多两分钟就可完成,但我们无法知道具体的进度,解决:用小键盘6切换到9列表,这个列表里记录了已经转换完毕的文字,如果文件还没有结束列表竖直会不停的增加,当听到列表竖没有变化的时候,该文件就全部转换完毕了,此时光标肯定停在编辑器的末尾。 ?掌握朗读和导出声音的技巧: a、 朗读或者将全文导出为声音的方法:可以按ctrl加a将文字全部选中,然后再按朗读的快捷键或导出声音的快捷键进行操作。 b、 将选中的文字进行朗读或将选中的文字导出为声音文件的方法:可以利用定义块首(选择开始点)和定义块尾(选择结束点)来实现,定义块首块尾的快捷键使用永德读屏软件的朋友可以按视窗键加小键盘4和视窗加小键盘6来操作。 c、 本程序有光标跟随的功能,如果将左光标或右光标指向所选择的字,按f5就可以从光标所指处开始朗读直至朗读完毕,如果将上下光标指向所选择处,按f5便可朗读该段落的所有文字。这样有一个好处,我们在朗读文章的时候中途如果想退出程序就可以按shift加f5停止朗读,此时光标肯定正指向刚刚停止的地方,只要我们在这里用一个特殊符号作一个标记,下次再打开此文件,就可以用ctrl加f启用查找功能,输入你所写的特殊符号回车,然后按esc关闭查找窗口,此时光标正好指向该标记符号,你可以将该符号删除然后将左光标或右光标放在这里,按f5开始朗读就可以接着上次的地方继续朗读了。 ?合成演示里控制面板的操作: 在这里我们可以对语音库声音进行具体的调节,如果此参数调节的好,便能大大提高朗读效果。 打开合成演示程序,用小键盘6依次会切换到三个滑块,语速、音高和音量,这三个滑块的默认值都是50,我们应该用鼠标左键将其激活,用tab来切换,用光标或翻页键来调节,下光标或下翻页键是增加竖直,上光标或上翻页键是减小竖直。比如要将语速滑块增速到最快,就用下光标或下翻页调到100,如果要将音高降至最低,就用上光标或上翻页调到0,依次类推……继续用小键盘可以切换到10个组合框,这里要值得注意的是前面的滑块被鼠标左键单击激活的同时这10个组合框也会同时被激活,同样,如果单击其中的某一组合框的同时那三个滑块和别的组合框也会被激活,单击激活之后用tab可以在这些滑块和组合框之间来回切换,用上下光标或上下翻页键可以对其中的滑块和组合框进行调节。 在高级设定中除了使用音库组合框用上下光标可以选择你已经安装过的语音库外。其余的默认即可; 2、第二节资源管理中心的操作 点视窗键弹出开始菜单,按字母p进入所有程序,用上下光标找到科大讯飞,用右光标展开,会见到InterPhonic5.0这个文件夹,用右光标展开,用上下光标找到资源管理中心回车打开,这里可以说是本软件的总的控制中心,里面的功能太多了,在这里只简要介绍一下如何用键盘操作各种菜单,至于里面的功能介绍,大家可以去看帮助,那里介绍的很详细。 打开资源管理中心之后我们用小键盘4或6可以切换到一个框线,这是软件的主菜单,用小键盘1或3可以在各个子菜单之间进行切换,用小键盘左键单击可以对选中的菜单进行确认。例如我们要操作词库这个菜单就用小键盘1或3将其选中用小键盘左键单击确认,按alt弹出菜单,在文件菜单里可以将词条导出,将自己制作的词条倒入。如果我们要操作 自定义资源这个菜单,同样要用小键盘1或3选中,用小键盘鼠标左键单击确认,用小键盘4或6可以对该菜单进行具体的设置。总而言之,这些菜单的操作方法不外乎这两种情况,或用小键盘选中菜单用alt找到具体的设置菜单进行设置,或用小键盘选中菜单用小键盘4或6对选中的子菜单进行具体的设置。
/
本文档为【科大讯飞5.0语音软件的安装和操作要领】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索