为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

电子伪装语音的变声规律研究

2017-10-18 13页 doc 29KB 59阅读

用户头像

is_083599

暂无简介

举报
电子伪装语音的变声规律研究电子伪装语音的变声规律研究 电子伪装语音的变声规律研究 秘裾争2010~18卷(第4期) 电子伪装语音的变声规律研究 张桂清金怡珠刘红伟崔效义 ? 503? 【摘要】本文以目前社会上流行的两款不同类别的电子伪装语音器材为对象,对多名实验对象变声 前,后的声学特征(基频,共振峰,声调,能量和过零率等)进行了深入的实验分析.实验结果和分析表明,变声 相对于原声,其声学特征变化是有规律的,根据这一声学特征变化规律,对变声语音逆变声就能得到与原声 符合很好的恢复语音.这为深入开展对经过电子伪装的语音进行同一人鉴定奠定...
电子伪装语音的变声规律研究
电子伪装语音的变声规律研究 电子伪装语音的变声规律研究 秘裾争2010~18卷(第4期) 电子伪装语音的变声规律研究 张桂清金怡珠刘红伟崔效义 ? 503? 【摘要】本文以目前社会上流行的两款不同类别的电子伪装语音器材为对象,对多名实验对象变声 前,后的声学特征(基频,共振峰,声调,能量和过零率等)进行了深入的实验.实验结果和分析表明,变声 相对于原声,其声学特征变化是有规律的,根据这一声学特征变化规律,对变声语音逆变声就能得到与原声 符合很好的恢复语音.这为深入开展对经过电子伪装的语音进行同一人鉴定奠定了基础. 【关键词】电子伪装语音;变声规律;声学特征;同一人鉴定 【中图分类号】D915.13 【文献码】A 【文章编号】1674—1226(2010)04—0503—07 StudyonChangingRulesofElectronicDisguisedVoice.ZhangGuiqing,nYizhu,LiuHongw eieta1.Bering HuaXiaEvidenceIdentificationCenter,Beijing100089. 【Abstract】Inthispaper,twodifferentvoicechangerapplicationswereanalyzedandusedtocreatedis— guisedvoices.rheacousticfeatures,suchaspitch,formant,tone,energy,andzero—crossingrate,ofboththedis— guisedvoicesandtheoriginalvoiceswereanalyzed.Resultsshowedthat,comparedtotheorig inalvoices,thea— cousticfeaturesofthedisguisedvoiceshadtheirparticularchangingrules.Theexperimentals ofoundthat,ac— cordingtotherules,thedisguisedvoicescouldbeeasilyrecoveredverywell,whichlaidthefou ndationforforen— sicelectronicdisguisedvoiceidentificationinthefuture. 【KeyWords】Eelectronicdisguisedvoice,Voiceconversion,Acousticfeatures,Speakeridentification. 一 ,引言 在语音信号的分析和处理中,关于变声技术是一个引人瞩目的课题.变声技术指的是通过改变一 个说话人的语音个性特征,使之听起来像是另外一个人所发出的声音.变声技术在现实生活中有着广 泛的应用基础,如在文语转换系统中的应用,在影视节目中的配音,帮助声道受损的说话人提高其语 音可懂度以及保密通信中进行语音个性化伪装等等.目前,在国内外市场上出现的电话变声器和变声 软件就是典型的能用于语音个性化伪装的变声器材(我们称之为电子伪装语音器材).这些电子伪装 语音器材可以连接到手机或者固定话机上,对打电话的人的自然语音进行个性化伪装,致使一般的听 话人无法辨识发音人的身份,年龄甚至性别,也严重影响了一般声纹特征识别技术产品的语音检验鉴 张桂清:北京华夏物证鉴定中心高级工程师. 金怡珠:北京华夏物证鉴定中心高级工程师. 刘红伟:北京华夏物证鉴定中心高级T程师. 崔效义:公安部物证鉴定中心研究员. . 504.EvidenceScienceV.1?18No.42010 定效果,给司法鉴定工作带来很大的困难.为此,本文以目前社会上流行的两款不同类别的电子伪装 语音器材为对象,重点研究变声前后语音特征的变化规律,根据这一声学特征变化规律,对变声语音 逆变声就能得到与原声符合很好的恢复语音,这为深入开展对经过电子伪装的语音进行同一人鉴定 奠定基础. 二,变声的技术方法 (一)用于变声的语音特征 音色特征是表征说话人语音个性化的最重要的语音特征,其声学特征参数主要包括共振峰的位 置,共振峰的带宽,频谱倾斜,基音频率等.音色特征与说话人发音器官的生理学和物理学特征紧密相 连,所以,基本不会随说话人在社会和心理方面的变化而改变.此外,语音的韵律特征(如基音频率的 变化,能量和过零率等)以及说话人的语言特征(如习惯用语,方言,口音等)也表征了说话人的个性化 特征,但容易随说话人在社会和心理方面的变化而改变,例如,放慢说话速度.降低音量,说话更加柔 和等. 现在报道的变声技术,主要是对音段特征进行控制和转换.对于各声学参数对语音的个性特征的 贡献大小,Matsumoto研究认为,基音频率贡献最大,其次是共振峰频率.再次是基音频率的波动和声 源频谱倾斜;Furui的研究认为,由倒谱系数得到的长时平均谱包络对语音的个性特征贡献最大,特别 是2.5—3.5KHz频率范围的谱包络,平均基音频率为其次:Nakatsui认为,基音频率比声道的共振特性 对语音的个性特征贡献大,而Itoh等则认为相反,他们认为频谱包络对语音的个性 特征影响最大,接 着是基音频率和它的时间轮廓结构.虽然研究者们对各个语音参数对语音个性特征的贡献大小的研 究结论不尽相同,但可以肯定.无论哪个声学参数都无法包含所有语音的个性化信息,语音的个性特 征是许多声学参数共同作用的结果.因此.目前报道的用于变声的语音特征基本分为包含共振峰频率 等表征声道滤波特性的频谱包络特征和基音频率特征两大类. (二)变声的技术方法 目前关于变声的技术方法,大体上可分为3类:参数方法,非参数方法和混合方法.非参数方法就 是不明显提取语音信号的声学特征参数.只根据统计意义上的数据进行相应变化,具体方法如时域基 音同步叠加,矢量量化法,频谱缩放法,多说话人内插法或时域重采样法;参数方法和混合方法主要指 采用分析一合成的技术,把语音信号的声源信息和声道信息分离开来,提取语音信号的特征参数,并对 这些参数进行独立操作,从而构造出新的语音.如果对所有的参数进行明显提取,就称之为参数方法; 否则,如果仅部分提取语音信号的参数.而对其余参数采用整体的控制技术,就称之为混合方法.现在 的语音转换方法以参数方法据多. 基于参数方法的特定语音变声技术流程见图1. 源说话人目标说话人 _1.堕—————1分析卜_——训练—分析卜I———一 测试语音一参数广——L—]参 ———— 分析卜——.叶声音转换卜_ 变换过程一一 转换后的 堕童—合成—二 图1基于参数方法的特定语音变声技术流程 秘据j;jf学2010~18卷(第4期)?505? (三)两款常见电子伪装语音器材 为初步探索对经过电子伪装语音进行同一人鉴定的可行性,本文重点对目前社会上流行的两款 非特定人电话变声器进行了分析研究. 1.电话变声器 此变声器共有两档变声(在变音开关处标记"高"和"低"),通过变音开关拨向"高"时,男原声即转 变成一种女声.或女原声即转变成一种更加稚嫩的女声;通过变音开关拨向"低"时,男原声即转变成 一 种更加粗重的男声,或女原声即转变成一种男声.此变声器可与手机和固定电话相连接,连接方法 分别见图一和图二.当你需变声通话时,需将电源开关拨到"ON"处,否则若电源开关位在"OFF"处时 对方听到的仍是你的原声. 蝴 连 2.耳机变声器 此耳机变声器同样也只有两档变声(在变音开关处标记"高"和"低"),通过变音开关拨向"高"时, 男原声即转变成一种女声,或女原声即转变成一种更加稚嫩的女声;通过变音开关拨向"低"时,男原 声即转变成一种更加粗重的男声,或女原声即转变成一种男声.此耳机变声器只能与手机相连接.当 需变声通话时,需将电源开关拨到"ON"处,否则若电源开关位在"OFF"处时接听方 听到的仍是拨打方 的原声. 三,两款电子伪装语音器材变声规律的分析 (一)实验材料和方法 1.试验器材 电话变声器(编号为A);耳机变声器(编号为B);VS99语音工作站;Cooledit软件;奥林巴斯DS一 40录音笔(采样率为44k(HQ))1部;MOTOROLA一明A1200r手机(8k采样率)和MOTOROLA—C168i 手机各l部,ALCATEL—T200电话机1部;SHUREBETA87A话筒1个. 2.语音样本制作 (1)确定参与语音实验的人数,选择健康成年男性和女性各5名. (2)确定录音用的语料样本,按照语料样本中应包含主要元音,单元音音节和复合元音音节的原 则,语料样本确定为如下: 2007年8月日,我是XXX. (3)声样录制.在一间录音室中,分别将话筒或手机,变声器(变声器与电话或手机相连)等置于说 话人嘴部15厘米处,接通电话或手机后,正常朗读语料样本,在另一间或两间录音室,分别用电话或 手机录制说话人的原声与变声声样. 通过手机录制的语音声样,需用AMRConverterVer1.1软件将手机录音的文件由.alTlr格式转为. wav格式. 3.实验方法 运用Vs一99语音工作站,Cooledit等软件详细记录,作图,计算数据,分析,总结所录制的语音韵律 特性(基频,音强和过零率的变化规律)和频谱特性(各共振峰的变化规律),找出语音变声前后的变化 - 506? 规律,同时进行变声语音的恢复研究. EvidenceSciencev01.18No.42010 (1)基频,声调曲线,音强,过零率和共振峰变化规律的研究 在VS一99语音工作站中,选取其中一段语音"他和我们四个人去无锡市旅游".各音节的声调 和基频,音强,过零率和共振峰频率的数值,观察各参数的变化情况. (2)进行变声语音的恢复研究 根据检测出的原声和变声基频的比率及共振峰的比率变化,对变声语音逆变声得到恢复语音.对 变声恢复语音的基频,声调曲线,音强,过零率和共振峰变化规律的进行分析研究. (二)实验结果 将A变声器男,女各5人,B变声器男,女各1人的原声,变高声,变低声及其恢复语音和声学特 征参量的检测结果,综合列于表1,2,3中.表1,表2中数据是A变声器原声/变声或原声/恢复语音的 数值及其统计结果,"音强音节间变动max"行的数据是原声/变声或原声/恢复声的韵母音强相对值相 差最大二个音节的数值.表3中数据是B变声器变声/原声或恢复语音/原声的数值及其统计结果. 表1A变声器女性声学特征变化表 潞辱;20l0年第18卷(第4期) 表2A变声器男性声学特征变化表 ? 507? 综合以上对变声,恢复语音的听辨及其声学特征变化数据统计可知,A,B变声器的变声都使语音 音色,音调发生了变化,听觉上与原声在性别,年龄上有相当大的差异.声学特征上,基频,共振峰相应 地提高或降低,音长不变,过零率改变,音强不变或有所降低.各音节音强降低的比率有微小差异. A,B变声器的变声规律:都是通过改变基频同时引起共振峰改变来变声的.基频变化率最准确. 其次是共振峰频率.全句以及各音节音长基本不变. 1.基频,声调 A,B变声器的原声和变声有很强的比率关系.A,B变声器变低声(女变男或男变年老)时,变声基 频是原声的0.80,基频降低约4级半音.变高声(男变女或女人变年轻)时,变声基频是原声的1.33倍, 基频升高5级半音. 2.共振峰 A,B变声器变声时共振峰的变化也有很强的规律和比率关系.对于电话频域中间段的共振峰频 ? 508? 表3B变声器声学特征变化表 EvidenceSciencevoI.18No.42010 率或F2,其变化的比率与基频变化比率相同.对于电话频域上,下两端的共振峰频率,女声变高,男声 变低时,其变化的比率与基频变化比率会有所偏离.低频峰或F1的偏离可能更大一些.各阶共振峰相 对强度变化的总趋势是高频峰的强度相对减弱. 此外,部分女声无法检测变高声时F3的频率,是因为女声F3的频率本身较高,变高声时F3的频 率进一步提高,超出电话频域范围所致. 3.音强 A,B硬件变声器变音使个别音节的音强曲线类型改变,大部分基本不变.变音会使语音的音强下 降,但各音节下降幅度有所不同,由此引起的音节相对音强的变化,除个别话者的个别音节外,变化最 大的两个音节的相对音强变化不超过14%. 此外,经检测比较发现,A变声器变声使过零率也发生了改变,其变化总趋势与基频,共振峰频率 的变化一致,但其变化比率比基频的变化比率低.需要指出的是,同时还会出现清声母过零率降低,韵 母过零率升高的现象. 四,结论 A,B变声器的变声使语音音色,音调发生了变化.听觉上与原声在性别,年龄上有很大的差异.变 声与原声的声学特征变化是有规律的,因此,可以通过对变声进行逆变换,得到与原声符合很好的恢 复语音. 1.变声语音的声调,音强曲线类型变乱,音强曲线上"抖动"增多,共振峰轨迹变乱,出现杂乱"共 振峰",清声母过零率往往降低,韵母或浊音过零率往往升高等现象(见图2,3).其原因主要是受噪音 秘耩导j争2010年第18卷(第4期)?509? 图2B变声器7号男变女声的基频,能量与过零率特征图37号男性话者原声一变女(高)声一恢复宽带声谱 (线路噪音,变声器本机噪音和环境噪音)和变声器性能的影响.其中,A变声器的表现更为明显一些. 2.变声和恢复语音声学特征的正确显现还与话者说话状态有关,本实验采用正常说话状态,一般 只有二,三个音节的声学特征变乱,不影响全句声样的检测,统计. 3.A,B变声器共同特点是:变高声和变低声的基频变化率分别是一样的,变高声都是升5级半 音,变低声都是降约4级半音;共振峰频率变化率和基频变化率基本一致,特别是 F2与基频变化率符 合得更准确.变声的这种级差和说话人无关,不同说话人的变化规律是一样的.同时这种级差的变音 既基本实现了话者性别或年龄上的改变.又不更多地破坏语音的自然度. 4.恢复语音与原声的差异主要表现在:听觉上语音含混,沙哑,发闷,声学上低频和Fl共振峰频 率偏离基频变化率较大.其中B变声器的表现更明显一些.原因有:变声器本机噪音,线路噪音和环境 噪音的影响;逆变声所采用的变声方法,器材的性能及相应噪音的影响. 5.按本研究方法得到的恢复语音除个别音节的极少数声学特征外.大部分音节的声学特征都能 够正确恢复.恢复后的语音与原声在听觉上比较一致,绝大多数声学特征可以用于同一人鉴定. 参考文献 [1]张翠玲,赵晓波.电声伪装语音的声学研究[A].第七届中国语音学学术会议暨语音学前沿问题国际论坛[C】.北京大 学语言学实验室编,2006年10月,P146 [2]李波,王成友,蔡宣平,等语音转换及相关技术综述[J]通信,200425(5):109—118 [3】何峰,于东武,林嘉宇.一种语音更改技术的研究与实现【J].电声技术2007,31(2):54-59 【4]MATSUMOTOH,HIKIS,SONET,eta1.Mu1tidimensionalrepresentmionofpersona lqualityofvowelsanditsacoustical correlates【J1.IEEETrans,1973,AU一21:428—436 [5】FURUIS.Researchonindividualityfeaturesinspeechwavesandautomaticspeakerrecognit iontechniques[J],Speech Communication,1986,5(2):183—197 【6]ITOHK,SAITOA.Effectsofacousticalfeatureparametersofspeechonperceptualident ificationofspeaker[J],IECETrans, 1982,J65-A:101—108 【7】王聪修,语音转换及其相关问题的研究【D】.北京:中国科学院声学研究所博 士毕业,2001,7 (收稿:2010—04—10;修回:2010—7—20) (责任编辑:刘鑫)
/
本文档为【电子伪装语音的变声规律研究】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索