为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

【word】 捏鼻语音的声纹鉴定研究

2017-11-14 16页 doc 34KB 46阅读

用户头像

is_882336

暂无简介

举报
【word】 捏鼻语音的声纹鉴定研究【word】 捏鼻语音的声纹鉴定研究 捏鼻语音的声纹鉴定研究 中国人民公安大学(自然科学版) 2010年第4期No.42010Journalofchines10p!:bl!璺竺竺!!!!!g2垦箜鱼塑墨鱼 捏鼻语音的声纹鉴定研究 庄琳 (南京森林警察学院侦查系,江苏南京210046) 摘要声纹鉴定中常遇到伪装语音的检验,如采用捏鼻,假声,耳语,变更方言讲话等.伪装语音的出现,使声纹 鉴定难上加难.本研究通过对男女各5人一组发音人的普通话部分短句为分析对象,探讨和分析捏鼻讲话时语音 与正常语音样本的基音,振幅,...
【word】 捏鼻语音的声纹鉴定研究
【word】 捏鼻语音的声纹鉴定研究 捏鼻语音的声纹鉴定研究 中国人民公安大学(自然科学版) 2010年第4期No.42010Journalofchines10p!:bl!璺竺竺!!!!!g2垦箜鱼塑墨鱼 捏鼻语音的声纹鉴定研究 庄琳 (南京森林警察学院侦查系,江苏南京210046) 摘要声纹鉴定中常遇到伪装语音的检验,如采用捏鼻,假声,耳语,变更方言讲话等.伪装语音的出现,使声纹 鉴定难上加难.本研究通过对男女各5人一组发音人的普通话部分短句为对象,探讨和分析捏鼻讲话时语音 与正常语音样本的基音,振幅,宽带语图,共振峰等声学参数变化规律.结果明,捏鼻讲话伪装方式虽然使语音 特征发生改变,但是不同个体之间差异仍然大于自身差异,具备鉴定的条件和基础. 关键词声纹鉴定;捏鼻语音;共振峰;LPC图谱 中图分类号D918.9 0引言 声纹(Voiceprint)是指通过声谱仪显示的,携带 言语信息的语音声波图谱的通称.语音学中将其称 为语图,法庭科学中通常称之为声纹.声纹鉴定 (VoiceIdentification)是指通过声谱仪对未知人的语 音材料与已知人的语音材料的语音学特征进行检测 比对和综合分析,作出是否同一的判断过程.声纹 鉴定技术在刑侦,行政执法和民事诉讼中发挥独特 的作用,是司法鉴定的重要组成部分…. 声纹鉴定中经常由于录音环境,录音器材,情绪 变化等因素会使声音发生畸变,同时也会遇到伪装 语音的检验,如采用捏鼻,假声,耳语,变更方言讲话 等.伪装语音的出现,使得声纹鉴定更是难上加难. 目前,对于能否将伪装语音检材与非伪装语音样本 进行比对来鉴定说话人,还处于争议之中. 本研究通过对男女各5人一组发音人的普通话 部分短句为分析对象,分析捏鼻讲话时语音与正常 语音样本的基音,振幅,宽带语图,共振峰等声学参 数变化规律,探讨如何识别捏鼻语音说话人,为伪装? 语音鉴定提供帮助. 1实验 1.1仪器 1.1.1硬件 麦克风,计算机. 1.1.2软件 VS_99语音工作站(北京阳宸电子技术公司), SPSS统计分析软件. 1.2样本 发音人共10人,男性,女性各5人,年龄均为 21,24岁左右,来自全国不同方言区,普通话发音 较标准,基本无特殊发音习惯,以自然语声和捏鼻子 二种状态在普通房间朗读实验语句各2遍,每隔一 周采样一次,共采样l0遍.发音人的嘴与麦克风的 距离控制在10,15cm左右.录音内容为中性语 句:”我去南京开会,你到杭州旅游,他去北京出差, 你们到上海购物.” 1.3实验参数 1.3.1采样参数 VS.99语音工作站录音采样率16kHz,每个采 样点量化精度为16bit. 1.3.2韵律特性实验参数 基音分析参数.帧长30ms;有效幅度280;检 查倍频;纵向显示范围0,500(男性)或0,700(女 性);基音提取范围70,500. 能量分析参数.帧长20ms;哈明窗;纵向显示 范围20,100dB. 1.3.3共振峰特性实验参数 宽带语图分析参数.男性带宽为300,女性带 宽为300(女低音)或更高(女高音);动态范围35; 基金项目江苏省公安厅基金项目”不同语境下语音声纹鉴定的比较 研究”阶段性成果. 作者简介庄琳(1969一),女,江苏新沂人,副教授. 庄琳:捏鼻语音的声纹鉴定研究 衰减根据语音的强弱而定;高频提升系数0.99;纵 向网格1000;哈明窗;横向网格1000. 线性预测谱LPC分析参数.帧长20毫秒,运 算点数512个采样点,阶数20,哈明窗.其中滤波 器阶数与共振峰的个数相关.通常一对极点对应一 个共振峰,因此当共振峰数为5时,滤波器阶数应为 1O.综合考虑三方面:声道,激励源,辐射作用,当信 号采样为16kHz,阶数定为20.分别提取语音中 相同元音中间段的长时(时间长度30,70ms左右, 视元音稳定程度确定)LPC图谱,及共振峰频率 (Hz),共振峰带宽(Hz),共振峰幅值(db)等参数. 2捏鼻语音与正常语音声学特征参数比对 汉语辅音的鼻音有3个(m,n,rig),元音的鼻韵 母有16个(an,en,ian,in,uan,uen,tian,tin,ang, eng,iang,ing,uang,ueng,ong,iong).捏鼻所发语音 中并非每一音节变化程度都一致,捏鼻改变了鼻音 音节的发音声道,因此含有鼻音或鼻韵母的音节受 到该伪装方式影响较大.研究中将音节分为含鼻音 音节和不含鼻音音节进行声学特征分析. 2.1基音检测 图1,2分别显示的是女生和男生在正常和捏 鼻两种不同状态下发音短语中鼻音”南,京,你,们” 和非鼻音”北,去,到,开”的f0的平均值.可以看 出,鼻音音节的lo均有一定程度的降低,而不含鼻 音的音节则比正常语音基音有增加也有减少.鼻音 音节基音为正常语音基音的90%,100%左右,结 果见表1.但是基音大小还受音量大小,声调等的 影响,随着音量的提高,声门下压力也会随之增加, 声门下压力增加,声带变紧,会导致提高.捏鼻 发音时如果音量变大,声带张力增大,声调改变,基 音也可能比正常发音时有所增大. 表1女生’,男生正常语音基音与捏鼻子语音基音比较 正常基音 男生鼻音基音 鼻音基音减少比例% 121 113 6 133 l29 3 1O3 l02 l 109 107 2 154 149 3 132 l36 — 3 144 l42 l 3【x】 250 2o0 蝌 蠢l50 蜡 l【x】 50 0 昌E常语}音语 . 图暑 ; 2.2宽带语谱图检验(spectrogram) 宽带语谱图,宽带是指在产生声谱时所用的带 通滤波器为宽带滤波器,其带宽常为300Hz左右. 它的横轴坐标表示时间,纵轴坐标表示为频率,每个 ? 2? l60 l20 僻 80 醐 40 01. 像素的灰度值大小反映相应时刻和相应频率的能 量.宽带语谱图能够反映语音的共振峰频率及清辅 音的能量汇集区,在图谱中共振峰呈现为黑色的条 纹.元音对应横杠;清辅音表现为乱纹,乱纹的深浅 开 到 去 ] 你 京 南 开 到 去 E , i日1 图 像 ,糸 南 庄琳:捏鼻语音的声纹鉴定研究 和上下反映了噪声能量在频域中的分布. 将含有鼻音的音节在宽带语图中分析,图3为 二女生”南京”一词组的正常语音(图上部)和捏鼻 语音(图下部)的对比图,可以看出正常语音和捏鼻 语音的宽带语图差异明显,其中在正常语音中每个 音节后面的鼻音部分在捏鼻语音的宽带语图中低频 带宽减小,如箭头所示.共振峰的分布,走势,持续 的时长也发生一定程度的改变.同一人正常和捏鼻 二种状态发带鼻音音节”南京”的宽带语图变化较 大. 图4为二女生短语中”到杭”的宽带语谱图,上 部为正常语音下部分为捏鼻语音.从图中可以看 出,同一人正常语音和捏鼻语音发非鼻音音节”到” 的宽带语谱图中共振峰频率值,共振峰走向,音节内 及音节间过渡音征,辅音的能量集中区域表现一致, 而二女生之间共振峰频率值,共振峰走向,音节内及 音节问过渡音征,辅音的能量集中区有明显差异,在 图中用箭头标出.同一人正常语音和捏鼻语音发含 鼻音音节”杭(hang)”的宽带语图有一定的变化,但 共振峰的位置,走向及共振峰与辅音的关系二种状 态基本一致,差异主要表现在鼻音的有无及共振峰 带宽的长短.由于捏鼻使鼻腔发声受阻,鼻音减弱, 共振峰位置,能量分布也发生了一定改变,但从图中 仍然可以看出二者的同一性.如图4. 由于鼻腔有着较大的容积,鼻音的频谱成分主 要为低频谐振.鼻腔的谐振有着很宽的带宽,这是 因为当空气沿着复杂的鼻腔内壁流动时,粘滞损耗 图3 很大,冲激响应会被很快地衰减掉.通过鼻音声道 传函的能量里几乎没有高频成分.鼻音化元音主要 以第一共振峰(F1)的带宽增大和出现零点来形成 音征.在捏鼻语音中,鼻音的宽带语图在低频部 分带宽减少. 2.3能量基音过零率曲线检验 能量曲线(也叫振幅曲线)反映的是讲话时语 声强度随时间的变化规律,在声纹图上表现为以时 间为横坐标,强度为纵坐标的高低起伏的曲线形式. 不同人讲话,由于讲话习惯,发音方法,发音生理条 件的不同等因素,都会使讲话语声强度随时间变化 规律的不同,必将造成能量曲线形态的总体特殊性; 而同一人讲相同内容,能量曲线形态也必将存在自 身同一性. 基音检测中反映在讲话时语声基音随时间变化 规律. 过零率主要用于判别清音和浊音,有话与无话. . 3. 庄琳:捏鼻语音的声纹鉴定研究 …’’……’ 一一幽’,话…i 图4 大多数声母都是清声母,还有送气与不送气的塞音 和塞擦音,将它们与环境噪声分辨是比较困难的. 过零率不仅可以起到检测语音起点的作用,还可分 辨出元音和辅音的过渡,元音部分过零率小,辅音部 分过零率大. 能量基音过零率曲线组合全面反映语声的强 度,基音,辅音与元音的过渡等随时间的变化规律, 总体特殊性更强,是声纹同一认定中价值较高的特 征参数. 图5是二女生发”南京”一词的能量基音过零 率曲线图,从图中可以看出虽然能量曲线(黑线为 能量曲线)从正常语音到捏鼻语音发生了一定程度 的改变,基音(红色水平短线)也发生了改变,冯雪 琼正常语音的基音(光标点)为285,捏鼻语音基音 变为275,而王晶晶的基音由正常的285变为296 (因王晶晶捏鼻语音声强较大,基音提高).但是能 量与基音的组合方式未变,冯雪琼的”京”字基音红 线紧贴能量曲线略低于能量曲线,而王晶晶基音红 线明显高于能量曲线,图5中以箭头标示出.冯雪 琼在发”南”音时过零率(图中蓝色图线)为500, ? 4? 1300范围,王晶晶”南”音过零率为1100,2500,与 能量基音组合方式二人有较明显差异. “开会”不含鼻音音节,在正常语音和捏鼻语音 中能量基音过零率曲线变化较小,特征稳定,具有总 体特殊性.见图5. 2.4共振峰分析 汉语元音类的浊音是由声带的准周期振动,经 声道共鸣调制,由口鼻辐射出来.不同元音的音色 反映的频谱结构不同.当元音激励进入声道时会引 起共振特性,产生一组共振频率,称为共振峰.共振 峰的参数主要包括共振峰中心频率的位置,频带宽 度和幅度.共振峰反映了声道的谐振特性,代表了 发音信息的最直接的来源.人在语音感知中利 用了共振峰信息,所以共振峰是声纹鉴定中非常重 要的特征参数.一般认为语音频谱包络中的最大值 就是共振峰,利用线性预测谱长时LPC可以提取频 谱包络图及共振峰参数.实验表明,语音的长时平 均LPC图谱具有较强的个体稳定性,通过检验语音 的长时平均LPC谱不失为进行声纹鉴定的途径之 一 庄琳:捏鼻语音的声纹鉴定研究 . 麓一 意瓣’.一一.If…--一 . , .. 1’糍 f. -…..-.…,…,零 囊二蕉…,? 鍪|鍪警篷篓婺强黧噼B?斑.尊 提取多次语音共振峰频率数据,求本人正常语 音与捏鼻语音的各次共振峰频率标准差,看其与正 常语音平均数值的差异度.同时用他人捏鼻语音的 各组共振峰数据平均值与本人正常语音共振峰数据 平均值作比较,得到本人与他人捏鼻语音的差异度 (标准差).数据见表2—4.男生各次共振峰标准 差以及标准差总和的柱形图比较见图6,8. 图5 从表中可以看出,本人正常语音与捏鼻语音的 标准差总和(表中红色数字)一般要小于本人正常 语音与他人捏鼻语音的标准差总和.只有女生4发 “京”音时与女生1相比标准差为1357.3(表中为 阴影部分数据)小于女生l自身标准差3691.6(表 中为红色部分数据). 表2”南”音各次共振峰标准差 ? 5? 庄琳:捏鼻语音的声纹鉴定研究 表4”你”音各次共振峰标准差 图6”南”音各频率标准差比较 3 实验结果显示,并非每一音节变化程度都一致, 捏鼻改变了鼻音音节的发音声道,因此含有鼻音或 鼻韵母的音节受到该伪装方式影响较大. 当音量强度没有明显改变时,捏鼻语音中含鼻 ? 6? 图7”你”音各频率标准差比较 音音节的基音变化表现为降低,降低的幅度一般不 超过10%,而不含鼻音的音节基音基本稳定. 含鼻音音节的能量曲线也有一定变化,但曲线 的走势特征,能量的高低变化仍与正常语音有一定 的关联性.同时能量,基音和过零率曲线的组合方 式变化也较小. 庄琳:捏鼻语音的声纹鉴定研究 图8”京”音各频率标准差比较 宽带语谱图中鼻音部分消失,有些含鼻音节元 音共振峰的位置走势基本不变,但持续的时长有增 有减;有些含鼻音节元音共振峰变化较大. 线性预测谱LPC读取的共振峰数据进行标准 差分析显示,不同个体自身二种状态的语音标准差 有大有小,说明不同个体捏鼻语音与正常语音变化 程度不同.受捏鼻松紧度,声音的大小,发音位置等 影响,所发语音的变化程度不完全相同.但同一个 体二种状态的语音标准差通常小于不同个体之间二 种状态下的语音标准差.说明伪装方式虽然使语音 特征发生改变,但由于在鼻化元音中,声音主要来自 嘴唇处,而不是来自鼻孔处,鼻孔处输出的声音是非 常弱的.所以捏鼻语音特征只是部分改变正常 语音,不同个体之间差异仍然大于自身差异,具备鉴 定的条件和基础. 为保证共振峰数据分析的可靠性,在分析时需 精确将各次共振峰位置相对应.对于因峰较弱软件 精度等原因无法读出的缺峰现象,可从LPC图谱上 进行人工提取(图上可以看出共振峰,但共振峰数 据没有被软件提取出).也可以利用权重进行处 理,同一频段中出现两个峰对于易缺峰进行权重处 理,权重取其出现的百分率. 捏鼻语音鉴定中应综合分析各声纹特征,由于 不同的音节在受伪装时各特征变化程度不一,应将 检材与样本相同音节基音,振幅曲线,宽带语图谱, 共振峰参数等声纹特征结合起来分析,才能够全面 掌握反映语音总体特殊性的声学特征,作出正确的 鉴定结论.同时语音中如有不含鼻音音节的词语, 在检验鉴定中可首先选择该词语的音节进行声学特 征分析,此类音节受该伪装方式影响较少. 样本语音与检材语音的音量不同时,二者差异 较大.因此捏鼻语音鉴定时应录制与检材音量 比较接近的样本语音进行比对.同时由于本研究是 在实验室条件下进行的,语音质量较高,而实践中检 验的语音质量差别较大,因此实际案件鉴定中还应 考虑不同录音设备及录音环境等因素对语音声学参 数的影响. 参考文献 [】]贾玉文,邹明理.中国刑事科学技术大全一文件检验 [M].北京:中国人民公安大学出版社,2002:658. [2]ThomasF.Quatieri.离散时间语音信号处理——原理 与应用[M].赵胜辉,刘家康,等,译.北京:电子工业 出版社,2004:52—76. [3]SchulmanR.Articulatorydynamicsofloudandnormal speech[J].JASA,1989,85(1):295—312. [4]赵力.语音信号处理[M].北京:机械工业出版社, 2003:26—29. [5]王英利.利用振幅曲线进行声纹鉴定的研究[J].广 东公安科技,1995(1):43—46. [6]韩纪庆,张磊,郑铁然.语音信号处理[M].jE京:清 华大学出版社,2004:15—50,267. [7]杨俊杰,崔效义,李敬阳,等.利用长时平均LPC谱检 验双胞胎语音之探讨[J].中国人民公安大学:自 然科学版,2003(4):32. [8]曹洪林,刘建伟.正常,大声两种说话状态下语音的声 学差异及对声纹鉴定的影响[J].证据科学,2009,17 (6):754—763. (责任编辑陈晓明) ? 7?
/
本文档为【【word】 捏鼻语音的声纹鉴定研究】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索