语音通信干扰效果客观评价
研究
语音通信干扰效果客观评价方法研究 第l语音通信干扰效l泉弃评价方法fI』f_亢
语音通信干扰效果客观评价方法研究
91404部队94分队张璐琳李晓琳陈静龙伟
摘要:本文采用MFCC和COH两种客观失真测度,对语音通信的干扰效果 进行了客观评价研究.结果
明:两种客观测度分别在特定环境下应用具 有良好的主,客观相关性.因此,可以得出结论:这两种客观测度用于语 音通信干扰效果的评价具有一定的有效性.
关键词:美倒谱;一致性
;相关系数
1引言
语音通信干扰效果的评价是特定干扰环境下的语音质量评价.长期以来对语音通信干扰
的效果评价一直采用主观评价法,由于语音质量的好坏最终要落实到人耳的主观听觉感受,
所以最终由人来判别是合理的.目前主观评价法一般采用军用
《军用通信系统质量的Mos
评价法》规定的方法,然而Mos评价法重复性差,灵活性不够,在进行长时评价时听测者的
判断能力将有所下降,影响Mos分值.为克服主观评价法的缺点,各种客观评价法受到越来
越多的关注.客观评价法是在标准语音与受扰语音中提取我们认为能够充分表现其特征的物
理参量,然后计算它们之间的差异或相关性,用以上计算结果表示受干扰语音的受扰程度.
一
般来说,我们希望客观评价法能够给出与主观评价法相同的结果,但是由于对语言的感知
过程不完全,只能从不完善的过程中寻找最大的可用信息,这样一个客观测度的优劣取决于
它与主观评价MOS值在统计意义上的相关程度.我们用MFCC和CON两种测度对不同试验条件
下的试验语音文件进行测量,并完成了这些试验语音文件的主观平均意见得分(MOS)的评测
实验.在这些试验条件下得到的主,客观相关结果是令人满意的.本文首先给出了两种测度
的简单描述和对试验语音文件的主,客观相关结果,然后对实验结论进行分析. 2客观测度算法
2.1美倒谱系数失真距离(MFcC)
美倒谱系数失真距离是基于听觉特性的一种测度,它在一般倒谱系数概念的基础上考虑
了人耳对音调的感察.对语音信号的对数功率谱,经过一定的频率坐标的尺度弯折处理,变
2004』E
换到Mel域.在语音的频谱范围内设置若干个带通滤波器(K),m=l~M,每个滤波器具有三
角形滤波器特性,其中心频率为f.若离散功率谱的最低频率和最高频率分别为f和f,则
f1>f_',fM<fb.当f,KlkHz时,各f均匀排列;当fm)lkHz时,(f一f).1.1(fro-l-f),M
取
值为22.Mel滤波器的传输特性见图1.
图1MeI滤波器的传输特性
然后计算Mel功率谱下的对数功率谱,对其进行离散余弦变换,得到Mel频率倒谱系数,
公式为:
c,rf=
,,
Lrc.(1)
式中:
C(i)——第i帧第n阶Mel频率倒谱系数; i——帧序号;
M——滤波器个数;
n——倒谱阶数:
m——滤波器序号.
最后求标准语音与相应失真语音的失真距离,公式为: ?…=
,
[c2(ij—c[c,jj(2),7』,'一,
(3)
d.(i)——标准语音与失真语音文件第i帧P阶Mel倒谱系数失真距离平方;
P——Mel倒谱阶数;
(()——标准语音第i帧第n阶Mel频率倒谱系数; .
()——失真语音第i帧第n阶Mel频率倒谱系数; D.——表示1个帧的Mel倒谱系数失真距离的平均. J
f
,f
1一
,?
,一,
:
1?
D
:
中
式
第l音通信干扰效弃观评价方:究
用D2或D表示失真语音文件的受扰程度,距离越大受扰越严重. 2.2一致性函数(COt{)
一
致性函数是在频域求标准语音与受扰语音相关的平均.当语音受扰大时其语音频谱变
化也相应较大,它们的一致性函数值较小.一致性函数的定义如下: CF=
式中:
CF——第i帧的COH函数值:
i——帧序号;
K——线性频域的频率标号.
3客观算法的有效性分析
(4)
由于任何客观测度只适用于某种噪声环境,而一种客观评价测度是否可用取决于它在这
种环境下与主观评价在统计意义上的相关程度.为了检验上述算法对语音通信干扰设备外场
试验干扰效果评价的适用性,需首先完成一个完整的外场试验全部失真语音文件的主,客观
评测,然后对客观评测结果与主观评测结果进行相关分析,以其相关系数R与标准方差0作
为一种优值来比较.相关系数R可衡量客观测度与主观测度的相符程度,0表示用客观估值
代替主观估值时,期望误差的标准方差.有效性分析的系统框图见图2. 准语高文件集合各种十执等级的
失真浯''?台
}
ll
1r?
l用容埘测度土十扰级l'l
lI1.r?
_'}'删发的
[互]
图2计算客观测度有效性的系统框图
2004
3.1标准语音文件
采用数码报文作为语音干扰效果评定的发音材料.采样频率11025Hz,16位POI线性编
码.0,9十个数码随机排列后,按顺序每4个数码文件用音频处理程序连接形成一个数字串
文件,每50个数字串文件形成一个语音码本.在语音码本的前面加同步信号,同步信号的作
用是使标准语音文件与相应的失真语音文件的同步精度不大于lms. 3.2失真语音文件的形成条件
设备连接示意图见图3.
匝互互]
S}
区
S——通信距离
s——干扰距离图3设备连接示意图
失真语音文件是在无线信道传输条件下录制而成,放音设备与通信发射设备,录音设备
与通信接收设备的接口阻抗应匹配,信号电平应调整到各设备工作的动态范围之内:通信设
备之间的语音通信质量不低于3级;通信干扰设备发射干扰信号的样式为噪声调
频.
3.3主观评测试验
失真语音信号的干扰效果分为5级,其标准见表1.
表1语音通信干扰效果等级标准表
干扰等级干扰效果
4无干扰,感觉不出任何失真,语音清晰,虽有背景杂音,但不影响通信. 3干扰微弱,语音失真明显,干扰噪声偶尔干扰个别字音,可维持通信. 2干扰较弱,语音失真比较严重,个别字听不清而需要重复,但可勉强维持通信. 1干扰较强,只能听出个别字和词,但清晰度差,要维持通信已很困难. 0干扰很强,语音完全被噪声所淹没,无法通信.
本文所有的客观测量都建立在与语音通信干扰效果等级的关联上. 4实验结果
语音通信干扰效宋弃观评价万法研究7
4.1MFcc客观测度与主观测度的拟合结果
用MFCC客观评测方法对31个失真语音文件进行了主客观拟合,其中男声16组,女声15
组.失真语音文件包括短波和超短波文件,为l1025Hz采样,16位线性PCM量化的波形文件(格
式为木.WaV).是在外场试验中通信距离不变,干扰距离变化的条件下录制.男声文件的拟合
曲线图见图4,女声文件的拟合曲线图见图5.
方法:MFCC方锃:Y=4.32w×w×一004w×一0.00十茸关:一0.91方菠:0.2 4.口
3口
2.0
1.口
0.00
.03577.1410.71142817.8521.42249928.5632.1335.71
图4MFGG失真距离与主观干扰等级拟合曲线(男声文件) 方浩:MFCC方程:Y--4.57'×一0.Oa'×一0.O0十茸关:一0.g3方笈:02 4.0
3口
2.0
1.口
0.口
图5MFCC失真距离与主观干扰等级拟合曲线(女声文件) 16
(通信对抗2004
4.2OOH客观测度与主观测度的拟合
用COH客观评测方法对55个失真语音文件进行了主客观拟合,其中男声32组,女声33
组.失真语音文件包括短波和超短波文件,为11025Hz采样,16位线性PCM量化的波形文件(格
式为丰.wav).是在外场试验中通信距离与干扰距离均不变条件下录制.男声文件的拟合曲线
图图6,女声文件的拟合曲线图见图7.
方法:O-0H方镘:Y一.857×w×+10722w×一23B2B千茸:000方菠:Q2 40
30
20
10
00Q0QQ20
.
Q4Q.Q7QQgQ.110.130.15Q.18Q2QQ22 图6OOH函数与主观干扰等级拟合曲线(男声文件)
方澎:C0H方樱:Y=-297w×w×+38.34w×一48.Q3千茸关:093方趁:Q2 40
30
20
10
00QQQ03Q
.Q8QQ8011Q14Q.17Q2QQ22Q25Q.28 图7OOH函数与主观干扰等级拟合曲线(女声文件)
1
5诃
由统计理论知,两个统计过程之间的相关系数大于0.8,认为它们是高度相关的,因此
主客观测量达到0.9,0.95的相关系数是可取的.但是,一种客观测度不是对不同的干扰环
境都具有适应性,对试验文件进行分析发现,对于在通信距离与干扰距离不变的条件下录制
的试验文件,COH客观测度效果较好;对于在通信距离与干扰距离变化的条件下录制的试验文
件,MFCC客观测度效果较好.其原因在于,通信距离与干扰距离不变时,干扰信号的频谱变
化不大(见图8),标准语音与失真语音之间的差异主要表现在信嗓比上,而COH对信噪比敏
感;通信距离或干扰距离变化时,干扰信号的频率成分变化相对较大(见图9),说明CC
对频率的变化较敏感.
Cursor:3705Hz.一
5093?一
Frequency:j374Hz(cz.=.16.,
EFTSize厨萄i]tB,lackmann-Hares
Curs0r2334Hz.
一
5153dB
Frq'Je,c'9509Hzr日6—
211
FFT:e匿耳
..!!j
I一.B匪团
!!生I
图8两个00H评测文件的干扰信号频谱 型
,?
.
lJ,
2004
,
?
.
墨釜圣兰二..…一一一f一deFrequency:1394HI(C32?27)I广—一一l[)oseIEFTSize
匿圈i?l一一一!l
?M'M'6?m
参考文献
_,
图9两个MFCC评测文件的干扰信号频谱 [1]张知易吴娅若杜明钰,《军用通信系统音质的MOS评价法》
[2]《语音信号数字处理》,邮电出版社