基于小波信号的语音重构设计与实现外文翻译
毕业设计外文翻译
基于小波信号的语音重构设计与实现
Design and Implemention of Speech Signal Reconstruction Based
on Wavelet
基于小波变换的语音信号混合阈值去噪 摘要:小波变换已经成为一个强大的工具,信号分析和广泛使用在许多应用中包括信号
与去噪。小波阈值去噪技术提供了一种新的语音信号去噪方式。然而,软阈值降噪最好,但是保留边缘最差,硬阈值是保持边缘最好。
出于寻找一个混合阈值的
,一般的情况下,采用软、硬阈值实现折衷的方法,提出了降低噪声系数噪声。评估性能的方法,一个干净的语音数据集从训练数据与白噪声信噪比水平范围从-10分贝至10分贝。最后,实验结果
明,提出的混合阈值语音信号去噪比较硬阈值和软阈值方法优越。
1.简介
语音增强方法可以用来增加设备的语音质量,如在我们日常生活中的手机电话,数字助听器和人机通信系统,使他们能在更强大的噪音条件下很好的应用。但是问题去噪的目的是去除噪声,但是不能改变它。傅里叶变换是长期以来人们选择的来抑制噪声的方法。然而最近,基于小波变换的方法越来越受欢迎。小波通过噪声污染为非线性信号滤
[1]波提供一个强大的工具。Mallat和Hwang表明,有效抑制噪声,可转化为小波域噪声信号,并保留只变换的局部极大。另外,重建,只使用了大幅度系数已显示没有噪声的
[2]信号。换句话说,噪声抑制达到阈值的小波变换的噪声信号,Donoho采用小波域阈值,并表现出接近最优性能有广泛的信号类损坏的加性高斯白噪声。
已发现利用小波在信号和图像处理是非常有用的工具,为解决各种工程问题,去噪
[3]是其中之一。基于谱减法的经典方法为了这个目的,但是他们引进人工噪声和改变原
[4]始信号是有效的。donoho介绍了小波阈值(收缩)作为强大的工具,在加性白噪声的去噪信号退化。小波阈值去噪方法的基础上的多分辨率分析的原则。离散细节系数和离
[5][6]散逼近系数可以得到一个多层次的小波分解。格罗斯曼证明了的细节的差异和振幅。
在各级的白噪声降低定期水平的提高。另一方面,规模的变化是不相关的可用信号的幅度和方差小波变换。根据小波变换的噪声和可用信号的属性,我们可以削弱甚至消除噪音。
在信号去噪中最知名的阈值方法的软、硬阈值。我们可以预期,软阈值技术将引入
[7]更多的错误或偏见比硬阈值不。但另一方面,软阈值去噪更有效。实现了这两种方法之间的妥协,混合阈值本文提出了将软、硬结合,以减少噪音的方法。
- 1 -
本文组织如下:第一节中,我提出了小波多尺度的原则。第二节语音信号增强的建议方案。在第三节的小波域阈值去噪介绍,软、硬阈值和语音增强的目的,提出了性能更好的混合阈值去噪方法。在第四节中,实验结果进行了讨论,验证所提出的阈值算法。最后第五节总结提出的研究工作
2.小波的多分辨率原理
,它S.Mallat[1]介绍了小波分解的方法,根据多分辨率的原则给定一个尺度函数f()T
-j的转化和扩张生成子空间,这样 Vjz,ef(2)-kj
2VLR=()ìjïïÎjZïJíV=<>0 (1) jïjZÎïïî
-j存在小波,它的转换和扩张生产的“细节”子空间给的基WT()WVWtk(2)-jj-1础上,所以我们可以得到
...,,...,,...VVWVVWVVW=?? 01112211jjj++
一个信号可以分解 xn()
()1jj-xhnkx=-(2) jjZ澄1,åknn
()1jj-dgnkx=-(2) (2) jjZ澄1,åknn
其中级的信号是离散的细节系数和水平和的近似系数低通滤波器和高通jhn,()gn()J
滤波器,分别对应于一些小波基和他们连接
-n (3) gnhNn()(1)()=--
其中是滤波器的长度。信号的重建算法 N
(1)()()jjj-xhnkxgnkx=-+-(2)(2) (4) 邋nkkkk
- 2 -
将得到的,这是原始信号时,重复的重建
(4)。 xk
2.1语音信号的去噪方案
含有噪声语音信号可以模拟作为原信号和噪声的总和。如果信号包括环境噪声,环境果噪声信号其中是原信号的模型,是噪声成分。这样:其中:yxn=+yxYXN=+
在小波域。 YWXWNW===,,yxn
矩阵符号表示在每个等级和时间的系数。该方法的方框图如图1所示。然后是由不同的线性因子表示每个等级和时间捕获的时的自然噪声。这一因素影响小波振幅Ta(,)t
包络的时间,但不影响频率。
由此产生的小波变换系数,计算时间常数与产生的小波变换系数Xa(,)tK()t
。 X()t
XaKaXa(,)(,)(,)ttt=AWTAWT
p1 (5) Ka(,)t=2c1(,)+Tat
当时,活的常态归为4DB小波系数如下 Chhh@++2(0)2(1)2(2)C=2
(13)+(33)+ho()=h(1)=
4242 (6)
(13)-(33)-h(2)=h(3)=
4242
由于它是一个离散小波,这种计算方法要求没有集成和更有效率。删除阈值的小波系数的噪声成分的基础上,在许多信号(如语音),能源主要集中在少数小尺寸的观察。
- 3 -
噪声信号 离散小波变换Xa,t()DWT
适当时间 XaKa,*,tt()()DWT
阈值的测定
混合阈值
无噪信号 逆时间自适应离散小波变换
图1-1 解决方案
这些尺寸的系数也比较大,相比其他尺寸或任何其他信号(特别是噪音),有大量的能量扩散的系数。因此,可以通过设置较小的系数为零,近最佳消除噪声,同时保留了原始信号的重要信息。小波表示噪声特性往往会跨越时间和规模较小的系数特点,同时将信号能量集中在较大的系数。这提供了使用门槛,信号从噪声中分离出来的可能性.
小波信号可以在时间域和时间尺度域之间变换,而且能够用噪声描述时域和频域的局部特征。由于振幅的离散细节系数随着等级的升高而降低,我们可以选择一个阈值,
[10]通过修改和处理细节系数所有尺度的硬阈值和软阈值来去除噪声。此外在本文中,混合阈值技术用于去噪以及很好的保存边缘。一般情况下,选定的阈值已乘以被称为阈值加工的中间值详细系数。找到最好的较门限处理的比较方法,我们研究它是如何影响小波去噪的性能的。具体来说,我们计算噪声系数在每个小波频带的方差。使用式(7),基于小波频带的噪音能量,每个差额可以被用来设置阈值。在实际情况下,经常遇到的
2s是彩色而非白噪声。假设零均值高斯噪声,系数零为高斯随机变量均值,方差为,标
s准偏差为。
因此估计,
- 4 -
s=(1/0.6745)(||)Medianc (7) i
表高频小波系数,用来确定噪声组件在第一层次分解。是噪声信号的长度,选cNi
择阈值时,我们不应该忽视可能影响鲁棒性阈值估计的每一级细节系数。所以我们必须重新在一定水平上缩放选定的阈值。在本文中,阈值取决于在每一级详细系数。
12 (8) D=tNNs2loglog()()2
在是阈值。是噪声信号的长度。在阈值选择时,我们不应该忽视在每一级的系DtN
数,可能影响阈值估计。所以我们必须在一定程度上重新选定阈值。在本文中,阈值取决于在每一级系数。
3.小波阈值去噪
小波消噪技术被称为阈值,是非线性算法。它可以用树的步骤分解。第一步是符合线性操作的计算系数小波变换。第二步是阈值系数。最后一步是运用逆小波变换的()WT
反转阈值系数,决定降噪后的信号。这项技术是简单而有效的。然而,它在很大程度上依赖选择阈值,这反过来又取决于噪声分布。在小波阈值去噪,我们首先应该选择一个阈值的小波变换程序组件噪声信号,提高信噪比。 ()SNR
3.1软、硬阈值
不表示给定的阈值。 t
sin()*(||),||gxxtxt-D矰y={ 0,||xt
标准。语音信号质量是一种反映了听众信号感知的主观测量。它可以表示信号质量好不好,或需要如何努力才能理解信息。评价这种去噪语音信号方法的有效性,我们与其它两种阈值进行试验比较。基于这一数据有两组加性噪声实验实施。第一组,分贝在-10,-5,0,+5,+10的高斯白噪声被添加在TIMIT数据库和枪数据库的句子中。第二组的噪声特性包括被添0在哦分贝信噪比水平的粉红噪声,车内噪声和多路重合噪声来评价这种方法能对非白噪声和相对非平稳噪声源起什么作用。信噪比,通信距()SNR()IS离和最小均方误差作为两组实验的客观测量标准。客观质量测量,以可以很容()MMSE
易实施和可靠转载的原始的语音信号处理与数学模型比较为基础标准。 4.1信号噪声比 ()SNR
全域信噪比的值是由以下方程决定:
骣2?çsn()?åç?ç?nç? (11) SNR101log=çdB?10Ùç?22ç?[()()]snsn-?çå?ç桫n
Ù
=纯净信号=估计信号,如果总和超过了整个信号长度,称为全球信噪比。 sn()sn()
4.2最小均方误差 ()MMSE
均方误差被定义为是强语音和干净语音之间的平均差异。它可以通过, MSE
儋2rEsnsn=-[()()] (12) {}
任何客观语音增强系统都是为了尽量减少MSE。
()IS4.3通信距离
- 7 -
通信距离对于两阶段光谱的不同波形的性能有评价意义。
T()()abRab--
dab(,)= (13) TaRa()
a是干净语音信号的向量预测系数,向量R是纯净语音信号的自相关矩阵,向量b是提高信号的预测系数。许多实验证实,如果距离从1到10,距离值越低的语言质量越好,两光谱的感知越相近。
4.4主观测量评价
由于使大质量差异区别于听众是必要的,所以提供了一个广阔的性能测量。平均意见评分提供了一个数值测量人类语言的质量。该方案采用数学上平均获得该系统()MOS
性能的定量指标,称为主观测试。为了确定,一些听众通过听力测试评价测试句()MOS
子的质量。基于感知听众给每个等级质量增强的语音句子评价如下:(1)劣质(2)差(3)一般(4)好(5)优秀。是所有个人分数的平均数,范围从1(最差)到5()MOS
(最佳)。
通过计算一组听众对语音质量为5分的总数,并算出平均值,来计算平均。()MOS所有的层组结果都是平均值,对每个输入的粉红噪声(6dB)都有唯一的评价指标见表1,此外itakura-saito距离和最小均方误差是用来计算在三种不同阈值方法中的估计语()IS
言,见表1。从表中很清楚的,混合阈值语音信号去噪法与其他两种方法在所有方面具有比的比较。
- 8 -
表1平均MOS、IS距离和MMSE再输入粉红噪声6dB信噪比时的比较
MOS MMSE 阈值函数 IS距离
1.4 3.88 0.69195 硬阈值
2.8 3.88 0.27530 软阈值
3.7 1.53 0.09400 混合阈值
D高斯噪声条件的符合信噪比范围值:
图3显示的为白噪声信噪比试验结果。阈值函数比较—包括硬阈值、软阈值和提出的混
合阈值三种方法。从图3显示显然阈值方法在同一噪声条件下表现最好。
图3实验结果
输出功率的信噪比方法,软阈值方法显示线性信噪比的改进。
图3输出信噪比结果白噪声输入信噪比为-10,- 5,- 0,+ 5,+ 10。
提出的方法使较高的约14dB的输入信噪比改进为降低到约7dB低输入信噪比。同样,软阈值低输入信噪比改进了约12dB,下降到约3Db,硬阈值低输入信噪比改善了7dB,高输入信噪比下降到-3Db。
- 9 -
E .现实噪声为0分贝信噪比的情况:
图4的是不同的信噪比在信噪比0分贝的改善现实噪声条件。
图4比较信噪比在不同的噪声条件下的衰信噪比
这一结果给出了净改善,所以可以四种噪声函数阈值的方法可以看作其相对有效性。
图4显示了时域和频谱谱图(显示信号在每个频率和不同时间的能量)的嘈杂,使用不同的阈值的语音增强方法。
已经提出了一个基于小波变换的语音增强方法从不同的噪声条件下的混合阈值去噪。结果表明,该方案显示性能优于在信号处理领域的软、硬阈值方法。质量和清晰度测试证明,增强语音和干净的信号时间和频域分析上有更好的相似之处。
该方法给出了两个重要的结果:(1)该方法非常适合提高,甚至非常强噪声条件,因为它已经产生更好的性能比现有的信号算法。(2)虽然主观非正式听力测试中的水平依赖于阈值的形式,该方法产生更好的光谱性能。
五.鸣谢
我们非常感谢参与的人在主观测试的合作。我们谨表示诚挚的感谢~安曼Bannari技术学院,Sathymangalam,为我们的研究提供的设备。
- 10 -