为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

语音信号处理7

2016-12-18 38页 pdf 924KB 38阅读

用户头像

is_392846

暂无简介

举报
语音信号处理7 1 7.1 概述 7.2 语音信号压缩编码原理&系统压缩评价 7.3 语音信号的波形编码 7.4 语音信号的参数编码 7.5 语音信号的混合编码 7.6 现代通信中的语音信号编码 2 7.1 概述 ™ 语音编码(Speech Coding)目的:为了减少数字语音信号 的传输码率或存储量,以提高传输或存储的效率。 传输码率 –— 传输每秒钟语音信号所需要的比特数,也称 数码率、比特率。 例如:对普通电话,采样频率8kHz, 量化字长12比特, 则原始码率 ...
语音信号处理7
1 7.1 概述 7.2 语音信号压缩编码原理&系统压缩评价 7.3 语音信号的波形编码 7.4 语音信号的参数编码 7.5 语音信号的混合编码 7.6 现代通信中的语音信号编码 2 7.1 概述 ™ 语音编码(Speech Coding)目的:为了减少数字语音信号 的传输码率或存储量,以提高传输或存储的效率。 传输码率 –— 传输每秒钟语音信号所需要的比特数,也称 数码率、比特率。 例如:对普通电话,采样频率8kHz, 量化字长12比特, 则原始码率 96Kbit/s。 通过语音编码后,同样的信道容量可以传输更多路的信 号,或占用较少容量的存储器。 语音编码 压缩编码(数据压缩) 3 ™ 语音编码(Speech Coding) 从信息论角度看,信源编码 是要以最少的数码表示信源所发的信号。由于信源存在冗余 信息,所以可以进行压缩。 语音编码属于信源编码的范畴。作为数据压缩技术,语音编 码在通信史上一直都扮演着极为重要的角色。 4 ™语音编码分为三类: 波形编码:力图使重建后的语音时域信号的波形与 原语音信号保持一致。 参数编码:通过建立语音信号的产生模型,提取其 特征参数来编码,波形上不要求与原信号匹配,但 要求重建信号听起来与输入语音尽量一样。称声码 器技术。 混合编码:有机结合以上两种编码方式,基于语音 产生模型的假定并采用合并技术。 5 三种编码方式的比较 波形编码 参数编码 混合编码 编码信息 波形 模型参数 综合 比特率 16~64Kbps 2.4~9.6Kbps 4~16Kbps 优点 适应能力强, 语音质量好 有效降低了编码比 特率 语音质量明显 提高 缺点 压缩率较低 随着量化粗糙语 音质量下降 合成语音质量低, 处理复杂度高 与参数编码比 编码速率上升 典型代表 自适应差分编 码调制 (ADPCM) LPC- 10、LPC- 10E 多脉冲激励线性预测 编码(MPLPC) 规则脉冲激励线性预 测编码(RPE-LPC) 6 7.2 语音信号压缩编码原理和压缩系 统评价 语音信号中存在着冗余度(包括时域与频 域),人的听觉感知机理也有很多可以利用的 特点。语音信号压缩编码之所以可行,正是因 为这两种情况的存在。 7.2.1 语音压缩的依据 7 一、语音编码依据之一:语音信号冗余度 1、 时域冗余: ‹ 语音信号幅度非均匀分布性 ‹ 语音信号样本间的强相关性 ‹ 浊音语音段具有的准周期性 ‹ 声道形状变化比较缓慢,长时自相关函数(几十秒), 相关系数较高。 ‹ 话音间隔 (即语音间隙性) 8 2、频域冗余: ‹ 非均匀的长时功率谱密度。 从长时间的功率谱密度来看,语音 信号具有强烈的非平坦型,存在着 固定的冗余度。而且高频能量通常 较低,恰好对应于时域上的相邻样 本相关性。 ‹ 从短时功率谱密度来看,语音信号 在不同频率交替出现峰值(共振峰) 与谷值。整个功率谱的细节基于基 音频率形成高次谐波结构。 9 二、语音编码依据之二:人的听觉特点 人类听觉系统(HAS,Human Auditory System) ‹ 对于不同频段的声音,人耳的敏感程度不尽相同。 ‹ HAS存在着掩蔽效应,即高声级单音会明显掩蔽临近频 率声音。 ‹ 人类对于语音信号的周期性(即音调)极为敏感,但对 信号的相位却充耳不闻。 10 语音编码研究的是如何在较低的编码速率下获得尽可 能好的高质量语音,同时减少编码的延时和算法的复 杂度。 较为重要的性能评价准则 z 编码速率(比特率),决定了编码器工作时占用的信 道带宽,要求尽可能降低。 z 编码器的完健性,要求良好。 z 编码器的时延,要求较小,满足实时性。 z 误码容限,要求较低。 z 算法复杂度(包括运算复杂度与内存要求),影响硬 件成本,尽可能降低。 z 语音质量。 7.2.2 语音压缩系统的性能评判指标 11 质量评价 主观评价 可懂度评价(DRT得分) 音质评价 平均意见得分(MOS) 判断满意度测量(DAM) 客观评价 适用于低 比特率语 音编码质 量的评价 计算较简单,但没有 考虑实际情况,故 适用于高比特率 语音编码质量的 评价 12 7.3 语音信号的波形编码 ™ 波形编码: 波形编码是语音编码系统在早期所广泛采用的方 法,它把语音信号当成普通的波形信号来处理从而保持原波 形形状。 波形编码适应能力强,合成语音质量好,但比特率过 高,编码的效率也不尽如人意。 ™ 几种典型的波形编码: z 脉冲编码调制(PCM) z 自适应预测编码 z 自适应增量调制(ADM) z 自适应差分脉冲编码调制(ADPCM) z 子带编码(SBC) z 变换域编码 13 采样 — 量化 — 二进制编码(脉冲编码) 一、均匀PCM 均匀量化。对电话语音信号,若采样率8kHz,字长10bit,则 码率80Kbit. 产生的比特率也极高,故在当今运用极少。 二、非均匀PCM 将信号进行非线性变换后再均匀量化,变换后信号具有均 匀概率密度分布。编码时常采用对数变换压缩(译码时指数 扩展)。 非线性 压缩 )(xCx 均匀 量化 编码 解码 非线性扩张 )(1 xC − z b yy qx非线性压缩扩张的非均匀量化器 7.3.1 脉冲编码调制 14 ™ A律压缩扩张技术(中国) ⎩⎨ ⎧= + + += )](sgn[ ln1 /|)(| )](sgn[ ln1 ]/|)(|ln[1 max max max )]([ nx A XnxA nx A XnxAX nxF )1 )|(|1 ( max ≤≤ X nx A ) 1)|(| 0( max AX nx ≤≤ 15 ™ μ律压缩扩张技术(北美及日本标准) )](sgn[ )1ln( ]|)(|1ln[ )]([ maxmax nx X nx XnxF μ μ + + = 16 三、自适应PCM 自适应PCM引入,使量化器的特性自适应输入信号 幅值变化,即使得量化间隔 可以匹配于输入信号方 差,或使量化器增益G可以随着幅值而变化,从而使 信号能量在量化前恒定。 Q【·】 编码器 )(~ nx)(nx )(nc )(nΔ 解码器 )(nc′ )(~ nx )(nΔ′ 匹配自适应 编码器Q【·】X )(nx )(ny )(ˆ ny )(nc )(nG 解码器 )(nc′ )(ˆ ny + )(ˆ nx′ Δ′ )(nG′ 匹配自适应Δ G 两种自适应方法的原理 Δ Δ 17 按照自适应参数来源划分 Q【·】 编码器 )(~ nx)(nx )(nc 解码器 )(nc′ )(~ nx )(nΔ′ 自适应 系统 Q【·】 编码器 )(~ nx)(nx )(nc 自适应 系统 )(nΔ 解码器 )(nc′ )(~ nx Δ Δ 自适应 系统 Δ )(nΔ′ 后馈自适应前馈自适应 18 其中, 或 0 0 ( ) * ( ) ( ) / ( ) n n G n G n σσΔ =Δ= 2 2( ) ( ) ( ) m n x m h n mσ ∞ =−∞ = −∑ 2 2( ) ( ) ( ) m n c m h n mσ ∞ =−∞ = −∑ 19 一、预测编码(Predictive Coding,PC) ™ 对预测误差进行编码。 ™ 预测误差的动态范围和平均能量均小于原信号, 因此可以减少量化比特数,或减小量化噪声。 (n)]E[q (n)]E[e* (n)]E[e (n)]E[s (n)]E[q (n)]E[sSNR 2 2 2 2 2 2 == 信号平均能量 预测误差平均能量 量化噪声平均能量由此可知引用线性预测后,SNR可得到成功的改善。 7.3.2 自适应预测编码 20 LPC计算 + + + )(zX )(zC )(zP )(zE+ - + + + 预测器系数 发端 )(zE + )(zP + 收端 二、自适应预测编码 当预测参数自适应随语音信号变化时,称自适应预 测编码器(APC)。 量化器 21 一、增量调制和自适应增量调制 1、增量调制(Delta modulation,DM) ™ 对一个语音信号的信息用一位来表示。 ™ 增量调制方式将下一个语音信号与当前语音信号比较,如 果高与当前值则系统编码1,否则系统编码0. 7.3.3 自适应增量调制和差分脉冲编码调制 22 ™ 存在两种失真 2、自适应增量调制的工作方式: 自适应增量调制随输入波形自适应的改变量化阶梯 的大小,在信号平均斜率大时自动增大量化阶梯,反之 减小。 23 二、自适应差分脉冲编码调制(ADPCM) 1、差分脉冲编码调制(DPCM): 不同于DM的一位编码,DPCM对两个采样之间或采样点和 预测值之间的差分信号利用多位量化进行编码,使信息量 得到压缩的同时降低了信道负载。 + 量化 + 预测 发送端 + + + )(nx )(ndq )(ndq′ )(nxp )(nxr + + 预 测 )(nxp′ )(nxr′ + 接收端 24 + +)(nx + + - 量化 预测系数 自适应 + 预测 )(nxr( )px n )(ne )(neq 后向自适应预测编码结构框图: 2、自适应差分脉冲编码调制 自适应预测器随着语音特征变化不断更新预测系数,从 而获得更高的预测增益。 25 后向自适应预测作为ADPCM的常用编码方 式,所采用的是序贯随机梯度算法,其预测系 数满足: Niinxnennana rqiii ....,2,1),()()()()1( =−Δ+=+ 其中N为预测器阶数。 为减少传输误码的影响,可加入衰减因子,并 采用符号梯度法简化硬件,于是又有: Niinxnenana rqiiii ....,2,1)],(sgn[)](sgn[)()1( =−Δ+=+ β 26 子带编码原理: 子带编码属于频域编码,它首先将语音信号通过带 通滤波器分割为若干频带(子带),而后对子带信号进 行频谱平移变为基带信号,再利用奈奎斯特速率抽样, 最后进行编码处理。 7.3.4 子带编码 27 ™ 子带分带数目越大,编码增益也会越大,实际 应用中SBC一般采用4-8个子带。 ™ 对已经采样的输入信号,抽取可实现频谱搬移,合成时通 过插值恢复。 ™ 关键技术:带通滤波器设计 子带编码优点: z 分带后可去除信号相关性,获得与时域一样的效果。 z 不同子带拥有不同比特数,可获得更佳主观听音质量。 z 各子带间量化噪音相互独立互不干扰。 7.3.4 子带编码 28 一、变换编码原理 变换编码利用正交变换将信号由时域变换到另外一个 域,使变换域系数集中在一个较小的范围内,降低了信号 相邻样本间冗余度。对变换域系数或较大的系数进行量化 编码,就可以达到压缩的目的。每帧语音信号进行变换。 二、正交变换DCT的优点: z 频域变换明显,较易控制量化噪声频率范围。 z 兼顾性能与计算量,不需要传输特征矢量。 z 变换效率高于DFT,且在频域区的畸变更小。 基于DCT的种种优势,当今自适应变换编码的正交变换普遍采用DCT。 7.3.5 变换编码 )10]( 2 )12(cos[)()()( 1 0 −≤≤+= ∑− = Nk N knkcnxkX N n c π 29 三、自适应变换编码 量化系数的量化字长自适应于每帧短时语音信号的短 时统计特性,即自适应的分配变换域系数的量化字长。 边信息:把DCT系数划分为多个不同的频带(20),各 个频带的平均功率。 7.3.5 变换编码 30 7.4 语音信号的参数编码 ™ 参数编码针对语音信号的特征参数来编码,只适用于语音 信号。 ™ 声码器:利用参数编码实现语音通信设备。 ™ 线性预测声码器,较好的解决了编码速率和语音质量。 P个预测系数、基音周期、清浊音信息和增益参数 线性预测 分析器 编码器 音调 检测器 线性预测 合成器解码器 )(ns )(ns信道 LPC声码器框图 7.4.1 线性预测声码器 31 2.4Kbit/s速率的推荐编码方式(美国),1981年被官方 接受作为标准。编码器框图 7.4.2 LPC-10编码器 32 解码器框图 LPC-10利用简单的二元激励取代余量信号,在2.4kbps的 速率上得到了清晰的合成语音,在当时长期被作为标准算 法使用。但因为激励信号选取的影响,抗噪能力与自然度 仍不尽如人意。采用混合激励模型进行改进。 33 7.5 语音信号的混合编码 ™ 20世纪80年代后期,综合了参数编码低比特率与波形编 码高语音质量优点的混合编码得到广泛的使用。 ™ 合成编码方法(LPAS):目前得到最广泛研究的语音编 码算法,它通过线性预测确定系统参数,并通过闭环确定 激励序列。 激励 选择 g 感知加权MSE ∑ ∑ ∑ )(zA)(zAL )(zw )(ns )(ˆ ns ++ + + _ _ 34 ™码激励线性预测编码(CELP) CELP因其自身的良好抗噪性与高质量的 合成语音而被广泛运用。不同于LPC的二元 激励,CELP采用矢量量化对信号编码,编 码时只传送最佳码矢量的下标,占用比特数大 大降低。 35 )(ˆ ns + 码本 + + 误差最小化 VQ索引 )(ns )(nSw )(nv)(nx)(nc )(zp )(zA )(zW )(zW )(ne _ ++ + + + CELP编码器示意图 CELP模型编码仍基于语音的短时特性,采用LPAS与矢量 量化。在编码类型上,既采用了类似声源模型的语音合成方 法,又做了波形的最佳匹配,所以同时具有参数编码与波形 编码的特征,故称为混合编码。 36 7.6 现代通信中的语音信号编码方法 ™ 在通信技术蓬勃发展信息至上观念深入人心的今 天,传统的TDMA或是窄带CDMA已不能满 足移动通信业务量的需求。第三代移动通信3G 系统引入了更高的传输速率业务,其中语音服务 仍为主要业务。 ™EVRC算法(Enhanced Variable-Rate Coder) 目前的CDMA系统中,基于RCELP的E VRC算法在语音质量与比特速率间取得了很好 的平衡,且适用于变速率编码,抗干扰能力也令 人满意,从而得到了极为广泛的应用。 37 信号处理 LPC参数 短时残差 1&1/2速率编码1/8速率编码 数码率判别长时延迟估计 &增益 Rate )(nS )(nsp 采样信号 )(nε },{ βτ }10...3,2,11,{ =ia Rate EVRC编码器示意图 滤波,降噪 38 EVRC解码器示意图 帧误差检测 后向滤波器RCELP解码 FER—FLAG 合成语音 幻灯片编号 1 7.1 概述 幻灯片编号 3 幻灯片编号 4 三种编码方式的比较 7.2 语音信号压缩编码原理和压缩系统评价 幻灯片编号 7 幻灯片编号 8 幻灯片编号 9 幻灯片编号 10 幻灯片编号 11 7.3 语音信号的波形编码 幻灯片编号 13 幻灯片编号 14 幻灯片编号 15 幻灯片编号 16 幻灯片编号 17 幻灯片编号 18 幻灯片编号 19 幻灯片编号 20 幻灯片编号 21 幻灯片编号 22 幻灯片编号 23 幻灯片编号 24 幻灯片编号 25 幻灯片编号 26 幻灯片编号 27 幻灯片编号 28 幻灯片编号 29 7.4 语音信号的参数编码 幻灯片编号 31 幻灯片编号 32 7.5 语音信号的混合编码 幻灯片编号 34 幻灯片编号 35 7.6  现代通信中的语音信号编码方法 幻灯片编号 37 幻灯片编号 38
/
本文档为【语音信号处理7】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索