为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

语音通信质量分析与评测

2017-11-15 10页 doc 39KB 33阅读

用户头像

is_686908

暂无简介

举报
语音通信质量分析与评测语音通信质量分析与评测 浙江工程学院学报 , 第 19 卷 , 第 1 期 , 2002 年 3 月 Journal of Zhejiang Institute of Science and Technology Vol . 19 , No . 1 , Mar1 2002 () 文章编号 : 100924741 20020120021204 语音通信质量分析与评测 姚跃飞 , 李永刚 () 浙江工程学院材料与纺织学院 , 浙江杭州 310033 摘要 : 在一个 PC 到 PC 的语音通信软件基础上 , 通过一系列实...
语音通信质量分析与评测
语音通信质量与评测 浙江工程学院学报 , 第 19 卷 , 第 1 期 , 2002 年 3 月 Journal of Zhejiang Institute of Science and Technology Vol . 19 , No . 1 , Mar1 2002 () 文章编号 : 100924741 20020120021204 语音通信质量分析与评测 姚跃飞 , 李永刚 () 浙江工程学院材料与纺织学院 , 浙江杭州 310033 摘要 : 在一个 PC 到 PC 的语音通信软件基础上 , 通过一系列实验对影响语音通信质量的因素作了研 究 , 提出了提高语音通信质量的途径 。 关键词 : 网络 ; 语音通信 ; 语音质量 中图分类号 : TN919185 文献标识码 : A 0 引言 当前 , 在纺织行业中网络通信技术显得越来越重要 , 通过网络语音通信技术 , 充分利用其实时交互性 的特点 , 促进不同地域的纺织技术人员的合作开发 , 以降低成本 , 缩短纺织品开发周期 , 同时加快纺织品 贸易进程 。如果借助目前已有的网络语音通信软件 , 如 Netmeeting 等 , 因无法对源代码进行自主控制 , 会 因语音通信而产生安全问 。因此 , 有必要掌握语音通信的核心技术 , 并融合于纺织业的计算机应用系 统中 。 在开发该语音通信软件的过程中 , 发现提高网络语音通信质量是该课题的一个关键 。例如在通过网络 进行纺织品过程中 , 若语音包的丢失率过大 , 就会导致说话时听起来断断续续 , 难以理解 ; 如果语音 包的延迟时间过长 , 则会导致接收方在发送方结束前就开始说话 , 分散了听者的注意力 , 而这些因素会导 致整个设计过程的中断 。所以语音质量是网络通信的基础 , 对于保证通信双方的实时交流具有十分重要的 意义 。 对语音质量研究的目的就是通过对编码性能 、机器配置 、语音包大小的研究 , 降低语音包的丢失 率 , 缩短整个通话的延迟时间 , 使双方的交互可以顺利的进行 。 1 实验部分 111 实验条件 以 Windows95 作为开发环境 , Visual C ++ 610 作为开发工具 , 机器的配置为 P ?233 , 98MB 内存 , 10MB 网卡 。实验时 , 语音的采集是采用了单声道 , 16 位语音采样 , 采样频率是 8000 Hz 。语音的编码采用了G711 、G72311 、G726 和 G729 标准 。在语音传输前 , 先经过 RTP 封装 , 再使用 UDP 方式将 IP 语音包发送 给对方 。 112 实验方法 11211 编码标准性能比较实验 () 对一个语音编码器的编码质量 包括压缩率的大小 、编码后的语音质量, 应该有一个明确的评价标 准 , 以下讨论的是主观评价语音编码器的实现 。 ( ) ) a实现 16 位采样的录音程序 。用此来生成波形源文件 source1wav; 收稿日期 : 2001210210 () 作者简介 : 姚跃飞 1958 — , 男 , 浙江慈溪人 , 副教授 , 硕士 , 主要从事校园网的建设和计算机在纺织工程中的应用研究 。 )() b 在生成波形源文件的同时 , 保存输入音频的原始数据 input1src; )() c 将输入音频的原始数据作为编码器的输入 , 进行编码 , 得到编码后的音频数据 input1dst; )() d 将编码后的音频数据用解码器进行解码 , 得到解码后的音频数据 input d1src; ( ) )将解码的音频数据转换成标准的波形文件 source d1wav。 e ( ) 通过播放两个波形文件 source1wav 和 source d1wav, 比较通过编码后语音的失真情况以及原始数据 (() ) 文件 input1src和编码后的数据文件 input1dst的大小 , 判断语音编码器的优劣 。 11212 编码标准复杂性实验 ) ) 测试某一种编码标准的复杂性一般有两种方法 : a测试在固定的时间间隔内编码/ 解码的字节数 ; b测试编码/ 解码固定长度的数据需要多长的时间 。在本实验中 , 选用了第一种方式 , 首先随机生成一些白 噪声 , 然后将这些数据作为各种编码标准的输入源 , 控制时间间隔 , 获得编码后的语音数据及其长度 , 最 后 , 在固定时间间隔内 , 根据相应的编码标准还原语音数据 , 取得编码后的语音数据及其长度 。 11213 机器配置对包丢失率的影响实验 每当音频缓冲区被填满时 , 就需要对其中的音频数据进行编码 。但在前一块缓冲区的处理完成以前 ,就无法开始对新的缓冲区进行处理 , 这样就会造成音频缓冲区的丢失 , 语音质量的急剧下降 。由于不同的 机器配置对语音包的丢失会产生影响 , 因此 , 特别设计该实验进行验证 。对该实验 , 必须获得两个数据 : 等待编码的语音包的数目以及被计算机处理的语音包数目 。由于采用 Windows 底层音频函数编程 , 每当音 频缓冲区被填满时 , 应用程序会收到 MM WIM DATA 消息 , 因此 , 对收到的缓冲区满消息进行计数的结果 , 就是待编码的语音包总数 。另一方面 , 对于每一种编码方式 , 都是采用一个编码函数实现 , 因此 , 只 要对调用该编码函数的次数进行计数就可以获得处理的语音包总数 。 11214 语音包大小对语音质量的影响实验 对于不同的编码标准 , 确定最佳传输语音包的大小十分关键 。如果语音包很大 , 则该包中含有重要语 音信息的可能性就很大 , 因此丢失语音包会对语音质量产生很大影响 , 并且大的语音包在穿过路由器时需 包头占的 要很长时间 , 同时 , 它又会造成编码延迟的增加 。如果语音包很小 , 则每个包中语音信息很少 , 比重太大 , 不利于网络带宽的有效利用 。 分析网络带宽的有效利用 。首先应研究语音包的结构 。语音包的结构示于图 1 。 ? ? 语音包其中 : 语音净荷的长度由用户指定 , 链路头的长度 链路头 IP 头 UDP 头 RTP 头 语音净荷 由链路层传输介质决定 。 ( ) ( 20 bytes 8 bytes 12 bytes X bytes Xπbytes 若定义封装效率 = 净荷长度 x/ 包长度 20 + 8 ) () + 12 + x此公式并未考虑链路头长度, 以 G729 编码 图 1 IP 语音包的结构 标准为例 , 帧长 10bytes , 那么当每个语音包所含的帧 数是 1 帧 、2 帧或 3 帧时 , 对应的封装效率分别为 : 20 % 、33133 % 、42186 % 。由此 , 进一步可以作出封 () 装效率 ———帧数/ 包曲线图 图 2。 从图 2 可以看出 , 随着帧数/ 包的增加 , 封装效率则逐渐增加 , 且开始时增加的速率较快 , 到达一定程度后 , 增速趋缓 。因此 , 在 ( 满足单向延迟的条件 ITU 在 G114 IP 电话的单向延迟最大为 ( ) 150ms和包长度限制的条件 根据 Internet 中使用的典型 IP 协议数 据单元尺寸 , IP 语音包长度最大不能超过 552 个字节 , 否则会产生 ) 分割包的现象, 增加每个语音包中的帧数将会使封装效率得到提 高 , 使网络带宽得到更有效的利用 , 并且开始时增加每包中的帧数 图 2 G729 封装效率与帧数/ 包的关系 将会使封装效率有大幅度提高 。其它的编码标准也有类似的图象和 结论 。因此 , 完全可以通过实验 , 找到对应于每一种编码标准的最 理想的包长度 , 在保证语音质量和包长度限制的前提下 , 使得封装效率达到最高 。 实验的设计 : 在每一种编码标准条件下 , 调整每个语音包中所含的帧数 , 为语音质量打分 。具体采用 主观评测语音质量 MOS 方法 , 采用 5 分制 , 从 5,1 质量依次为优 、良 、中 、差 、劣 。根据评测结果 , 确 表 1 不同编码方式压缩性能的比较 2 实验结果和讨论 G72311 11 G723G726 编码方式 G711 G729 (())()513 613 32 211 不同编码方式的压缩性能 源文件大小 实验结果如表 1 所示 。从表 1 看 , G711 的 103 103 103 32 40 ( ) kbyte编码语音质量最好 , 但由于压缩率较小 , 占用网络带 后文件 大小 ( ) 宽会 很 大 ; G726 、G729 以 及 G72311 613kbp s125 5110 16 6 103 4( ) kbyte压缩 编码 器 的 语 音 质 量 达 到 长 话 质 量 , 而 G72311 ( )率 % 0 50 85 95187 95105 () 513kbp s 的 编 码 器 语 音 质 量 稍 差 , 同 时 , G711 >质 量 G711 >质 量 G711 >质 量 基本上 略微有 G72311 和 G729 编码器的压缩率都很大 , 因而占 > G72311 G72311 G72311 > > 语音质量 没有失真 点噪音 用网络带宽都不大 , 但由于其编码算法的复杂 ((()))513 513 513 性 , 对系统性能的要求会比较高 。因此 , 从语音 质量的角度 , 以上几种编码方式都适合语音通 表 2 各种编码标准复杂性比较 信 。从 网 络 带 宽 占 用 率 的 角 度 , G72311 、G729 编码字节数 编码速度 解码字节数 解码速度 更适合网络通信 。编码标准 ( )( )( )( )byte byte/ ms byte byte/ ms 212 各种编码标准的复杂性 3275173 148 4528G726 9827200 13585440 实验结果如表 2 所示 。从表 2 可以获得编码 ()11 13kbps 3192 49144 G723511760 148320 标准复杂性的排列顺序 , 由简单到复杂依次为 : ()G72311 3128 4912 613kbps 9840 147600 ( ) G726 、 G729 、 G72311 513kbp s 、 G72311 13680 74800 G729 4156 24193 () 613kbp s。G726 采用自适应差分编码技术 , 算 注 : 每种编码方式的时间间隔都是 3000ms 。 法比较简单 , 因而编码速度相 对 较 快 , 相 比 之 下 , G72311 和 G729 采用了合成分析编码技术 , 表 3机器配置对包丢失率的影响 由于追求最佳逼近原始语音的效果 , 用于搜索最 语音编码 待编码的语 处理的语 包丢失率 系统配置 佳激励的运算量很大 , 因此编码速度显得较慢 。 方 式 音包总数 音包总数 ( )( )% CPU , 内存同时 , 也可以看到 , 对于某一种编码方式 , 解码 G711 50 50 0 的速度总是比编码的速度要快 , 因而解码时 CPU ()G72311 13 194 54649 26 的负担相对较轻 , 而编码延迟在整个编码器处理 ?233 , 98MB G72311 (47162 P )42 22 613 延迟中占很大比重 。 G726 53 53 0 213 机器配置对包丢失率影响111 79 G729 28183 当采 实验结果如表 3 所示 。从实验情况看 , G711 48 48 0 用 G72311 和 G729 编码时 , 在 P ?233 上有明显 ()G72311 513 48 48 0 的停顿的感觉 , 丢失语音包现象比较严重 , 也就 138 6?550 , 128MB G72311 (47 44 P )613 是说 , 有一部分语音包没有来得及处理就被丢弃 39 39 G726 0 了 , 导致语音质量急剧下降 。这一点从表 3 中的 G729 0 101 101 包丢失率就可以看出 , 而在 P ?550 上就感觉比 G711 45 45 0 较流畅 , 丢包现象也很少发生 。而在 P ?733 上 ()G72311 13 544 44 0 基本上就没有丢包现象发生 , 语音质量基本上达 G72311 ()54 54 0 P ?733 , 128MB 613 G726 36 36 0 到了长 途 电 话 的 效 果 。另 一 方 面 , 由 于 G711 、 G729 87 87 0 G726 编码复杂性较低 , 因此在三种系统配置下 , 都没有丢包现象发生 , 而且在音质和延迟都达到 注 : 测 试 时 , G711 、G729 、G726 的 语 音 包 的 大 小 为 160 字 () () 节 ; G72311 513kbps、G72311 613kbps的语音包的大小为 240了普通电话的效果 。此外 , 注意到采用 G72311 字节() 613kbp s编码时 , 在 P ?550 上有少量 的 语 音 包丢失现象 , 这说明该编码器要求的机器配置必须是 P ?550 以上 。 214 语音包大小对语音质量的影响 实验结果如表 4 所示 。从表 4 可以看出 , 总体上 , 语音质量由高到低依次 为 G711 、G729 、G72311 () () 613、G726 、G72311 513。具体来讲 , G711 、G729 由于每帧长度过小 , 当采用 1 帧/ 包的封装方式时 , 感觉语音抖动现象严重 , 造成语音质量下降 。随着语音包长度的增加 , 语音质量有一个先上升后下降的趋 势 ; 而 G726 、G72311 每帧长度适中 , 因此 , 当采用 1 帧/ 包的封装方式时语音清晰流畅 , 且随着语音包长 度的增加 , 感觉有点噪音 , 语音质量稍有下降 , 但差别不大 。对于每一种编码方式 , 根据语音质量最佳原 则所确定的最佳封装方式在表 4 中用 “ 3 ”标出 。应该指出 , 对于 G72311 标准 , 在两种封装方式下 , 其 语音质量差别不大 , 但考虑到该编码方式的帧时延为 30ms , 前视时延为 715ms , 若采用 2 帧/ 包的封装方 () 式 , 则编码器所产生的时延为 6715ms 30 + 30 + 715, 由于整个语音通信的延迟还包括传输延迟 、串行化 延迟 、排队延迟等 , 它就有可能使总延迟超过 ITU2T 在 G114 中所规定的 150ms 。因此 , 在表 4 中选择 1 帧 / 包作为 G72311 的最佳封装方式 。 表 4语音包大小对语音质量的影响 3 结论 ()语音质量 MOS 每帧大小 编码标准 提出以下一 根据以上实验结果及相关分析 , ( )bytes 1 帧 2 帧 3 帧 4 帧 5 帧 些提高语音通信质量的方法 。3215 196 191 19 G711 80 333411 ) a根据不同的机器配置 , 选择不同的编码 3 318 3185 318 ——G726 160 方式 。若机器配置较好 , 就可以选择运算复杂性 3 ()11 513kbps 3165 G723240 ———3165 3( ) 只 较高的编码方式 G72311 、G729 等, 否则 , ()G72311 3188 613kbps 240 ———319 3 能选择 G711 这类比较简单的编码方式 。80 G729 215 3180 3180 3180 3192 ) b对于不同的网络带宽 , 选择不同的编码 (注 : “ —”表示由于 IP 包长度限制 , 不进行评测 ; 3 最佳 () 方式 。若带宽较大 局域网, 就可以采用 G711 封装方式 ; 机器的配置为 CPU : P ?733 , 内存 128MB 。 ( ) 编码方式 , 若带宽相对较小 拨号上网, 则一 般采用 G72311 、G729 等编码方式 。 ) c根据不同的编码方式 , 调整每个语音包中的帧数 , 使得在保证语音质量的前提下 , 封装效率达到 最高 。一般来讲 , 可以采用表 4 中带 “ 3 ”的表项作为相应编码标准的缺省设置 。若网络延迟允许 , 则可 以增加每个语音包中相应的帧数 , 以提高封装效率 。 参考文献 : 1 周长发 , 周建欣. Visual C + + 510 多媒体编程技术与实例 M.北京 : 电子工业出版社 , 1999 . 131 —152 . 2 Jones A , Ohlund J . Windows 网络编程技术 M. 北京 : 机械工业出版社 , 2000 . 155 —165 . 3 Schulzrinne H , Casner S , Frederick R , et al . RFC 1889 KTP : A transport protocol for real 2time applications OL . IETF , 1996 . 4 Schulzrinne H. RFC 1890 RTP profile for audio and video conferences with minimal control OL . IETF , 1996 . 5 舒华英 , 赖平漳 , 周刚 , 等. IP 电话原理技术应用 M. 北京 : 人民邮电出版社 , 2000 . 174 —180 . 6 叶华 , 谢玮 , 梁勇 , 等. IP 电话/ 传真技术 M. 北京 : 人民邮电出版社 , 2000 . 138 —141 . ( ) 7 G729 recommendation , coding of speech at 8 kbit/ s using conjugate 2structure algebraic2code2excited linear2prediction CS2ACELP [ OL . Geneva : Telecommunication Standardization Sector of ITU , 1996 . 8 G723 11 recommendation dual rate speech coder for multimedia communications transmitting at 513 and 613 kbit/ s OL Geneva : Telecommunication 1 Standardization Sector of ITU , 19961 9 糜正琨. IP 网络电话技术 M. 北京 : 人民邮电出版社 , 2000 . 166 —210 . Analysi s a nd Evaluatio n o n t he Q uality of Voic e Co mmunic atio n YAO Yue2fei L I Yong2gang ( )College of Materials and Textiles , Zhejiang Institute of Science & Technology , Hangzhou 310033 , China Ab stract : On the basis of software that involves PC to PC voice communication , the paper shows the factors that affect the quality of voice by serials of experiments. Points out the ways to improve the quality of voice communication. Keywo rd s : Network ; Voice communication ; Quality of voice
/
本文档为【语音通信质量分析与评测】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索