为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

婴儿啼哭声的声学特征 王之禹

2017-12-04 4页 doc 30KB 71阅读

用户头像

is_751406

暂无简介

举报
婴儿啼哭声的声学特征 王之禹婴儿啼哭声的声学特征 王之禹 婴儿啼哭声的声学特征 12王之禹 雷云珊 (1.中国科学院声学研究所 北京 100080,2.山东科技大学 山东青岛 266510) Acoustic Characteristic of Infant Cries 12(Wang Zhiyu,Lei Yunshan) (1.Institute of Acoustics, Chinese Academy of Sciences,2.Shandong University of Science and Technology) 1.简介 ...
婴儿啼哭声的声学特征 王之禹
婴儿啼哭声的声学特征 王之禹 婴儿啼哭声的声学特征 12王之禹 雷云珊 (1.中国科学院声学研究所 北京 100080,2.山东科技大学 山东青岛 266510) Acoustic Characteristic of Infant Cries 12(Wang Zhiyu,Lei Yunshan) (1.Institute of Acoustics, Chinese Academy of Sciences,2.Shandong University of Science and Technology) 1.简介 [1]啼哭是婴儿向外界传递信息的主要手段,蕴含着丰富的、与婴儿的生理和病理状态有关的信息。研 [2]究表明,不同婴儿基于某种特定生理、病理状态的哭声具有一定的共性。但各种类型的啼哭声所具有的特征参数仍然是有待研究的问题。 本文针对疼痛和非疼痛两种类型的啼哭声讨论其频域的特征参数,即基频F0和第一、第二和第三共振峰F1、F2和F3,并试图确定这四种参数是否可以用于区分疼痛和非疼痛类型的啼哭声。 2.实验方法 2.1数据采集 本次实验的数据是在北京大学第三医院儿科新生儿病房采集的。录音时间在上午八点至九点之间,距离上一次喂奶时间大约为四小时。录音时,婴儿随意地仰卧在床上,录音人员手持麦克风在距离婴儿嘴巴的大约30厘米处录音。为了避免除疼痛刺激之外的其它因素对婴儿啼哭声的影响,所选婴儿的胎龄在35周至40周之间,日龄在1至10天之间,所患疾病主要是黄疸。录音机为FOSTEX FR-2数字式录音机(采样频率为48kHz,量化精度为16比特),麦克风为AKG C4000B。 疼痛啼哭声是指护士在对处于安静状态的婴儿进行针刺指尖采血之后因为剧烈疼痛而产生的啼哭声;而非疼痛啼哭声是指处于安静状态的婴儿自发产生的啼哭声,其产生原因很多,例如不舒服、饥饿等等。 2.2数据处理 婴儿啼哭声可以分割成多个呼气啼哭单元和吸气啼哭单元,呼气和吸气啼哭单元具有显著不同的声学特征,如图1所示。吸气啼哭单元持续时间较短,且有时表现为清音、有时表现为浊音,其声学特征不稳定,所以下面的分析将以呼气啼哭单元为主。 图1.婴儿啼哭声的语谱图,其中包括三段持续时间较长、基频较低的呼气啼哭 单元(1、3和5段)和两段持续时间较短、表现为浊音且基频较高的吸气啼哭单 元(2和4段)。 对于两种啼哭类型的呼气啼哭单元,逐帧计算啼哭声信号的基频和第一、第二和第三共振峰。基频对应于声门脉冲激励信号的频率,共振峰对应于声道的谐振频率。计算基频的基本参数为:帧长为7.5毫秒, [3]帧移为10毫秒,基频搜索范围为60至1000赫兹,所采用的算法为RAPT;计算共振峰的基本参数为:帧长为50毫秒,帧移为10毫秒,窗函数为汉明窗,预加重系数为0.7,LPC阶数为12。 3.实验结果 实验数据包括25个婴儿的啼哭声,疼痛啼哭声来自22个婴儿,非疼痛啼哭声来自16个婴儿,其中有13个婴儿既提供了疼痛啼哭声又提供了非疼痛啼哭声数据。一共81个数据文件,其中,疼痛啼哭声数据文件36个,非疼痛啼哭声数据文件23个。表1和2分别示出了不同婴儿的疼痛啼哭声和非疼痛啼哭声的基频和共振峰的平均值和标准方差以及总的平均值ME和标准方差SD。为了便于显示,表1和2只示出了部分啼哭声文件的均值以及总的均值和标准方差。 表1 疼痛啼哭声的频域参数的均值和均方差。F0:基频(Hz);F1:第一共振峰(Hz);F2:第二共振峰(Hz);F3:第三共振峰(Hz);ME:均值;SD:均方差。 文件序号 F0 F1 F2 F3 Cry1 553 594 1815 2871 Cry2 525 733 1530 3356 Cry12 557 639 1288 2831 Cry15 505 687 1549 2559 ME 537 788 1619 2630 SD 53 195 364 405 表2 非疼痛啼哭声的频域参数的均值和均方差。F0:基频(Hz);F1:第一共振峰(Hz);F2:第二共振峰(Hz);F3:第三共振峰(Hz);ME:均值;SD:均方差。 文件序号 F0 F1 F2 F3 Cry9 447 638 1352 2531 Cry13 393 839 1790 2549 Cry14 388 712 1383 2719 Cry17 506 567 1426 3135 ME 432 712 1509 2664 SD 60 211 354 391 4.讨论与结论 比较表1和2所示的F0,F1,F2和F3的均值和标准方差,可以确定共振峰F1、F2和F3对于区分疼痛啼哭声和非疼痛啼哭声无显著贡献。 基频F0是影响对婴儿啼哭的听觉感知的主要声学特征。在本文中,该参数的重要性得到证实。表1和2示出对于疼痛啼哭声和非疼痛啼哭声,其基频F0的均值和标准方差显著不同,可以用于区分这两种类型的啼哭声。 本文研究了不同类型的啼哭声与其频域参数的对应关系。研究指出,对于疼痛啼哭声和非疼痛啼哭声,其基频F0显著不同,而第一、第二和第三共振峰无明显的差异。 5.参考文献 [1] Gray L. Signal detection analysis of delays in neonates' vocalisations. J. Acoust. Soc. Am. 1987;82;1608-1611 [2] Fort A, Ismaelli A, Manfredi C, Bruscaglioni P. Parametric and non parametric estimation of speech formants, application to infant cry. Med. Eng. Phys. 1996;18(8);677-691 [3] W.B. Kleijn, K.K. Paliwal, "Speech Coding and Synthesis", p495-518 作者简介:王之禹~男~1999年在中国科学院电子学研究所获得信号与信息处理博士学位。1999-2002在中国科学院声学研究所博士后流动站从事语音信号处理方面的研究工作。现在中国科学院声学研究所基础研究部从事语音及音频信号处理方面的研究工作。
/
本文档为【婴儿啼哭声的声学特征 王之禹】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索