为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

AC97声卡技术讲解

2018-09-30 12页 doc 30KB 9阅读

用户头像

is_421808

暂无简介

举报
AC97声卡技术讲解AC97声卡技术讲解 声音 声音原理 声音是由物体振动产生,正在发声的物体叫声源。声音以声波的形式传播。声音只是声波通过固体或液体、气体传播形成的运动。 声波振动内耳的听小骨,这些振动被转化为微小的电子脑波,它就是我们觉察到的声音。内耳采用的原理与麦克风捕获声波或扬声器的发音一样,它是移动的机械部分与气压波之间的关系。自然,在声波音调低、移动缓慢并足够大时,我们实际上可以“感觉”到气压波振动身体。因此我们用混合的身体部分觉察到声音。 声音特性 (一)响度(loudness):人主观上感觉声音的大小(俗称音量),由“...
AC97声卡技术讲解
AC97声卡技术讲解 声音 声音原理 声音是由物体振动产生,正在发声的物体叫声源。声音以声波的形式传播。声音只是声波通过固体或液体、气体传播形成的运动。 声波振动内耳的听小骨,这些振动被转化为微小的电子脑波,它就是我们觉察到的声音。内耳采用的原理与麦克风捕获声波或扬声器的发音一样,它是移动的机械部分与气压波之间的关系。自然,在声波音调低、移动缓慢并足够大时,我们实际上可以“感觉”到气压波振动身体。因此我们用混合的身体部分觉察到声音。 声音特性 (一)响度(loudness):人主观上感觉声音的大小(俗称音量),由“振幅”(amplitude)和人离声源的距离决定,振幅越大响度越大,人和声源的距离越小,响度越大。(单位:分贝dB) (二)音调(pitch):声音的高低(高音、低音),由“频率”(frequency)决定,频率越高音调越高(频率单位Hz(hertz),赫兹[/url,人耳听觉范围20,20000Hz。 20Hz以下称为次声波,20000Hz以上称为超声波)例如,低音端的声音或更高的声音,如细弦声。 听得见与听不见的声音 正常人能够听见20Hz到20000Hz的声音,而老年人的高频声音减少到10000Hz(或可以低到6000Hz)左右。人们把频率高于20000Hz的 声音称为超声波,低于20Hz的称为次声波。超声波(高于20000Hz)和正常声波(20Hz - 20000Hz)遇到障碍物后会向原传播方向的反方向传播,而部分次声波(低于20Hz)可以穿透障碍物,俄罗斯在北冰洋进行的核试验产生的次声波曾经环绕地球6圈。超低频率次声波比其他声波(10Hz以上的声波)更具对人的破坏力,一部分可引起人体血管破裂导致死亡,但是这类声波的产生条件极为苛刻,能让人遇上的几率很低。人的发声频率在100Hz(男低音)到10000Hz(女高音)范围内。 蝙蝠就能够听见频率高达120000赫的超声波,它发出的声波频率也可达到120000赫。蝙蝠发出的声音,频率通常在45000赫到90000赫范围内。狗能够听见高达50000赫的超声波,猫能够听见高达60000赫以上的超声波,但是狗和猫发出的声音,都在几十到几千赫的范围内。 立体声 自然立体声 立体声,就是指具有立体感的声音。因为声源有确定的空间位置,声音有确定的方向来源,人们的听觉有辨别声源方位的能力。特别是有多个声源同时发声时,人们可以凭听觉感知各个声源在空间的位置分布状况。当我们直接听到这些立体空间中的声音时,除了能感受到声音的响度、音调和音色外,还能感受到它们的方位和层次。这种人们直接听到的具有方位层次等空间分布特性的声音,称为自然界中的立体声。 单声 我们如果把这些立体声经记录、放大等处理后而重放时,所有的声音都从一个扬声器放出来,这种重放声(与原声源相比)就不是立体的了。 这时由于各种声音都从同一个扬声器发出,原来的空间感(特别是声群的空间分布感)也消失了。这种重放声称为单声。 一般的录音是单声道的。例如一个音乐会的录音,从舞台各方面同时传来的不同乐器声音,被一个传声器接收(或被几个传声器接收然后混合在一起),综合成一种音频电流而记录下来。放音时也是由一个扬声器发出声音。我们只能听到各个方向不同乐器的综合声,而不能分辨哪个乐器声音是从哪个方向来的,感觉不到像在音乐厅里面听音乐时的那种立体感(空间感)。 立体声 如果录音时能够把不同声源的空间位置反映出来,人们在听录音时,就好像身临其境直接听到各方面的声源发音一样。这种放声系统重放的具有立体感的声音,就是立体声。 双耳效应” 我们听声音时,可以分辨出声音是由哪个方向传来的,从而大致确定声源的位置。我们所以能分辨声音的方向,是由于我们有两只耳朵的缘故。例如,在我们的右前方有一个声源,那么,由于右耳离声源较近,声音就首先传到右耳,然后才传到左耳,并且右耳听到的声音比左耳听到的声音稍强些。如果声源发出的声音频率很高,传向左耳的声音有一部分会被人头反射回去,因而左耳就不容易听到这个声音。两只耳朵对声音的感觉的这种微小差别,传到大脑神经中,就使我们能够判断声音是来自右前方。这就是通常所说的“双耳效应”。 两声道立体声 如果用两个录音机同时分别记录从两个传声器送来的音频电流;放音时,再将同时放音的两个扬声器放到与传声器对应的位置上,听到的声音就会有很好的立体感,这就是两声道立体声录音。 语音芯片 什么是语音芯片,语音芯片又称:语音IC,又被叫做声音芯片。 、语音基础知识 1、什么是语音芯片, 语音芯片定义:实现将语音信号通过采样转化为数字信号(ADC),或者将数字信号还原成语音信号(DAC)的功能。 ADC=Analog Digital Change 模数转换 DAC= Digital Analog Change 数模转换 2、语音信号的量化述: (1)语音信号的量化 采样率(f)、位数(n)、波特率(T) 采样:将语音模拟信号转化成数字信号。 采样率:每秒采样的个数(byte)。 波特率:每秒钟采样的位数(bit)。波特率直接决定音质。Bps: bit per second 采样位数指在二进制条件下的位数。一般在没有特别说明的情况下,声音的采样位数 指8位,由00H--FFH,静音定为80H。 (2)采样率 奈奎斯特抽样定理(Nyquist Law):要从抽样信号中无失真地恢复原信号,抽样频率应大于2倍信号最高频率。抽样频率小于 2倍频谱最高频率时,信号的频谱有混叠。抽样频率大于2倍频谱最高频率时,信号的频谱无混叠。 嗓音的频带宽度为20,20K HZ左右,普通的声音大概在3KHZ以下。所以,一般CD取的音质为44.1K和16bit,如果碰到某些特别的声音,如乐器,音质也有用48K和24bit的情况,但不是主流。 一般在我们处理针对普通语音IC的时候,采样率最高达到16K就够了、说话声一般取8K(如电话音质)、6K左右。低于6K效果比较差。 (3)语音压缩技术。 由于语音数据量庞大,对语音数据进行有效压缩是很必要的,能够使我们在有限的ROM空间里录入更多的语音内容。有以下几种方式: 语音分段:将语音中可以重复的部分截取出来,通过排列组合将内容完整地回放出来。 语音采样:一般我们使用的喇叭频响曲线在中频部分,较少用到高频,所以,在喇叭音质可以接受的情况下,适当降低采样频率,达到压缩效果,这种过程是不可逆的,无法恢复原貌,叫有损压缩。 数学压缩:主要是针对采样位数进行压缩,这种方式也是有损压缩。例如,我们经常采用的ADPCM压缩格式,是将语音数据从16bit压缩到4bit,压缩率是4倍。MP3是对数据流进行压缩,涉及到数据预测问题,它的波特率压缩倍率为10倍左右。 通常,以上几种压缩方式都是综合起来使用的。 (4)常用语音格式 PCM格式: Pulse Code Modulation 脉冲编码调制,它将声音模拟信 号采样后得到量化后的语音数据,是最基本最原始的一种语音格式。同它极为类似的还有RAW格式和SND格式。它们都是纯语音格式,在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏。 WAV格式:Wave Audio Files 是微软公司开发的一种声音文件格式,也叫波形声音文件,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,但WAV格式对存储空间需求太大不便于交流和传播。WAV文件里面存放的每一块数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据,这些数据包括采样频率和位数,单声道(mono)还是立体声(stero)等。 ADPCM格式:是利用对过去的几个抽样值来预测当前输入的样值,并使其具有自适应的预测功能与实际检测值进行比较,随时对测得的差值自动进行量化级差的处理,使之始终保持与信号同步变化。它适用于语音变 化率适中的情况,而且声音回放过程简短。它的优点是对于人声的处理比较逼真,一般达到90,以上,已广泛地应用于电话通信领域。 MP3格式: Moving Picture Experts Group Audio Layer III,简称为MP3。它是利用 MPEG Audio Layer 3 的技术,采取了名为“感官编码技术”的编码算法:编码时先对音频文件进行频谱,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的mp3文件,并使压缩后的文件在回放时能够达到较接近原音源的声音效果。它的实质是vbr(Variant Bitrate 可变波特率)可以根据编码的内容动态地选择合适的波特率,因此编码的结果是在保证了音质的同时又 照顾了文件的大小。 mp3压缩率10倍甚至12倍。是最初出现的一种高压缩率的语音格式。 3、语音芯片的要素 一. 编码过程 模拟信号数字化必须经过三个过程,即抽样、量化和编码。 1.抽样(Samping) 抽样是把模拟信号以其信号带宽2倍以上的频率提取样值,变为在时间轴上离散的抽样信号的过程。 2.量化(quantizing) 抽样信号虽然是时间轴上离散的信号,但仍然是模拟信号,其样值在一定的取值范围内,可有无限多个值。为了实现以数字码表示样值,必须采用“四舍五入”的方法把样值分级“取整”,使一定取值范围内的样值由无限多个值变为有限个值。这一过程称为量化。量化后的抽样信号与量化前的抽样信号相比较,当然有所失真,且不再是模拟信号。 3.编码(Coding) 量化后的抽样信号在一定的取值范围内仅有有限个可取的样值,将有限个量化样值变换成二进制数字。根据数字代码的总个数,可以确定所需二进制编码的位数,即字长。这种把量化的抽样信号变换成给定字长的二进制码流的过程称为编码。 声音特性 (一)响度(loudness):人主观上感觉声音的大小(俗称音量), 由“振幅”(amplitude)和人离声源的距离决定,振幅越大响度越大,人和声源的距离越小,响度越大。(单位:分贝dB) (二)音调(pitch):声音的高低(高音、低音),由“频率”(frequency)决定,频率越高音调越高(频率单位Hz(hertz),赫兹[/url,人耳听觉范围20,20000Hz。 PCM脉冲编码调制 PCM脉冲编码调制是Pulse Code Modulation的缩写。PCM编码广泛应用于数字音频信号的处理,它的最大的优点就是音质好,最大的缺点就是体积大。在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的 WAV文件中均有应用。因此,PCM 约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。 二. 编码实现 1.采样率和采样大小(位/bit) 人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用 40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz,采样值用16bit表示。 话音信号带宽被限制在0.3,3.4kHz内,用8kHz的抽样频率(fs),就可获得能取代原来连续话音信号的抽样信号。每个量化样值对应一个8位二进制码,故话音数字编码信号的速率为8bits× 8kHz,64kb/s。 2.音频压缩技术 一个PCM音频流的码率是 采样率值×采样大小值×声道数bps。一个采样率为44.1KHz,采样大小为16bit,双声道的 PCM编码的WAV文件,它的数据速率则为44.1K×16×2=1411.2Kb/s。将码率除以8,就可以得到这个WAV的数据速率,即 176.4Kb/s。这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M,这对大部分用户是不可接受的,为了降低磁盘占用,可以采用压缩技术。由于用途和针对的目标市场不一样,各种音频压缩编码所达到的音质和压缩比都不一样 三、AC97规范 早期的ISA声卡由于集成度不高,声卡上散布了大量元器件,后来随着技术和水平的发展,出现了单芯片的声卡,只用一块芯片就可以完成声卡所有的功能。但是由于声卡的数字部分和模拟部分集成在一起,很难降低电磁干扰对模拟部分的影响,使得ISA声卡信噪比并不理想。 AC97则提出“双芯片”结构,即将声卡的数字与模拟两部分分开,每个部分单独使用一块芯片。AC97标准结合了数字处理和模拟处理两方面的优点,一方面减少了由模拟线路转换至数字线路时可能会出现的噪声,营造出了更加纯净的音质;另一方面,将音效处理集成到芯片组后,可以进一步降低成本。 AC97 标准规格 采用双芯片的PC声音解决; 两种标准的封装方式:48针和64针; 数字/模拟信号分离,全面改善信噪比(90db); 16位立体声全双工codec、固定48K采样频率; 4种模拟立体声输入(分别来自LINE、CD、VIDEO、AUX); 两种模拟单声道输入(分别来自麦克风和PC喇叭); 可从两个外接音源交换的单声道麦克风进行输入; 高品质的CD输入; 立体声线性输出; 电话单声道输出; 支持电源管理 ; 可选音调控制; 可选高音控制; 可选3D立体声增强; 可选立体声耳机输出; 可选18或20位DAC及ADC分辩; 可选MODEM线性codec(ADC和DAC); 可为麦克风选择第三个ADC输入通道。 四、S3C6410的AC97控制器 1、 S3C6410与WM9714的I2S,AC97,PCM相比较: 1.I2S,AC97,PCM是不同的,各是各的,三者时序不同,要双方通信,必须要是同一种时序,要么均是I2S,要么均是AC97,要么均是PCM 2.S3C6410的I2S,AC97,PCM复用同一组Pin脚,但同一时间只能用一 种类型,要么是I2S,要么是AC97,要么是PCM 3.WM9714有两大接口,一是AC97,另一是PCM/I2S。PCM/I2S是并非指两者相同,而是WM9714芯片设计时将PCM/I2S的格式兼容,硬件设计到同一个电路中去,可选配置该电路模块为PCM或是I2S。WM9714的AC97模块只接受对方以AC97 Timing发过来的时序,而不接受PCM|I2S的时序,类似WM9714的I2S模块只接受对方以I2S Timing发过来的时序,而不接受PCM|AC97的时序,WM9714的PCM模块只接受对方以PCM Timing发过来的时序,而不接受AC97|I2S的时序 4.看电路图知,WM9714的PCM/I2S的接口没接线,故WM9714的PCM|I2S没用上,而WM9714 AC97接了线接到S3C6410的复用 ,所以S3C6410的复用Pin脚组只能用AC97模式 口:PCM|I2S|AC97上 5.WM9714 只有AC97模块能用,S3C6410只能配置成AC97,配成PCM|I2S将无法与WM9714的 AC97电路模块通信 2、有关AC97 Spec与WM9713的时钟关系: 1):24.576MHz外部晶振给WM9714供给MCLKA,[原理图]。再由WM9714于内部供给AC97 CLK:24.576MHz,此处于WM9714 Reg44h可配置 然后AC97 CLK:24.576MHz再供给BITCLK:12.288MHz,这个BITCLK再由WM9714提供给S3C6410用,6410再利用BITCLK:12.288MHz去产生SYNC:48KHz,这个48KHz的SYNC将反过来再供给WM9714芯片及6410的AC97 Controller,以使两者同步 另外只要24.576MHz的外部晶振一定,供给WM9713的MCLKA, WM9714自动会将其分频至12.288MHz给BITCLK,送往6410 AC97 Controller 12.288MHz的BITCLK产生48KHz的SYNC的机理: BITCLK:12.288MHz SYNC:48KHz=12.288MHz/256bit 一个AC97帧由13个Slot组成,第1个 NO.0 Slot:16bit组成Tag Phase 第2--13个即:NO.1--12 Slot:每个Slot 20bit,组成Data Phase Total Bits: 16bit+12*20=256bit 2)默认WM9714上电后clock 位于MCLKA, PLL Power Down WM9714 AC97的状态机: 1.开机与正常工作过程:INIT,READY,ACTIVE状态 上电开机进入INIT状态,然后ACLINK-ON后,进入READY状态,当Codec Ready后或是开始数据传送或是 Normal SYNC时,就切换至ACTIVE状态进行工作,直到要么cold_reset进入IDLE状态或是POWER_DOWN进入 LP Low Power状态,还有一种情况,就是在ACTIVE状态时,收到!ACLINK_ON信号时,进入IDLE状态 2.Low Power状态: ACTIVE状态时,收到POWER_DOWN后,进入LP Low Power状态,然后: 2-1:收到cold_reset后,进入IDLE状态 2-2:收到WARM_RESET后,进入WARM状 态 3.WARM状态: 收到cold_reset或是CODEC_WAKEUP后,均是进入IDLE状态 4.状态同步信号: 状态与PCLK同步 5.状态监测: AC_GLBSTAT AC97命令格式: 1.ac_codec_cmd ac_codec_stat 2.注意两条命令发送间的延时为>= 1/48KHz=20.83uSec cold reset && warm reset机理: 这部份与外围芯片相关: cold reset机理: 1.AC_GLBCTRL Reg 设置过程: 1)cold reset AC_GLBCTRL[cold reset] = 1 cold reset delay > 1usec + 162.8nsec AC_GLBCTRL[cold reset] = 0 2)AC-LINK on 让SYNC信号送往9714 Codec 3)Transfer Data By AC-link En 2.Cold Rest Timing: 6410将9714 resetb pin脚拉低:至少1usec,然后resetb pin脚拉高直到BITCLK startup: >162.8nsec warm-reset: 1)warm-reset timing: SYNC 拉高>1.3usec + >162.4ns 直到BIT_CLK开始工作
/
本文档为【AC97声卡技术讲解】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索