为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

第5章 数字媒体及应用

2011-01-19 50页 ppt 3MB 19阅读

用户头像

is_145523

暂无简介

举报
第5章 数字媒体及应用null第5章 数字媒体及应用第5章 数字媒体及应用5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用5.1 文本与文本处理 5.1 文本与文本处理 5.1.1 字符的编码 5.1.2 文本准备 5.1.4 文本编辑、排版与处理 5.1.3 文本的分类 5.1.5 文本的展现 文字处理是计算机应用的基础文字处理是计算机应用的基础计算机应用=使用计算机进行信息处理其中,文字信息处理是涉及面最广的一种计算机应用,几乎与任何领域任何人都有关。计算机文字处理过程计算...
第5章 数字媒体及应用
null第5章 数字媒体及应用第5章 数字媒体及应用5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用5.1 文本与文本处理 5.1 文本与文本处理 5.1.1 字符的编码 5.1.2 文本准备 5.1.4 文本编辑、排版与处理 5.1.3 文本的分类 5.1.5 文本的展现 文字处理是计算机应用的基础文字处理是计算机应用的基础计算机应用=使用计算机进行信息处理其中,文字信息处理是涉及面最广的一种计算机应用,几乎与任何领域任何人都有关。计算机文字处理过程计算机文字处理过程文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体 文本由一系列 “字符”(character)组成,每个字符均使用二进制编码表示 文本在计算机中的处理过程是:5.1.1. 字符在计算机中的表示 5.1.1. 字符在计算机中的表示 字符、字符集及其编码表 字符、字符集及其编码表 文字的基本元素是字母和符号,统称为“字符” (character),它包括:字母、数字、标点、符号等 字符集:一组特定字符的集合 不同的字符集包含的字符数目与内容不同,如: 中文字符集、西文字符集、日文字符集等 字符的编码: 字符集中每个字符的二进位表示,称为该字符的编码或代码(code) 不同的字符其编码各不相同 字符集中所有字符的编码的一览表,称为该字符集的码表复习:西文字符的编码——ASCII码复习:西文字符的编码——ASCII码西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成 美国标准信息交换码(ASCII码): ASCII字符集包含96个可打印字符和32个控制字符 采用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符 存在问题: 字符集太小(只有128个字符) 不同国家和地区使用不同的字符集及其编码,互不兼容 东亚地区使用的大字符集无法编码汉字如何编码?汉字如何编码?汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素,有多个国家和地区使用(中、日、韩、新、马······) 汉字的特点 数量大;字形复杂,同音字多,异体字多 如何编码? 确定收入多少字、哪些字? 在字符集中如何排列? 使用多少个二进位进行编码?常用的汉字编码字符集常用的汉字编码字符集国家标准GB2312-1980 汉字扩充 GBK 国家标准GB18030-2005 台湾地区的标准汉字字符集CNS 11643 (BIG 5,俗称“大五码”) 日本工业标准汉字字符集JIS X 0208-90 韩国国家标准汉字字符集KSC 5601-87 UCS/Unicode多文种大字符集GB2312汉字编码字符集GB2312汉字编码字符集1980年颁布《信息交换用汉字编码字符集·基本集》——GB2312-1980 GB2312字符集由三个部分构成:拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个共6763个汉字和682个符号,每个汉字和符号都有一个确定位置GB2312汉字的编码GB2312汉字的编码每一个GB2312汉字使用16位(2个字节)表示 为了与ASCII字符相区别,每个字节的最高位均为“1”例如: “南”字的代码是11000100 11001111 (用十六进制表示为C4CF) GBK汉字内码扩充规范 GBK汉字内码扩充规范 GB2312的不足: 汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容 GBK汉字内码扩充规范(1995): 在GB2312基础上,增加了1万多汉字(包括繁体字)和符号 共有21003个汉字和883个图形符号,如“計算機”、冃、冄、円、冇等繁体字和生僻字 与GB2312保持向下兼容,也使用双字节表示,第1字节最高位必须为“1”:UCS/Unicode多文种大字符集UCS/Unicode多文种大字符集背景:为了实现全球数以千计的不同语言文字的统一编码 :ISO将全球所有文字字母和符号集中在一个字符集中进行统一编码(目前共收集了17x216=1,114,112 个) ,称为UCS/Unicode UCS/Unicode的编码方案: 先实现部分字符的编码(共107,361个字符) 尽量与已有编码标准兼容 其中包含有中、日、韩统一整理出来的近3万汉字(称CJK汉字) 允许有若干不同的编码方案, 例如:GB18030汉字编码标准GB18030汉字编码标准背景:无论是Unicode的UTF-8还是UTF-16,其CJK汉字字符集虽然覆盖了我国已使用多年的GB2312和GBK标准中的汉字,但它们的编码并不相同 为了既能与UCS/Unicode编码标准接轨,又能保护我国已有的大量汉字信息资源,我国在2000年和2005年两次发布GB18030汉字编码国家标准。 GB18030实质上是UCS/Unicode字符集的另一种编码方案: 单字节编码(128个)表示ASCII字符 双字节编码(23940个)表示汉字,与GBK(以及GB2312)保持向下兼容,GBK不再使用 四字节编码(约158万个)用于表示 UCS/Unicode中的其他字符 GB18030目前已在我国信息处理产品中强制贯彻执行。 小结:几种汉字编码的对比小结:几种汉字编码的对比5.1.2. 文本准备 ——文稿如何输入计算机 5.1.2. 文本准备 ——文稿如何输入计算机 文字符号输入计算机的方法文字符号输入计算机的方法汉字键盘输入方法的比较汉字键盘输入方法的比较5.1.3 文本的分类5.1.3 文本的分类简单文本(纯文本 )简单文本(纯文本 ) 没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是 .txt 由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息 举例:丰富格式文本丰富格式文本本书由南京大学出版社(Publishing House of Nanjing University)出版 有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本” 丰富格式文本中,除了正文内容之外,还使用了许多“标记”来描述字符的属性和格式的设置。 举例:下面标题的格式为:中文用黑体,西文用Arial Black体,居中 使用HTML语言描述为:

本书由南京大学出版社(Publishing House of Nanjing University)出版

用一对< >指出的是标记,如等,用于说明排版的格式和文字属性,它们不属于正文内容正文内容超文本超文本若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成 “超文本”“超链”实际上就是一个指针,用于指向其他文本块,也可以指向同一文本块中的其他部分 超链是有向的,起点位置称为链源,它可以是文本块中的一个标题、一句句子、一个关键词、一幅画、一个图标等文本块可以是一个网页,一个文档,一段文字,也可以是一张图片,甚至一段声音或视频 小结:文本的分类小结:文本的分类5.1.4 文本的编辑与排版5.1.4 文本的编辑与排版复习:使用Word的操作流程复习:使用Word的操作流程创建新文档或打开老文档文稿输入编辑排版文档存盘、打印或发送输入中西文字、符号和图表进行增、删、改操作,保证文本的正确性满足清晰、美观、便于使用等要求例:Word 2003的文本处理功能例:Word 2003的文本处理功能英文拼写检查和英语同义词检查 字数统计 自动编写摘要 中文简繁体转换和术语转换 中英词语翻译 语法和格式检查 语音识别(口授命令和听写) 文档保护(防止打开或修改文档)5.1.5 文本的展现(输出)5.1.5 文本的展现(输出)文本的展现(输出)文本的展现(输出)使用的软件:文本阅读器/文本浏览器 嵌入在文本编辑(处理)软件中,如微软的Word, 独立的软件:如Adobe公司的Acrobat Reader,微软公司的IE等 2种不同的字库:电子书阅读器电子书阅读器“电子书阅读器” 是一种专门用于阅读各种电子文档(如.txt、 .doc 、 .html、.pdf 等)的专用硬件设备 采用电子墨水显示屏,被动发光,耗电极少,持续工作时间很长(1个月以上) 阅读效果接近纸质图书 轻薄,便于携带 颇有发展前景 5.2 图像与图形 5.2 图像与图形5.2.1 数字图像的获取 5.2.2 图像的表示与压缩编码 5.2.3 数字图像处理与应用 5.2.4 计算机图形5.2.1 数字图像的获取5.2.1 数字图像的获取图像的获取过程图像的获取过程从现实世界中获得数字图像的过程称为图像的“获取” 常用的图像获取设备:扫描仪、数码相机、摄像头、摄像机等 图像获取过程: 将画面划分为 M × N个网格,每个网格称为 一个取样点 将彩色图像取样点的颜色分解成R,G,B三个基色测量每个取样点的每个分量(基色)的亮度值对取样点每个分量的亮度值进行A/D转换,使用数字整型量表示 5.2.2 图像的表示与压缩编码5.2.2 图像的表示与压缩编码数字(取样)图像的组成数字(取样)图像的组成数字取样图像由M(列) × N(行)个取样点组成 取样点是组成数字取样图像的基本单位,称为“像素” 彩色图像的像素通常由3个彩色分量组成 灰度图像和黑白图像的像素只包含1个亮度分量 复习:黑白图象的表示复习:黑白图象的表示黑白图像的每个像素只有一个分量,且只用1个二进位表示,其取值仅“0”(黑)和“1”(白)两种例1:灰度图象的表示例1:灰度图象的表示灰度图像的每个像素也只有一个分量,一般用8~12个二进位表示,其取值范围是:0~2n-1,可表示2n个不同的亮度例2:彩色图象的表示例2:彩色图象的表示彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设3个分量分别用n,m,k个二进位表示,则可表示2n+m+k种不同的颜色数字(取样)图像的主要参数数字(取样)图像的主要参数图像大小(图像分辨率): 用来表示组成该图像的行列数目,亦即图像所包含的像素数目 使用 水平分辨率x垂直分辨率 表示 对图像清晰度和在屏幕上显示出来的大小有影响 颜色空间的类型,指彩色图像所使用的颜色描述方法,如: RGB(红、绿、蓝)模型,显示器使用 CMYK(青、品红、黄、黑)模型,彩色打印机使用 HSB(色彩、饱和度、亮度)模型,用户界面中使用 YUV(亮度、色度)模型,彩色电视信号传输时使用 像素深度,即像素的所有颜色分量的二进位数目之和数字图像的数据量数字图像的数据量数字图像数据量的计算公式(以字节为单位): 数据量=水平分辨率×垂直分辨率×像素深度/8 几种常用格式的图像的数据量: 例:数字图像传输时间的计算 假设数据传输速率为56 kb/s(电话上网),则传输一幅分辨率为640×480的6.5万种颜色的未压缩图像的最小时间为: (640x480x16)/56000 = 87.8秒数字图像的数据压缩数字图像的数据压缩图像数据压缩的必要性: 节省存储数字图像所需要的存储器容量 提高图像的传输速度,减少通信费用 图像数据压缩的可能性: 数字图像中有大量的数据冗余 人眼视觉有局限性,允许图像有一些失真 图像数据压缩的两种类型: 无损压缩:用压缩后的数据还原出来的图像没有任何误差 有损压缩:用压缩后的数据还原出来的图像有一定的误差 压缩编码方法的评价数字图像的常用文件格式数字图像的常用文件格式不同的图象文件格式采用了不同的数据压缩技术和数据组织方法,有不同的应用 常用的图像文件格式有: 图像文件格式例1:BMP格式图像文件格式例1:BMP格式BMP图像格式是Windows操作系统下使用的一种标准图像格式 支持单色、16色、256色、真彩色图像 一个文件一幅图像,可以进行无损压缩,也可不压缩 非压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows 应用软件都能支持图像文件格式例2: GIF 图像图像文件格式例2: GIF 图像颜色数目不超过256色 ,适合用作插图、剪贴画等色彩数要求不高的场合,文件特别小,适合网络传输 GIF图像格式具有累进显示功能,适合网络浏览器观看 GIF图像格式能支持透明背景(JPEG不支持) GIF图像格式能支持动画图像文件格式例3:JPEG图像图像文件格式例3:JPEG图像JPEG是静止图像数据压缩编码的国际标准,采用JPEG标准的图像文件扩展名是 .jpg JPEG特别适合各种连续色调的彩色或灰度图像,在计算机和数码相机中已得到广泛应用 JPEG的最新标准是JPEG2000(图像文件扩展名是 .jp2 ),它采用更先进的技术,可取得更好的效果,目前在医学图像处理中使用5.2.3 数字图像处理与应用5.2.3 数字图像处理与应用数字图像处理的应用数字图像处理的应用(1) 图像通信,包括图像传输、电视电话、电视会议等。 (2) 遥感 (3) 医疗诊断 (4) 工业生产中的应用,如产品质量检测,生产过程自动控制等 (5) 机器人视觉 (6) 军事、公安、档案管理等其他方面的应用常用的图像编辑软件常用的图像编辑软件Word和PowerPoint具有基本的图像编辑功能 Windows附件中的“画图”软件 微软Office工具中的Picture Manager ACD System公司的ACDSee32 Adobe PhotoShop5.2.4 计算机图形5.2.4 计算机图形什么是计算机图形(graphics)什么是计算机图形(graphics)通过计算机和软件对景物的结构、形状与外貌进行描述(称为“建模”),然后根据该描述和选定的观察位置及光线状况,生成该景物的图形(称为“绘制”或“图像合成”) 计算机图形也称为计算机合成图像 计算机制作图形的步骤如下: 景物的2种描述(建模)方法 景物的2种描述(建模)方法 例1:俄罗斯茶壶 例1:俄罗斯茶壶美国康乃尔大学Suzanne Smits 和Priamos Georgiades建模并绘制的俄罗斯茶壶 例2:计算机绘制的钢笔画和铅笔画例2:计算机绘制的钢笔画和铅笔画 木 桶 玻璃瓶引用自:Georges Winkenbach,D.Salesin (Univ.of Washington) pp.469-476, SIGGRAPH’96计算机图形的应用计算机图形的应用(1) 计算机辅助和辅助制造(CAD/CAM)。 (2) 利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等。 (3) 作战指挥和军事训练。 (4) 计算机动画和计算机艺术。 (5) 其它:电子出版、数据处理、工业监控、辅助教学、软件工程等。 矢量绘图软件矢量绘图软件专业绘图软件: AutoCAD、PROTEL和CAXA电子图板(机械、建筑等) MAPInfo、ARCInfo、SuperMap GIS (地图、地理信息系统) 办公与事务处理、平面设计、电子出版等使用的绘图软件: Corel公司的CorelDraw, Adobe 公司的Illustrator, Macromedia公司的FreeHand, 微软公司的Microsoft Visio等 MS Office中内嵌的绘图软件: Word 和 PowerPoint中的绘图功能(简单的二维图形 ) 小结:图像与图形的比较小结:图像与图形的比较计算机中的“图”按其生成方法可以分为两大类: 通过数字化设备获取的“图”,它们称为取样图像、点阵图像,或位图图像等,通常简称图像(image) 通过计算机建模并绘制而成的“图”,称为矢量图形,通常简称图形(graphics); 两者在外观上很难区分,但它们有许多不同的属性,一般需要使用不同的软件进行处理 小结:图像与图形的对比小结:图像与图形的对比 5.3 数字声音及应用 5.3 数字声音及应用5.3.1 波形声音的获取与播放 5.3.2 波形声音的表示与应用 5.3.3 波形声音的编辑 5.3.4 计算机合成声音5.3.1 波形声音的获取与播放5.3.1 波形声音的获取与播放声音的特性和类型声音的特性和类型声音由振动产生,通过空气进行传播 声音是一种波,它由许多不同频率的谐波组成 谐波的频率范围称为声音的“带宽”计算机处理的声音类型: 话音或语音(speech),专指人的说话声音,带宽仅为300~3400Hz 全频带声音(如音乐声、风雨声、汽车声等),其带宽可达到20Hz~20kHz 人耳可听到的声音统称“可听声”(audio) ,20Hz~20kHz数字波形声音的获取数字波形声音的获取步骤:2. 量化(quantization,模数转换 )3. 编码(encoding)1. 取样(sampling)数字波形声音的获取设备数字波形声音的获取设备声音的联机获取设备(声卡)声波转换为电信号声音的脱机获取设备:数码录音笔取样、量化和编码声音的重建与播放声音的重建与播放计算机输出声音分为两步: 1 声音的重建:把声音从数字形式转换成模拟信号形式,由声卡完成2 声音播放:将模拟声音信号经处理和放大后送到音箱(扬声器) 关于音箱: 普通音箱接收的是重建的模拟声音信号 数字音箱直接接收数字声音信号,失真更小 声卡的功能与逻辑组成声卡的功能与逻辑组成波形声音的获取与编码 波形声音的重建与播放 MIDI消息的输入 MIDI音乐的合成5.3.2 波形声音的 表示与应用5.3.2 波形声音的 表示与应用数字波形声音的表示及其参数数字波形声音的表示及其参数数字波形声音是使用二进位表示的一种串行比特流,其数据按时间顺序进行组织,文件扩展名为“.wav” 数字波形声音的主要参数有: 取样频率: 语音的取样频率低,一般为8k ~16k Hz 全频带声音(如音乐)取样频率高,一般为44.1k ~ 48k Hz 量化位数:通常为8位、12位或16位 声道数目:单声道为1,双声道为2 码率(比特率),每秒钟的数据量数字波形声音码率的计算数字波形声音码率的计算未压缩时数字波形声音的码率计算公式 码率 = 取样频率 × 量化位数 × 声道数 例:压缩编码之后数字波形声音的码率为: 压缩后的码率 = 未压缩时的码率/压缩倍数 例:上面CD唱片的立体声音乐压缩为MP3后,若压缩倍数是12倍,则该MP3音乐的码率是:118 kb/s左右数字波形声音的数据压缩数字波形声音的数据压缩数据压缩的必要性: 为了降低存储成本和提高在网络上的传输效率 数据压缩的可能性: 声音中包含有大量冗余信息; 人耳灵敏度有限,允许有一定失真而不易察觉 数字波形声音压缩编码的方法: 全频带声音:国际标准MPEG;工业标准Dolby AC-3 数字语音:固定电话使用ADPCM编码 手机使用高效率的混合编码技术所谓“MP3音乐”,它是一种采用MPEG-1层3编码的高质量数字声音, 压缩比大约10~12倍,使一张普通CD光盘上可以存储大约100首MP3歌曲,可连续播放10小时。 波形声音的文件类型及其应用 波形声音的文件类型及其应用 什么是流媒体?什么是流媒体?在因特网上收听(看)音(视)频节目的2种方式: 下载存储方式:先下载存储在计算机中,下载完毕后再播放(缺点:需要等待很长时间,并需要较大的存储容量) 流式传输方式:边下载、边播放(优点:只需要下载一部分数据之后, 就可以开始一边播放一边下载,等待时间短、存储需求小) 流媒体就是一种允许在网络上让用户一边下载一边收看(听)音视频媒体的媒体分发(delivery)技术 目前流行的主要有3个公司的流媒体技术: Real Networks公司的 Real Media (RealAudio和RealVideo) 微软公司的 Windows Media Services (WMA、WMV和ASF) 苹果公司的 Quick Time5.3.3 波形声音的编辑5.3.3 波形声音的编辑波形声音编辑软件的功能波形声音编辑软件的功能主要功能: 1 编辑声音:如声音剪辑、复制、调节音量 2 声音的效果处理:如混响、回声、淡入、淡出等 3 录音 4 声音的格式转换 5 播放声音声音编辑软件的 典型用户界面5.3.4 计算机合成声音5.3.4 计算机合成声音什么是计算机合成声音?什么是计算机合成声音?计算机合成声音就是计算机模仿人说话或演奏音乐 计算机合成声音有两类: 计算机合成话音(语音): 计算机模仿人把一段文字朗读出来,即把文字转换为说话声音(简称为 TTS) 应用:有声查询、文稿校对、语言学习、语音秘书、自动报警、残疾人服务等 计算机合成音乐: 计算机模拟各种乐器发声并按照乐谱演奏音乐 应用:计算机作曲、配器等例:计算机合成的语音例:计算机合成的语音Hello,everybody (1) 你好,我是贝尔实验室的中文语音合成系统(BellTTS1) 南京大学计算机系2002年招收了202名本科生,22名博士生,130多名硕士生。(中科大讯飞公司) (Bell) 安徽中科大讯飞信息科技有限公司是专门从事中文语音及语言技术软件 (讯飞) 我们都是同行,我们一路同行,去参加人参培植研讨会 (讯飞) (Bell)需要进一步提高之处:发音和断句要正确,提高自然度,丰富表现力计算机合成音乐(MIDI)计算机合成音乐(MIDI)计算机合成音乐需要三个要素:乐器、乐谱和“演奏员” 声卡上的音乐合成器能像电子琴一样模仿几十种不同的乐器发出声音,它按照MIDI消息合成出不同音色和音调的音符,通过扬声器播放出音乐来 乐谱在计算机中使用一种叫做MIDI的音乐描述语言来表示。使用MIDI描述的音乐称为MIDI音乐。一首乐曲对应一个MIDI文件,其文件扩展名为 .MID或 .MIDI媒体播放器软件相当于“演奏员”。播放MIDI音乐时,它先从磁盘上读入.MID文件,解释其内容,然后以MIDI消息的形式向声卡上的音乐合成器发出各种指令例:计算机合成的MIDI音乐例:计算机合成的MIDI音乐例1 音乐之声(6KB) 例2 军港之夜(7KB) MIDI的优点: 数据量极小(比CD立体声少3个数量级,比MP3少3个数量级) 易于制作和编辑修改 可以与波形声音同时播放 MIDI的不足: 只能合成音乐,不能合成歌曲和语言 音质与硬件设备相关小结:计算机中的数字声音小结:计算机中的数字声音数字声音的特点: 是一种连续媒体,传输与播放有实时性要求 数据量大,对存储和传输的要求比较高,必须进行压缩 数字声音的类型: 取样(波形)声音 数字语音:应用于电话、手机、多媒体配音等 全频带声音:CD和DVD音乐,数字电视伴音等 计算机合成声音 合成语音 合成音乐(MIDI)5.4 数字视频及应用5.4 数字视频及应用5.4.1 数字视频基础 5.4.2 数字视频的压缩编码 5.4.3 数字视频的编辑 5.4.4 合成视频——计算机动画 5.4.5 数字视频的应用 5.4.1 数字视频基础5.4.1 数字视频基础彩色电视信号的发送与接收彩色电视信号的发送与接收彩色电视信号的发送与接收:PAL制彩色电视信号的颜色不使用RGB表示,而是使用亮度信号Y和两个色度信号U、V来表示 为进行远距离传输必须进行调制 将Y、U、V信号转换成为R、G、B 信号,然后再进行显示使用Y、U,V彩色空间的原因: ①与黑白电视保持兼容 ②利用人的视觉特性来节省电视信号的带宽和发射功率数字视频信号的获取数字视频信号的获取 视频信号的数字化过程: 与图像、声音的数字化过程相仿,但更复杂一些 数字视频的获取设备: 视频采集卡(简称视频卡) 数字摄像头,通过光学镜头和CCD或CMOS采集动态图像,转换成数字信号并输入PC机 脱机获取设备:数码摄像机视频捕获(采集)卡的功能视频捕获(采集)卡的功能从多种视频源中选择一种作为视频输入; 支持不同的电视制式; 能同时处理图像信号的伴音; 可在显示器上监看输入的视频信号, 其位置及大小可调; 能将计算机生成的图像/图形/文本与视频图像迭加处理; 可随时冻结(定格)一幅画面,并按指定格式保存; 可 实时压缩与存储视频及其伴音信息; 可 实时解压缩并播放视频及其伴音信息,输出设备可选(VGA监视器、电视机、录相机等)视频卡、显卡与主机的关系视频卡、显卡与主机的关系硬 盘(主机)视频信号数字化并存入硬盘在屏幕上监看视频信号计算机图形文字输出在电脑上播放视频在电视机上播放视频数字摄像头数字摄像头分辨率为352×288 ~640×480 速度一般在30fps(每秒30帧)左右 镜头的视角可达到45-60度 支持USB接口 或IEEE1394(火线)接口 成像器件采用CMOS或CCD 数码摄像机 数码摄像机 提供480线以上的分辨率,清晰度高 自动对焦,自动曝光 使用MPEG-2进行压缩编码,然后记录在硬盘上 具有录音功能 数据量很大,采用USB接口或IEEE1394接口 5.4.2 数字视频的压缩编码5.4.2 数字视频的压缩编码数字视频的压缩编码数字视频的压缩编码视频数据压缩的必要性: 数字视频的数据量大得惊人,1分钟的数字电视图像未压缩时其数据量可超过1GB,对存储、传输和处理都有很大的困难 视频数据压缩的可能性: 视频信息的每个画面内部有很多信息冗余 相邻画面的内容有高度的连贯性 人眼的视觉灵敏度有限,允许画面有一定失真 结论: 数字视频的数据量可压缩几十倍甚至几百倍 数字视频的三类编码标准数字视频的三类编码标准ITU-T国际标准:H.261(Px64)标准、 H.263标准等 ISO/IEC 国际标准: MPEG-1标准, MPEG-2标准(等同于ITU-T H.262), 用于低分辨率、低码率视频应用的MPEG-4 ASP, 代表当前技术水准的MPEG-4 AVC视频编码标准(等同于ITU-T H.264),在HDTV、蓝光盘、XBOX、iPod、iPhone等众多领域得到推广应用。 公司标准:Intel公司的Indeo•Video,苹果公司在QuickTime中使用过的Cinepak, Real Network公司的RealVideo,微软公司的 WMV,Adobe公司Flash播放器中使用的VP6等目前流行的数字视频编码标准目前流行的数字视频编码标准背景材料: 什么是MPEG-4 ASP和MPEG-4 AVC背景材料: 什么是MPEG-4 ASP和MPEG-4 AVCMPEG-4是数字音视频压缩编码的国际标准 MPEG-4分成23个部分,其中part 2和part 10是视频编码 为了适应不同应用对视频图像大小和质量的不同要求,每种视频编码标准都分成若干level和profile: MPEG-4 Part 2 分成21个profile,ASP(Advanced Simple Profile)是其中之一,其技术特点是:画面分辨率较低,最低码率仅64kb/s左右,但画面质量好,复杂度中等 MPEG-4 Part 10又称为MPEG-4 AVC (Advanced Video Coding). 它是目前技术最先进的视频编码案,分成7个profile,可用于HDTV音像文件与播放器音像文件与播放器播放器(Plaper)实际上就是一种解码器,但通常既可以解码多种类型的信息(音频、视频、图片、···),还能解码多种不同类型的音像文件格式。 PC上使用的是软件播放器,一台计算机可以安装多个不同的播放器: 微软公司的“Microsoft Media Player”, 苹果公司的QuickTime Player和iTunes, Real公司的RealPlayer (简称RealOne 播放器) “全能”播放器:Storm Player(暴风影音)、The KMPlayer、绚彩魅影、变色龙万能播放器(PPStream)、豪杰超级解霸,等等 硬件播放器(便携式): MP3播放器:以播放MP3格式的音频信息为主,也能收听广播、观看文本和图片,功能更强一些的还能播放视频信息 MP4播放器:以播放视频为主,国外叫做PVP(个人视频播放器)或PMP(便携式媒体播放器),LCD屏幕较大,价格较高MP4MP4MP4播放器是一种能够播放视频的便携式设备,也叫做PVP(个人视频播放器)或PMP(便携式媒体播放器) 功能: 看录像(电影) 播放音乐 浏览文本和图片 甚至还可以上网 技术特点: 自带2~5英寸的LCD屏 存储容量达几十GB5.4.3 数字视频的编辑5.4.3 数字视频的编辑例:简单的视频编辑软件 ——Windows Movie Maker 例:简单的视频编辑软件 ——Windows Movie Maker 由微软公司开发,在Windows XP平台上运行 功能: 通过摄像机、数字摄像头或其他视频源将音频和视频捕获到计算机中 打开已有的音频、视频或静止图片,对音频与视频内容进行编辑(包括添加片头、使用视频过渡或特技效果等) 将制作的视频保存到硬盘中,或刻录在CD或DVD光盘上,供“媒体播放器”进行播放 5.4.4 合成视频—— 计算机动画5.4.4 合成视频—— 计算机动画什么是计算机动画?什么是计算机动画?计算机动画——使用计算机生成一系列内容连续的画面供实时演播的一种技术,它是一种计算机合成的数字视频,而不是用摄像机拍摄的“自然视频” 上世纪九十年代开始,计算机动画技术应用于电影特技,如电影“侏罗纪公园”、 《玩具总动员》、《泰坦尼克》等,取得轰动效应 应用领域: 影视和广告领域:电影特技、动画片、电视广告制作等 教育和领域:辅助教学、驾驶员训练等 科技领域:科学计算可视化,复杂系统的动态模拟 军事领域:军事训练、作战模拟等 游戏选讲: 计算机动画的制作过程选讲: 计算机动画的制作过程计算机动画制作包括:在计算机中建立景物的模型、描述它们的运动、生成一系列逼真的图像 三维计算机动画制作过程分以下几个阶段: (1)描述景物的形状与结构(建模) (2)确定景物的颜色和材质(纹理) (3)设置灯光和确定虚拟摄像机的位置 (4)描述场景中物体的运动和摄像机的移动 (5)绘制一系列的图像 (6)输出动画结果例:三个简单动画例:三个简单动画例1例2例3例4动画制作软件动画制作软件著名的造型与动画制作的商品化软件: 加拿大Alias公司的Power animator 法国TDI公司的Explore 荷兰ElectroGIG公司的3DGO 加拿大Vertigo公司的Vertigo 美国Wavefront公司的Advanced Visualizer 美国SGI公司Alias和Wavefront 公司的MAYA 美国Autodesk公司Discreet公司的3ds max,Animator Studio互联网动画:GIF和Flash互联网动画:GIF和FlashGIF动画(参见5.2节): Adobe(Macromedia)公司的Flash动画 画面大小可任意调节,用户可控制播放过程 既可生成自动可执行文件(*.exe),还可生成用 Flash 播放器播放的文件 (*.SWF); 既可做成单独的动画,也可以嵌入网页文件 采用流式传输方式,可以边下载边进行播放 演示 5.4.5 数字视频的应用5.4.5 数字视频的应用VCD与DVD 可视电话与视频会议 数字电视 点播电视什么是VCD, 什么是DVD ?什么是VCD, 什么是DVD ?VideoCD(简称VCD):按MPEG-1标准将60分钟的音频/视频节目记录在一张CD光盘上,图像质量为VHS (352×240),即家用录放像机的水平,可播放立体声 DVD-Video(简称为DVD影碟):按MPEG-2标准将音频/视频节目记录在DVD光盘上,图像质量为广播级 (720×576),可播放5.1声道的环绕立体声,单面单层DVD(容量为4.7GB)光盘可记录120分钟以上的影视节目VCD与DVD的比较VCD与DVD的比较可视电话和视频会议可视电话和视频会议可视电话:通话双方能互相看见的一种电话系统 电话机具有摄像、显示、声音等功能,内置高质量CCD镜头及MODEM 视频会议:多人同时参与的一种音/视频通信系统 类似于可视电话,但多人参加通话,提供的功能也更加丰富 两种实施方式: 在电信局的数字通信网上进行 在互联网上进行,例如使用下列即时通信软件: 微软的MSN Messenger,腾迅的QQ,网易的POPO,新浪的UC等什么是数字电视 ?什么是数字电视 ?数字电视指的是:电视节目的制作(摄录、编辑)、处理、传输、接收播放全过程的数字化,特别是将电视信号进行数字化之后以数字形式进行传输和接收; 数字电视的范围: 高端——全高清晰度电视(HDTV),分辨率1920x1024 中端——常规模拟电视的数字化(DTV),720x480 低端——包括互联网上的IPTV等 数字电视的优点数字电视的优点(1) 频道利用率高 可传输的数字电视节目比传输模拟电视节目增加好几倍 (2) 抗干扰能力强 同等传输条件下的抗干扰能力优于模拟电视 (3) 图像清晰度高 用户接收到的图像质量能达到演播室水平 (4) 音响效果好 具有CD级音质效果,可支持5.1环绕立体声家庭影院 (5) 可开展基于TV的交互式数据业务 包括电视购物、电视银行、电视商务、电视游戏、点播电视等业务 数字电视的传播途径 数字电视的传播途径 什么是点播电视(VOD) ?什么是点播电视(VOD) ?VOD(点播电视)指用户可以自己选择观看需要的电视节目,改变了电视台播什么用户只能看什么的电视收看模式 小结:为什么使用数字视频?小结:为什么使用数字视频?数字视频易于使用计算机编辑、修改和处理 数字视频有利于存储和复制,复制不会产生失真 数字视频有利于传输(节省频率资源,抗干扰能力强) 数字视频可以通过计算机网传输 用户接收的数字图像质量更好(可达演播室水平) 数字视频容易与其它媒体(声音、文字等)组合使用 数字视频便于进行管理和检索
/
本文档为【第5章 数字媒体及应用】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索