多媒体技术应用教程2
多媒体技术应用(选修2)第一章第一节
第一章 走进多媒体技术
第一节 初识多媒体技术 第二节 体验多媒体技术
● 多媒体
电脑都有些什么功能? 音乐(声音) 小说(文字)游戏(动画) 电影(动画) 漫画(图像)制图(图形)
多媒体: 我们所看到这些文字,声音,图像,
图形,动画等信息的组合称为媒体。
● 多媒体技术
C.多媒体包括文本、图片等媒体元素
D.多媒体是利用计算机把声音、文本等媒体集合成一体的技术
2.以下哪一组不属于多媒体中的媒体元素 ( )
A.文本和声音
B.图形和图像
C.磁盘和光盘
D.视频和动画
第一节 初识多媒体技术
六、教学反思
1、课前在机房通过屏幕播放多媒体的精彩片段,并且伴有 介绍、部分特写镜头及文字说明等,让学生第一次进入机 房就能够感受多媒体作品的效果。
1
● 定义 多媒体技术是利用计算机对文字、图像、图形、动画、音频、视
频等多种信息进行综合处理、建立逻辑关系和人机交互作用的产物。
2
3
4
●多媒体中的媒体元素 文字
多媒体 多媒体 多媒体
各类文字和符号
● 多媒体中的媒体元素
文字 图形
通过计算而描述的矢量图形
● 多媒体中的媒体元素
文字 图形 图像
用像素点描述的自然影像
●多媒体中的媒体元素
文字 图形 图像 动画
单画面矢量动画 多画面帧动画
FRAME 01 FRAME 02 FRAME 03 FRAME 04 FRAME 05 FRAME 06 FRAME 07
单画面矢量动画、多画面帧动画
●多媒体中的媒体元素
文字 图形 图像 动画 音频
● midi音频 ● wav音频 ● mp3压缩音频
多媒体技术及应用第二版课后习题及答案
第一章1.单选题(1)由美国Commodore公司研发的世界第一台多媒体计算机系统是( B )。
A. Action Media 750B. AmigaC. CD-ID. Macintosh(2)由美国Apple公司研发的多媒体计算机系统是( D )。
A. Action Media 750B. AmigaC. CD-ID. Macintosh(3)媒体有两种含义,即表示信息的载体和(B )。
A. 表达信息的实体B. 存储信息的实体C. 传输信息的实体D. 显示信息的实体(4)(A )是指用户接触信息的感觉形式,如视觉,听觉和触觉等。
A. 感觉媒体B. 表示媒体C. 显示媒体D. 传输媒体(5)( B )是用于处理文本、音频、图形、图像、动画和视频等计算机编码的媒体A 感觉媒体B表示媒体 C 显示媒体D存储媒体(6)多媒体技术是将( C )融合在一起的新技术。
A. 计算机技术,音频技术,视频技术B. 计算机技术,电子技术,通信技术C. 计算机技术,视听技术,通信技术D. 音频技术,视频技术,网络技术(7)多媒体技术的主要特性有( D )A 多样性、集成性、交互性B 多样性、交互性、实时性、连续性C 多样性、集成性、实时性、连续性D多样性、集成性、交互性、实时性(8)计算机主机与显示器之间的接口是( C )。
A. 网卡B.音频卡C. 显示卡D. 视频压缩卡(9)( D )属于多媒体外部设备。
A. 显示适配器B. 音频卡C. 视频压缩卡D. 数字摄像头(10)多媒体软件可分为(C )。
A. 多媒体系统软件,多媒体应用软件B. 多媒体系统软件,多媒体操作软件,多媒体编程语言C. 多媒体系统软件,多媒体支持软件,多媒体应用软件D 多媒体操作系统,多媒体支持软件,多媒体著作工具(11)多媒体素材制作工具是(D )A. FrontPageB. AuthorwareC. PowerPointD. Flash(12)Adobe Premiere应属于(D )。
多媒体应用技术(第2版)习题解答
第一章多媒体技术概述一、填空题1. 媒体2. 图形(或矢量图)3. 多媒体4. 多媒体技术5. 多媒体系统6. 多媒体硬件系统7. 素材制作软件8. 有损压缩9. 虚拟现实技术10.流媒体技术11.交互性12.客户端系统13.IVOD二、选择题1-5:DDDCB 6-10:ACCBB 11: B三、简答题略第2章常见的媒体及处理软件一、填空题1. 编码2. 离散、数字3. 矢量图4. 矢量图形5. 饱和度6. 颜色相减原理7. RGB8. 颜色相减原理9. 亮度通道10.数字图像11.振幅12.模拟13.二进制14. 量化15.两倍16. 0.1~0.4 17.视觉暂留18.中国水墨画技法19.折纸动画20.黏土动画21.逐格22.计算机动画23.视频24.图像25.帧率26.有损压缩无损压缩27. 三维软件建模二、选择题1-5:DCBDD 6-10:BBACC 11-15:CDBCD 16-20:BABCB21-25:DBCAC 26-30:BDBCC 31-35:DDADB 36:B三、简答题略第3章图形编辑软件CorelDraw的使用一、填空题1.矢量2. .cdr、.cdrt3.黑蓝4.用鼠标左键双击“矩形工具”5.左键、右键、右键6.形状工具7. 双击单击8.后、底9.水平、垂直10. 扭曲变形11. 拉、花瓣、推、爆炸12.段落文本二、选择题1-5:ABBCC 6-10:CCABA 11-15:BACBD 16-20:ACBDB 三、简答题略四、操作题略第4章数字音频编辑软件Adobe Audition的使用一、填空题1. 音频处理2. 波形编辑器3. 多轨编辑器4. 会话文件5. 库面板6. 状态栏7. 空白音频文件8. 波形编辑器9. WAV 10. 多轨11. 混合式粘贴二、选择题1. C2. C3. A、B4. C5. B、D6. B三、简答题略四、操作题略第5章动画编辑软件Adobe Animate的使用一、填空题1. 矢量图形流式播放2.交互3.矢量图形4.不会5.重复元件6. 交互7.多边形魔术棒8.每一帧9.沿直线或曲线10. 显示出来不会显示11. 骨骼工具二、选择题1-5:CACBA 6-8:CCC三、简答题略四、操作题略第6章视频编辑软件Video Studio的使用一、填空题1.编辑2.库面版3.时间轴4.5条5.白平衡6.滤镜7.转场8.自动音乐9.多文字框二、选择题1-5:ABBBC三、简答题略四、操作题略第7章视频特效处理软件After Effects的使用一、填空题1.影视后期制作的软件2.动态图形或图形动画3.帧速度4.横向和纵向5.长宽比6.二维7. Z 8.过渡效果9.蒙版10. 3D图层按钮二、选择题1-5:BDABC 6:C三、简答题略四、操作题略。
高中信息技术 《多媒体技术应用》课件 选修2
三、教学方法
• 常用的教学方法 3、WebQuest教学法
WebQuest启示我们可以通过网络,实现专家与教师 之间,教师与教师之间,教师与学生之间的平等对 话,共同协商构筑课程,共同改革课程的研制方式, 让更多的基层教师作为主体参与到课程的研制中 来.
WebQuest通过引领学生设计网络主题探究课,与学 生一起进行网络主题探究,可以通过网络共享促 进教师之间的群体合作,促进教师的专业发展提 高教师的教学水平.
方法 • 掌握多媒体作品制作中的具体技能 • 掌握多媒体技术发展的趋势 • 可以流利地在日常学习和生活中利
用多媒体技术
二、教材回顾
《多媒体技术应用》教材的结构
本教材共八章,结构如下: 第一章 认识多媒体技术 第二章 多媒体作品的规划与设计 第三章 多媒体信息的类型及其特征 第四章 图形图像的采集与加工 第五章 声音、动画、视频的采集与加工 第六章 多媒体作品的集成 第七章 多媒体作品的发布和评价 第八章 虚拟现实与流媒体技术初步
《多媒体技术应用》教材的编写思路
3、教材编写突出多媒体技术的有 关原理和方法
不再是以某种软件的操作 为主要内容。
对《多媒体技术应用》的教学支持
1、教学内容的选取注重层次性、选择性和开放性 (如图像的采集方法部份的内容) 2、根据现代教育思想,进行教学设计 (如本书中设置的各种栏目) 3、本教材配备了教学光盘,方便教学活动
三、教学方法
• 常用的教学方法 4、基于问题的学习
在基于问题的学习活动中,学生用自己的眼睛看,用自 己的耳朵听,用自己的嘴说话,还亲自使用、操作学习 材料,搜索信息.耕种要的是用自己的大脑思考,对信息 进行分析、评价、整理组织学习内容,经理解决问题 的全过程。用心灵感悟学习的乐趣。
多媒体技术及应用2音频处理技术Audition3.0(陈永强)
数学与计算机学院 陈永强 Email:chenyqwh@
2013-2014-2
1
第二章 音频处理技术
2.1 音频基本原理 2.1.1 人类听觉特性 2.1.2 数字音频 2.1.3 声音 2.1.4 语音 2.2常用音频压缩标准 2.2.1音频压缩基础 2.2.2常用音频压缩标准 2.2.3音频文件格式 2.3音频处理软件Audition 2.3.1功能介绍 2.3.2编辑环境 2.3.3基本操作 2.3.4操作实例
2
第二章 音频处理技术
2.3音频处理软件Audition 2.3.1功能介绍 2.3.2编辑环境 2.3.3基本操作 2.3.4操作实例
3
Adobe公司创建于1982年,是世界领先的数字媒体 和在线营销解决方案供应商。 公司总部位于美国加利福尼亚州圣何塞,在世界各 地员工人数约 7000名。 Adobe 的客户包括世界各地的企业、知识工作者、 创意人士和设计者、OEM 合作伙伴,以及开发人 员。
8
2.3.2编辑环境
Audition提供了三种专业的工作视图界面,包括: 编辑视图(Edit View) 多轨视图(Multitrack View) CD视图(CD View)
9
2.3.2编辑环境
1.多轨视图(Multitrack View) Audition 3.0启动后,进入如图2-16所示的多轨视图 界面。多轨视图界面中有标题栏、菜单栏、工具 栏、主群组、文件列表区、传送器、计时器、状 态栏、多音轨区及会话属性等。
20
2.3.3基本操作
2.多轨视图 (1)打开或创建一个音频文件 (2)插入或录制音频文件 (3)施加效果 (4)混合轨道 (5)输出
多媒体技术应用(选修2)第三章第一节
第三章 计算机中的声音世界
上海科技教育出版社
黑龙江省佳木斯市第一中学信息技术教研室
第三章 第一节 声音的录制
上海科技教育出版社
声音的录制
任务一
1.上网查找声音是如何进入计算机的? 2.上网查找计算机是如何输出声音的?
进入?
输出?
声音的录制
产生数字信号
A/D D/A
奎斯特理论 只有采样频率高于声音信号最高频率的两倍时, 才能把数字信号表示的声音还原成为原来的声音
声音的录制 单声道
声道
双声道
声音的录制
计算题
一CD唱片大小为600MB,它的采样频率为44.1kHz ,量化位数为16位,双声道. 则 此唱片能储存多长时间的音乐?
一分钟数据:(44.1×16×2/8×60=10335.9KB 10335.9KB/1024=10.09MB
特点(文件大小,声音质量,有无音损,其它)
MP3格式
MIDI格式
16
立体声
11.025
8
单声道
16
立体声
声音的录制
1.声音的幅度 2.声音的频率
声音的录制
采样频率
存储
量化位数
11111111 1111111111111111
8位 16位
声音的录制
小常识
奈奎斯特,美国物理学家,1889年出生在 瑞典。1976年在德克萨斯逝世。奈奎斯特 对信息论做出了重大的贡献。奈奎斯特 1907年移民到美国并于1912年进入北达克 塔大学学习。1917年在耶鲁大学获得物理 学博士学位。1917年~1934年在AT&T公司 工作,后转入贝尔电话实验室工作
时长: 600/10.09=59.46分钟
高中信息技术《多媒体技术应用》课件选修22024新版
文本 图形与图像
声音 动画与视频
文本是多媒体作品中最基本的元 素之一,可以提供详细的信息和 描述,是其他媒体元素的基础。
声音是多媒体作品中的关键元素 之一,可以提供丰富的听觉体验 ,增强作品的表现力和感染力。
多媒体技术发展
多媒体技术经历了从单一媒体到多媒体、从单机到 网络、从专业到普及的发展历程,目前已经成为信 息社会的重要基础设施。
多媒体技术应用领域
教育与培训
娱乐与游戏
多媒体技术广泛应用于远程教育、在线学 习、课堂教学、职业培训等领域,提供了 丰富的教学资源和交互式的学习环境。
多媒体技术为娱乐和游戏产业提供了强大 的技术支持,包括音乐、电影、电视、游 戏等方面。
高中信息技术《多媒体技术应用》 课件选修2
目录
• 多媒体技术应用概述 • 图像处理技术 • 音频处理技术 • 视频处理技术 • 动画设计技术 • 多媒体技术应用实践
01
多媒体技术应用概述
Chapter
多媒体技术定义与发展
多媒体技术定义
多媒体技术是指利用计算机对文本、图形、图像、 声音、动画、视频等多种信息综合处理、建立逻辑 关系和人机交互作用的技术。
02
图像处理技术
Chapter
图像类型与格式
图像类型
包括位图图像和矢量图像两种类型。位图图像由像素点组成,放大后会出现锯齿状失真;矢量图像由数学公式描 述,可无限放大而不失真。
图像格式
常见的图像格式有JPEG、PNG、GIF、BMP等。JPEG格式适合存储照片和复杂图像,支持有损压缩;PNG格式 支持透明背景和无损压缩,适合存储图标和简单图像;GIF格式支持动画和透明背景,适合存储动态图像;BMP 格式是Windows系统下的标准图像格式,不支持压缩。
多媒体技术与应用2
2.1 概述
2.1.1 多媒体计算机系统的组成 2.1.2 多媒体计算机硬件系统 2.1.3 多媒体计算机软件系统 2.1.4 常用多媒体处理软件
毕.3 多媒体计算机软件系统
多媒体计算机的层次结构
多媒体软 件系统
多媒体应用软件 多媒体系统软件
多媒体计算机硬件系统
毕节学院 ——数学与计算机科学学院
2.2.3 视频卡
视频采集卡的结构
多通道 视频输入
A/D 转换
视频信号 帧存储器
D/A 转换
显示 输出
视频采集控制器
计算机主机
毕节学院 ——数学与计算机科学学院
2.2.3 视频卡
视频卡输出接口:既连接
计算机主板的接口,如PCI总线 接口或PCI-E接口,也有外置的 USB接口和1394接口。
第2章 多媒体计算机系统
2.1 概述 2.1.1 多媒体计算机系统的组成 2.1.2 多媒体计算机硬件系统 2.1.3 多媒体计算机软件系统 2.1.4 常用多媒体处理软件 2.2 多媒体接口卡 2.2.1 声卡 2.2.2 显卡 2.2.3 视频卡 2.3 多媒体输入输出设备 2.3.1 多媒体输入设备 2.3.2 多媒体输出设备 2.4 多媒体存储设备 2.4.1 光存储系统原理
毕节学院 ——数学与计算机科学学院
2.3.2 多媒体输出设备
多媒体计算机的输出设备主要包括显示器、打印机以 及音响设备。
显示器 音响设备 打印机 投影仪
毕节学院 ——数学与计算机科学学院
● 显示器
CRT(阴极射线管)显示器
点距 像素和分辨率 刷新频率 视频带宽
主板插槽
视频卡输入接口:既连接
模拟视频设备的接口。一般, 至少要具有一个复合视频接口 (Video In),高性能的采集卡 一般具有一个复合视频接口和 一个S-Video接口,
多媒体技术及应用第二版教学设计 (2)
多媒体技术及应用第二版教学设计课程背景在当今信息技术高速发展的时代,懂得运用多媒体技术已经成为现代人的基本素质之一。
而多媒体技术的应用在教育、广告、娱乐等领域都有广泛的运用。
本课程拟就多媒体技术的基础原理以及应用进行学习和探究,让学生了解多媒体技术的基础概念和应用场景,掌握多媒体技术的基本操作和制作方法。
教学目标•了解多媒体技术的基本概念、发展历程及应用范围;•熟悉多媒体软件的操作方法,能够独立完成基本多媒体制作任务;•培养学生思维能力、创造能力和应变能力。
教学内容单元一:多媒体技术基础1.多媒体技术基本概念•多媒体的概念•多媒体技术的发展历程•多媒体应用领域2.数字音频技术•声音的基本参数•音频文件格式•音频软件 Audacity 的使用3.数字视频技术•数字视频的基本介绍•视频文件格式•视频编辑软件 Premiere Pro 的使用单元二:多媒体制作技巧1.多媒体素材制作•素材策划与拍摄流程•多媒体素材制作软件 Photoshop 的使用•多媒体素材制作软件 Illustrator 的使用2.多媒体制作•多媒体制作的基本流程•多媒体制作软件 Flash 的使用•多媒体制作软件 Dreamweaver 的使用单元三:多媒体应用1.多媒体与教育•多媒体在教学中的应用•教育多媒体制作工具介绍2.多媒体与广告•广告多媒体制作流程•广告多媒体制作软件 After Effects 的使用教学方法•前传法•课堂讲解•课堂演示•课堂练习•课后作业教学评估•作业评分•期末考试实践教学本课程实践教学环节主要包括多媒体素材的拍摄及制作、多媒体应用场景模拟、多媒体工具使用交流等项目:实践项目一:多媒体素材制作学生通过团队合作方式完成多媒体素材制作的任务,包括海报设计、视频剪辑、音频制作等。
实践项目二:多媒体应用场景模拟学生自行组织教育、广告、娱乐等不同场景的多媒体制作模拟,深入体验多媒体技术的应用。
实践项目三:多媒体工具使用交流学生通过介绍自己熟悉的多媒体工具,分享制作经验、交流心得,提高多媒体制作技能。
多媒体技术及应用第二版课后习题及答案
第一章1.单选题(1)由美国Commodore公司研发的世界第一台多媒体计算机系统是( B )。
A. Action Media 750B. AmigaC. CD-ID. Macintosh(2)由美国Apple公司研发的多媒体计算机系统是( D )。
A. Action Media 750B. AmigaC. CD-ID. Macintosh(3)媒体有两种含义,即表示信息的载体和(B )。
A. 表达信息的实体B. 存储信息的实体C. 传输信息的实体D. 显示信息的实体(4)(A )是指用户接触信息的感觉形式,如视觉,听觉和触觉等。
A. 感觉媒体B. 表示媒体C. 显示媒体D. 传输媒体(5)( B )是用于处理文本、音频、图形、图像、动画和视频等计算机编码的媒体A 感觉媒体B表示媒体 C 显示媒体D存储媒体(6)多媒体技术是将( C )融合在一起的新技术。
A. 计算机技术,音频技术,视频技术B. 计算机技术,电子技术,通信技术C. 计算机技术,视听技术,通信技术D. 音频技术,视频技术,网络技术(7)多媒体技术的主要特性有( D )A 多样性、集成性、交互性B 多样性、交互性、实时性、连续性C 多样性、集成性、实时性、连续性D多样性、集成性、交互性、实时性(8)计算机主机与显示器之间的接口是( C )。
A. 网卡B.音频卡C. 显示卡D. 视频压缩卡(9)( D )属于多媒体外部设备。
A. 显示适配器B. 音频卡C. 视频压缩卡D. 数字摄像头(10)多媒体软件可分为( C )。
A. 多媒体系统软件,多媒体应用软件B. 多媒体系统软件,多媒体操作软件,多媒体编程语言C. 多媒体系统软件,多媒体支持软件,多媒体应用软件D 多媒体操作系统,多媒体支持软件,多媒体著作工具(11)多媒体素材制作工具是(D )A. FrontPageB. AuthorwareC. PowerPointD. Flash(12)Adobe Premiere应属于(D )。
多媒体技术原理及应用二
多媒体技术原理及应⽤⼆多媒体信息存储特点:多媒体信息存在和表现有多种形式.多媒体信息量⼤.光盘系统特点:(1)与硬盘相⽐,具有可拆卸性;容量相当;驱动器较贵,但盘⽚便宜;读写速度慢.(2)与磁带相⽐,具有容量⼤,随机存取性强的优点.(3)激光头与介质⽆接触,不受环境影响⽽退磁,信息保存时间长,可达30年以上.光盘按读写功能的分类:CD-ROM只读光盘WORM⼀次写多次读光盘(write once read many)Rewritable可重写光盘DVD(digital video disc)光盘⼯作原理:只读光盘读原理,只读光盘上的信息沿着盘⾯螺旋形状的信息轨道以凹坑和凸区的形式记录的.凹凸交界的正负跳变沿均代表数字"1",两个边缘之间代表数字"0"数字信息记录的优点是抗⼲扰能⼒强,由于盘⽚损坏或变脏⽽造成的读出错误也容易得到纠正.按照改变性质来实现信息存储的原理来分,光盘记录⽅式可分为两⼤类:磁光式和相变式.磁光式写操作⽅法:居⾥点记录和补偿点记录.相变式写过程是把记录介质的信息点从晶态转变为⾮晶态.CD-DA是CD的最基本标准. Red Book,特定的地址标记,其单位为"分","秒","扇区",1分=60秒,1秒=75扇区.光盘总长度为74分.错误的检测和校正采⽤的是 CIRC(cross interleave Reed-Solomon code)CD-ROW ,Yellow Book,采⽤常线速(const linear velocity,CLV)伺服⽅式.MTBF(mean time between failures)可录CD(recordalbe compact disc),Orange BookCD-I,Green BookVideo CD ,White Book错误检测码:error detection code ,EDC错误校正码:error correction code,ECC信息扇区:message sector光盘符号由3个记录构成:⽂件结构卷描述符(file structure volume descriptor)引导记录(boot record)终结记录(terminator record)视盘有两种信息记录格式:常线速(const linear velocity,CLV)常⾓速(costant angular velocity,CAV)DVD光盘:容量最⾼的双层双⾯盘可达17GB,单⾯单层4.7GB.存储133分钟的MPEG-2视频.⾳频卡的主要功能:数字化声⾳处理混⾳器合成器variable length coder可变长编码器block storage unit元块存储microcode宏码⽬前,⼤多数扫描仪采⽤的光电转换部件是CCD(电荷耦合器件)扫描仪分为:平板式,⼿持式,滚动式.监视器:monitor适配器:adaptor触摸屏包括三个部分:传感器,控制部件,驱动程序触摸屏按⼯作原理可分为:红外线触摸屏,电阻式触摸屏,电容式触摸屏,表⾯声波技术和底座式⽮量压⼒触摸屏.多媒体个⼈机(multimedia personal computer,MPC)基本的硬件结构:(1)⼀个功能强⼤,速度快的中央处理器CPU(2)⼤容量的存储器空间(3)⾼分辨率显⽰接⼝与设备(4)可处理⾳响的接⼝与设备(5)可存放⼤量数据的配置等CD-I系统是家⽤交互式多媒体系统.管理程序主要有:光盘⽂件管理模块CDFM(compact disc file manager)⽤户通信管理模块UCM(user communication manager)⾮易失RAM⽂件管理模块NRF(nonvolatile RAM file manager)流式⽂件管理模块PFM系统状态描述符CSD(configuration status descriptor)⽂件保护模块FPM(file protection mechanism)VCD有三个核⼼部分组成:CD驱动器或称CD加载器MPEG解码器微控制器DVD播放系统的组成:DVD盘读出机构DVD-DSP数字声⾳/视频解码器微处理器多媒体应⽤软件的开发过程(1)明确使⽤对象,了解⽤户需求(2)选择开发⽅法(3)准备多媒体数据(4)完成系统集成常⽤的识别输⼊⽅法是OCR扫描识别.计算机处理的⾳频种类包括波形⾳频(waveform audio)和MIDI⾳频.除了⼈类说话的声⾳和⾳乐,我们称其他的⾳频信号为噪声.⼈类听⼒所接受的频率:20HZ-20KHZCD标准的44100HZ采样率(sampling rate)MIDI也定义⾳频的形态与存储的⽅法,MIDI的⾳频是以消息的⽅式⽽⾮波形的⽅式组成.遥控键盘remote keyboardMIDI⾳频⽂件是⼀串的时序命令(time-stamped commands)它记录下⾳乐的⾏为.如按下钢琴键,踩踏板.⽬前国际上对视频的处理标准主要有:NTSC(National Television Standard Committee)美国研制的NTSC制式是⽬前最久和最⼴泛使⽤的电视制式,每秒30帧PAL(Phase Alternating Line)中国和英国采⽤的制式,每秒25帧SECAM(Sequential Color and Memory)法国和俄罗斯采⽤的.在多媒体数据中,⽆法从客观世界直接摄取的可视信息,就可有图形技术来制作,这些数据主要包括⽂字,图形,动画.动画是图形对象赋予运动属性后制作的连续画⾯效果.图形⽂件的格式通过图形原语和它们的属性来描述.计算机动画研究内容:运动控制⽅法运动学⽅法动⼒学⽅法随机⽅法⾏为规则⽅法⾃动运动控制中间画⾯的⽣成技术:关键帧⽅法,算法⽣成,基于物理的⽣成多媒体开发和创作环境具有功能:提供多媒体程序编程的环境超⽂本,超媒体和多媒体数据管理的功能⽀持多媒体数据的输⼊和输出应⽤连接功能多媒体数据制作功能友好的⽤户界⾯多媒体编著⼯具或称创作⼯具是⼀种⾼级的软件程序或命令集合.按照节⽬组织和安排数据的⽅式分成5类:以卡或页为基础的编著⼯具 ToolBook以图符为基础,基于事件的编著⼯具 Authorware以时间为基础的编著⼯具 action!以传统程序语⾔为基础的编著⼯具 C,Basic其它专⽤编著⼯具要对多媒体数据进⾏有效的管理,就需要建⽴⼀个多媒体数据管理环境,包括:存储环境,传输环境,软件环境多媒体数据的存储环境:可更换的硬盘,磁带备份介质,光盘档案⼈质,磁盘阵列.MDBMS系统提供的数据类型:text,binary ,image.MDBMS影响:(1)数据量⼤且媒体之间差异也⼤,从⽽影响数据库中的组织和存储⽅法(2)媒体各类的增多增加了数据处理的难度(3)多媒体不仅改变了数据库的接⼝,使其声⽂图并茂,⽽且也改变了数据库的操作形式,其中最重要的是查询机制和查询⽅法.(4)传统的事务⼀般都短⼩精悍,在多媒体数据库管理系统中也应尽可能使⽤事务.(5)多媒体数据库管理还有考虑版本控制问题.MDBMS的组织结构⼀般分为三种:集成型,主从型,协作型.模型扩充主要技术策略:使关系数据库管理技术和操作系统中⽂件系统功能相结合,实现对⾮格式化数据的管理.将关系元组中格式化数据和⾮格式化数据装在⼀起形成⼀个完整的元组,放在数据页⾯或数据页⾯组中.将元组中⾮格式化数据分成两部分.⼀部分是格式化数据本⾝,另⼀部分是对⾮格式化数据的引⽤.动态注释:dynamic memo格式注释:formatted memo图形:graphic⾯向对象在⽀持多媒体应⽤⽅⾯具有⾃⼰独特的优点:⾯向对象模型⽀持"聚合"与"概括"的概念,从⽽更好地处理多媒体数据等复杂对象的结构定义.⾯向对象模型⽀持抽象数据类型和⽤户定义的⽅法,便于数据库系统⽀持定义新的数据类型的操作.⾯向对象系统的数据抽象,功能抽象与消息传递的特点使对象在系统中是独⽴的,具有良好的封闭性,封闭了多媒体数据之间的类型及其他⽅⾯的巨⼤差异,并且容易实现并进⾏处理,也便于系统模式的扩充和修改.⾯向对象系统的对象类,类层次和继承性的特点,因⽽避免了关系数据库中讨论的各种异常.⾯向对象系统的查询语⾔通常是沿着系统提供内部固有联系进⾏的,避免了⼤量的查询优化⼯作.总之,⾯向对象的数据模型允许现实世界的对象以更接近于⽤户思维的⽅式来描述,⽽且具有描述和处理聚集层次,概括层次的能⼒.能⽀持抽象数据类型和⾏为,可扩充性和可共享性好,适宜于表⽰和处理多媒体信息,也适宜于多媒体数据库中各种媒体数据的存取与不同操作的实现.基于内容检索技术的特点:从媒体内容中提取信息线索,直接对媒体进⾏分析,抽取特征(如基于表达式)提取特征⽅法多种多样.⼈机交互基于内容的检索采⽤⼀种近似的匹配技术.实现基于内容的检索系统主要有两种途径:⼀是基于传统的数据库检索⽅法.采⽤⼈⼯⽅法将多媒体信息内容表达为属性(关键词)集合,再在传统的数据库管理系统框架内处理⼆是基于信号处理理论.采⽤特征抽取和模式识别的⽅法来克服基于数据库⽅法的的局限性.特征匹配是基于内容检索的关键.MPEG-7:正式标准名称:多媒体内容描述接⼝(multimedia content description interface)描述模式:description scheme,DS描述定义语⾔:description definition language ,DDL是MPEG-7的核⼼MPEG坚持"制定最少的最有⽤的"原则.超⽂本(hypertext)结构采⽤⼀种⾮线的⽹状结构结构组织块状信息.超⽂本是由信息结点和表⽰信息结点间相关性的链构成的⼀个具有⼀定逻辑结构和语义的⽹络.结点为基本单元.第⼆代超⽂本系统与多媒体技术结合起来,为强调系统处理多媒体信息的能⼒⽽称为超媒体(hypermedia)系统,即超媒体=多媒体+超⽂本.超⽂本抽象机(hypertext abstract machine)HAM模型把超⽂本系统分为三个层次:⽤户界⾯层,超⽂本抽象机层,数据库层.例⽰:instantiation表现规范:presentation specification锚号:anchor id锚值:anchor value超⽂本主要成分:结点,链,宏结点.结点(节点)是超⽂本表达信息的⼀个基本单位.宏⽂本macrotext微⽂本microtext⽂献模型的基本任务:能够表⽰多媒体⽂献的内容层次性能够表⽰多媒体⽂献的版⾯布局能够表⽰多媒体⽂献的时间布局能够将内容与布局对应起来ODA(the office/open document architecture)HyTime全称为"Hypermedia/time-based structuring language"时基超媒体结构化语⾔Web系统是⽬前最流⾏的运⾏于Internet上的超⽂本系统.可扩展标记语⾔XML:extensible markup language主要有三个要素:⽂档定义(DTD/XML Schema),XSL和Xlink.XML提供了数据定义机制,⽬前存在两种⽅式:DTD和Schema动态⽹页⽣成技术:⽬前常⽤的有:ASP(active server pages)JSP(Java server pages)PHP(personal hypertext preprocessor)HTTP:hypertext transfer protocol超⽂本传输协议.缓存系统的体系结构:层次缓存结构.分布式缓存结构,混合的缓存结构缓存⽅式:预装preload技术,动态置换,部分缓存.LRU,least recently usedLFU,least frequently usedFIFO,first in first outLLF,lowest latency first所谓数据模型就是在计算机数据世界中建⽴的计算机所能接受的对现实世界中所要研究对象的抽象描述.具有两层含义:提供⼀种计算机可接受的信息表⽰和处理⽅法能够指出数据的构造,即能够表⽰数据及其属性特征,同时指出数据间的联系.对于多媒体系统的数据模型来说,其主要任务是:能够表⽰不同媒体的数据构造及其属性特征.所谓形式化描述就是⽤数学概念或类数学概念来精确地定义和描述信息系统的基本特性(属性和结构等)的⼀种⽅法.⽤集合论和⼀阶逻辑来抽象超⽂本模型.多媒体信息元:以⾃上⽽下的观点来看,多媒体信息元是具有⼀定语义的,组成信息系统应⽤的信息⼦块.以⾃下⽽上的观点来看,多媒体信息元是⼀个或多个媒体数据元经过⼀定的添加与包装⽽合成的超数据元.信息元的⼤⼩即是各种多媒体应⽤的公共需求,即信息元必须满⾜的特性.MHEG(Multimedia and Hypermedia Information Coding Expert Group)超⽂本信息元标准.采⽤⾯向对象的⽅法来分析设计模型.MH对象分成:输出内容对象 output content⼀般输⼊对象 generic input投射器对象 projector基本对象 basic合成对象composite条件与动作按钮button动作按钮action button暂停-继续按钮stay-on button切换按钮switch button菜单选择menu selection多项选择multiple selection字符串character string位置location数值numericla value时间合成的三种同步表⽰⽅法:层次化同步,基于时间轴的同步,基于参考点的同步.多媒体通信的特点:多媒体数据量⼤,存储容量⼤,传输带宽要求⾼.多媒体实时性.多媒体时空约束多媒体交互性分布式处理和协同⼯作多媒体通信实现途径:话路+视频⽹络+视频有线电视+交互功能多媒体通信的关键技术声⾳,视频,动画等的传输技术数据压缩和解压缩技术解决多媒体实时同步问题解决协议和标准化问题在模拟通信⽹上传输静态图像的电话称为可视电话⼀般分为四个组成部分:语⾳处理部分图像输⼊部分图像输出部分图像信号处理部分专⽤控制器是电视电话的核⼼.电话⽹是按模拟声⾳信号⽽设计的,传送带宽只有300---3400HZ,传输图像有困难,从⽬前情况来看,只能传送静态图像.帧中继(frame relay ,FR)是⼀种HDLC规程的宽带数据业务标准多媒体信息传输对⽹络性能的要求:吞吐量,是指⽹络传输⼆进制信息的速率,⼜称⽐特率或带宽.实时传输的活动图像是对⽹络吞吐量要求最⾼的媒体.传输延时(transmission delay)定义为从信源发出第⼀个⽐特到信宿接收到第⼀个⽐特之间的时间差,它包含信号在物理介质中的传播延时和数据在⽹中的处理延时.另⼀个常⽤的参数是端到端的延时.⽹络传输延时的变化称为⽹络的延时抖动(delay jitter):度量延时抖动的⽅法中常⽤的⼀种是⽤在⼀段时间内最长和最短的传输延时之差来表⽰.错误率:度量⽅式:误码率BER(bit error rate),包错误率PER(packet error rate),包丢失率FLR(packet loss rate)QoS:quality of service分布式多媒体系统的基本特征:多媒体集成性,资源分散性,运⾏实时性,操作交互性,系统透明性.分布式多媒体系统的层次结构:多媒体接⼝层:系统与各种媒体通信输⼊输出的接⼝,处于最低层.多媒体传输层流管理层多媒体表⽰层应⽤层.声⾳点播:audio on demand视频点播:video on demandIP电话:IP telephony分组实时视频会议:group realtime video conferencing从多媒体信息传输来讲,Internet提供两种类型的服务:⼀是可靠的⾯向连接服务,使⽤TCP协议,对信息包时延要求不⾼.⼆是不可靠的⽆连接服务,使⽤UDP协议,不保证丢失包,也不保证时延满⾜要求.⽬前,多媒体⽹络应该解决下⾯问题:提⾼⽹络带宽,减少延时,减少抖动.两个解决⽅法:扩⼤链路带宽,改进Internet协议.⽹络传输的⽅法根据传输⽬标的多少可分为:单播unicast,组播multicast,⼴播broadcast在Internet上要传输多媒体信息最常⽤的是单播技术.组播或称多播是指⽹上⼀点到⽹上多个指定点(同⼀个⼯作组类成员)传输信息.它是⼀种较好的节省带宽减少服务器负担的传输⽅法.Internet的IP地址分为五类:A,B,C,D,E.为⽀持组播功能,发送端和接收端及其之间的⽹络设施都必须具有多播功能.组播路由选择算法:泛洪法(flooding),⽀撑树(spanning tree),反向路径⼴播(reverse path broadcasting ,RPB),修剪的反向路径⼴播(truncated reverse path broadcasting ,TRPB),Steiner树.基于核⼼树的组播(core-based tree,CBT)组播路由选择协议:距离⽮量组播路由协议(Distance Vector Multicast Routing Protocol,DVMRP)组播开放最短路径优先路由协议(Multicast Open Shortest Path First Routing,MOSRF)协议独⽴的组播路由协议(protocol independent multicast,PIM),采⽤两种协议,PIM-DM(dense mode)和PIM-SM(sparse mode)底层传输系统 SDH,synchronous digital hierarchy多协议标识交换 MPLS,multi-protocol label switching标识交换路径 LSP,label-switched path标识交换路由器 LSR,label-switched router密集波分复⽤ DWDM,dense wave-division multiplexing电⼦布告栏系统 BBS,bulletin board system群决策⽀持系统 GDSS,group decision support systems影⽚点播 MOD,movies on demand远程购物 teleshopping远程学习 distance learning家庭银⾏ home banking远程医疗telemedicine电视会议video conferencing内容制作content production事务服务transaction services。
多媒体技术及应用第二版课后习题及答案
第一章一、单选题(1)由美国Commodore公司研发的世界第一台多媒体计算机系统是( B )。
A. Action Media 750B. AmigaC. CD-ID. Macintosh(2)由美国Apple公司研发的多媒体计算机系统是( D )。
A. Action Media 750B. AmigaC. CD-ID. Macintosh(3)媒体有两种含义,即表示信息的载体和( B )。
A. 表达信息的实体B. 存储信息的实体C. 传输信息的实体D. 显示信息的实体(4)(A)是指用户接触信息的感觉形式,如视觉,听觉和触觉等。
A. 感觉媒体B. 表示媒体C. 显示媒体D. 传输媒体(5)( B )是用于处理文本、音频、图形、图像、动画和视频等计算机编码的媒体A感觉媒体B表示媒体 C 显示媒体D存储媒体(6)多媒体技术是将( C )融合在一起的新技术。
A. 计算机技术,音频技术,视频技术B. 计算机技术,电子技术,通信技术C. 计算机技术,视听技术,通信技术D. 音频技术,视频技术,网络技术(7)多媒体技术的主要特性有( D )A多样性、集成性、交互性 B 多样性、交互性、实时性、连续性C 多样性、集成性、实时性、连续性D多样性、集成性、交互性、实时性(8)计算机主机与显示器之间的接口是( C )。
A. 网卡B.音频卡C. 显示卡D. 视频压缩卡(9)( D )属于多媒体外部设备。
A. 显示适配器B. 音频卡C. 视频压缩卡D. 数字摄像头(10)多媒体软件可分为( C )。
A. 多媒体系统软件,多媒体应用软件B. 多媒体系统软件,多媒体操作软件,多媒体编程语言C. 多媒体系统软件,多媒体支持软件,多媒体应用软件D 多媒体操作系统,多媒体支持软件,多媒体著作工具(11)多媒体素材制作工具是( D )A. FrontPageB. AuthorwareC. PowerPointD. Flash(12)Adobe Premiere应属于( D )。
高中信息技术 《多媒体技术应用》课件 选修2
三、教学方法
• 评价方法 学习过程的评价方法: 学习文件夹 • 评价对象:学生作品,学生学习活动的 表现,学生对知识技能和过程方法的掌 握,学生对多媒体技术的认识和了解程 度。 • 具体评价活动的形式:教师评价、学生 自评、小组内评价、小组间互评 • 具体评价工具: 普通测试方法、评价量规、评分。
《多媒体技术应用》教材的编写思路 多媒体技术应用》
1、注重过程与方法
教材以软件开发方法为主线 教材以软件开发方法为主线,围 软件开发方法为主线, 绕需求分析、规划设计、 绕需求分析、规划设计、素材采 集加工、作品集成、测试、修改、 集加工、作品集成、测试、修改、 发布和评价这一过程组织教学内 容,让学生掌握开发多媒体作品 的基本过程
三、教学方法
更多情况下, 更多情况下,教师在课堂教学中 不是只用一种教学方法, 不是只用一种教学方法,而是多种方 法联合使用,互相渗透, 法联合使用,互相渗透,也就是所谓 的混合学习, 的混合学习,因此我们可以针对不同 的学习对象使用不同的教学方法, 的学习对象使用不同的教学方法,在 教学中不能拘泥于某中固定的教学方 法,要根据学习内容和学习对象灵活 的进行处理。 的进行处理。
《多媒体技术应用》教材的编写思路 多媒体技术应用》
第一章 认识多媒体技术
需求分析
第二章 多媒体作品的规划与设计
规则设计
第三章 多媒体信息的类型及其特征
素材的采集与加工
第四章 图形图像的采集与加工
作品的集成
修 改
第五章 声音、动画、视频的采集与加工 第六章 多媒体作品的集成 第七章 多媒体作品的发布和评价 第八章 虚拟现实与流媒体技术初步
三、教学方法
其它可用的方法: • 通过实践+总结方法进行 • GBS教学方法 • PBA教学方法
《多媒体技术应用与应用教程》第二章多媒体技术应用
2.1.2 计算机辅助教学软件的基本任务
多媒体教学软件的基本任务是: (1)正确和生动地表达课程的知识内容 (2) 确定教学过程和教学策略 (3) 提供学生与计算机进行信息交换的交互界面 (4) 提出问题、判断正误和教学指导 (5) 反馈功能 (6) 制定进一步学习计划
2.1.4 MCAI课件的设计与制作
MCAI课件的设计与制作包括需求分析、编写脚本和制作 课件3个过程:
1. 需求分析 进行课件设计,首先要进行需求分析,确定课件要达到 的目标、测试指标、课件的使用对象、运行的环境、开 发所需的时间、人力和经费等。
(1) 确定教学目标 教学目标是指希望通过教学过程,使学生在认知、情感 和行为上发生变化的描述。教学目标的确定应当考虑教 学内容、学生特征和社会需要三方面。
(3) 技术支持 主要的支持技术包括多媒体技术、超媒体技术和全文检 索技术。
2.2.4 电子出版物硬件环境
多媒体电子出版物的开发环境包括单机制作环境和网络 制作环境两大类。
扫描仪主要用于图形/图像的录入。数码相机是一种图像 信息输入设备。附加设备有光盘驱动器、视频卡、网卡、打 印机、扫描仪、录音机、MIDI设备、录像机、数码相机、摄 像机和CD-R刻录机等。
2.1.4 MCAI课件的设计与制作
链接关系描述 多媒体教学软件的超媒体结构是通过链接关系来实现的。
在制作脚本过程中,可以从“进入方式”和“键出方式”两 方面来描述节点与节点之间的联系。
制作脚本卡片 多媒体教学软件是以屏幕内容的形式呈现给学生进行学习
的。每一屏幕如何设计和制作,应该有相应的说明。综合上 述各方面的内容,设计制作脚本卡片,可以用来描述每一屏 幕的内容和要求,从而作为软件制作的直接依据。
精品课件-多媒体技术与应用(第二版)(傅献祯)-第2章
第 2 章 多媒体的基本技术
1) 调频合成原理 雅玛哈在其早期的合成器DX系列中引入了一种称为调 频的合成方法。FM是将作为载波的高频振荡波的频率按调 制信号规律变化的一种调制方式。 用FM调频方式产生声音的基本原理起源于傅里叶分析 原理:各种声音由各种不同的谐波组合形成,因此通过调 谐一系列正弦波就可以模拟出各种各样的声音。
如果既要获得高品质的音响效果,又要节省空间,那 么MIDI文件可谓是一个两全齐美的好方法。
第 2 章 多媒体的基本技术
2. MIDI
MIDI 是 Musical Instrument Digital Interface 的缩写, 意为乐器数字接口。它是由世界上 主要电子乐器制造厂商建立起来的一个通信标准,用以 规范计算机音乐程序以及电子合成器和其他电子设备之 间交换信息与控制信号的方法。
无损压缩:用在要求重构的信号与原始信号完全 一致的场合。无损压缩方法可以把数据压缩到原来的1/2或 1/4,即压缩比为2∶1或4∶1,一般用于磁盘文件的压缩。 常用的无损压缩方法有Haffman,Lempei-Eiv法。
第 2 章 多媒体的基本技术
有损压缩:用在重构的信号不一定非得要与原始信号 完全相同的场合。这种压缩采取在压缩的过程中丢掉某些不 致对原始数据产生误解的信息,以大大提高压缩比。
2.1.2 1.
声音文件所需的存储空间可用下式来计算:
存储量字节/ 秒 采样率 量化精度声道数
8
第 2 章 多媒体的基本技术
说明:
采样率:采样率越大,数字信号越接近模拟信号, 但所要求的存储空间也越大。
量化位数:量化位数越大,所得的量化值越接近原 始波形采样值,但所要求的信息存储量也越大。
精品课件-多媒体技术及应用(第二版)-第1章
第1章 多媒体基础
2. 在通信方面的应用 多媒体通信有着极其广泛的内容,如可视电 话、视频会议等已逐步被采用,而信息点播 (Information Demand) 和 计 算 机 协 同 工 作 CSCW (Computer Supported Cooperative Work) 系统将给人 类的生活、学习和工作产生深刻的影响。
信息点播包括桌上多媒体通信系统和交互 电视ITV。通过桌上多媒体信息系统,人们可以远距离点 播所需信息,比如电子图书馆,多媒体数据的检索与查 询等。
第1章 多媒体基础
点播的信息可以是各种数据类型,其中包括 立体图像和感官信息。用户可以按信息表现形式和信息 内容进行检索,系统根据用户需要提供相应服务。而交 互式电视和传统电视不同之处在于用户在电视机前可对 电视台节目库中的信息按需选取,即用户主动与电视进 行交互式获取信息。交互电视主要由传输网络、视频服 务器和电视机机顶盒构成。用户通过遥控器进行简单的 点按操作就可对机顶盒进行控制。交互式电视还可提供 许多其他信息服务,如交互式教育、交互式游戏、数字 多媒体图书、杂志、电视采购、电视电话等,从而将计 算机网络与家庭生活、娱乐、商业导购等多项应用密切 地结合在一起。
第1章 多媒体基础
“多媒体计算机+电视+网络”将形成一个极 大的多媒体通信环境,它不仅改变了信息传递的面貌, 带来通信技术的大变革,而且计算机的交互性、通信的 分布性与多媒体的现实性相结合,构成了继电报、电话、 传真之后的第四代通信手段,向社会提供全新的信息服 务。
第1章 多媒体基础
3. 多媒体技术在其他方面的应用 多媒体技术给出版业带来了巨大的影响,其 中近年来出现的电子图书和电子报刊就是应用多媒体技 术的产物。电子出版物以电子信息为媒介进行信息存储 和传播,是对以纸张为主要载体进行信息存储与传播的 传统出版物的一个挑战。用CD-ROM代替纸介质出版各类 图书是出版界的一次革命。电子出版物具有容量大、体 积小、成本低、检索快、易于保存和复制、能存储音像 图文信息等优点,因而前景乐观。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.1.1 人类听觉特性
3.响度和响度级 响度(Loudness) 人耳感受声音强弱的主观感觉 响度(Loudness)是人耳感受声音强弱的主观感觉 程度,这种感觉与音强、频率和波形都有关系, 程度,这种感觉与音强、频率和波形都有关系, 其度量单位为宋(Sone), ),定义一个声压级为 其度量单位为宋(Sone),定义一个声压级为 40dB,频率为1kHz的纯音的响度为1Sone 1kHz的纯音的响度为1Sone。 40dB,频率为1kHz的纯音的响度为1Sone。 响度级( Level) 响度级(Loudness Level)是指某响度与基准响度相 比的等级,其度量单位为方(Phon),定义1kHz ),定义 比的等级,其度量单位为方(Phon),定义1kHz 纯音的响度级为1Phon 1Phon。 纯音的响度级为1Phon。
17
2.1.2 数字音频 音频信号是时间和幅度都连续变化的一维模拟信号 时间和幅度都连续变化的一维模拟信号, 音频信号是时间和幅度都连续变化的一维模拟信号, 要想在计算机中对它进行处理, 要想在计算机中对它进行处理,就要将它变成时 间和幅度都是离散的数字信号,所以数字音频是 间和幅度都是离散的数字信号,所以数字音频是 指音频信号经过离散化处理后再用一系列的数字 来表示的信号,其特点是保真度好,动态范围大。 来表示的信号,其特点是保真度好,动态范围大。 数字音频可分为波形声音 语音和音乐。 波形声音、 数字音频可分为波形声音、语音和音乐。波形声音 实际上包含了所有的声音形式, 实际上包含了所有的声音形式,因此数字音频有 时也泛称为声音。 时也泛称为声音。
7
听阈图2-1 听阈-频率曲线
8
2.1.1 人类听觉特性
2.音调 音调(Pitch)在物理学中是指声音的高低 声音的高低, 音调(Pitch)在物理学中是指声音的高低,实际上 就是指人耳对不同频率声音的一种主观感受。 就是指人耳对不同频率声音的一种主观感受。音 调主要由声音的频率决定, 调主要由声音的频率决定,同时也与声音强度有 频率高的声音,人感觉其音调也较高, 关。频率高的声音,人感觉其音调也较高,反之 人感知音调低的声音其频率也低。 ,人感知音调低的声音其频率也低。 对音调可以进行定量的判断,其度量单位为美( 对音调可以进行定量的判断,其度量单位为美 Mel),定义一个声压级为40dB 频率为1kHz ),定义一个声压级为40dB, 1kHz的 Mel),定义一个声压级为40dB,频率为1kHz的 纯音的音调为1000Mel 1000Mel。 纯音的音调为1000Mel。
18
2.1.2 数字音频
用计算机来处理音频信号必须将模拟音频信号转换 成有限个数字表示的离散序列,过程为: 成有限个数字表示的离散序列,过程为:选择采 样频率,即进行采样;选择分辨率, 样频率,即进行采样;选择分辨率,即进行量化 最后编码形成声音文件。 ;最后编码形成声音文件。声音的采样与量化如 图所示。 图所示。
4
2.1.1 人类听觉特性
音频信号的感知过程与人耳的听觉系统密不可分。 音频信号的感知过程与人耳的听觉系统密不可分。 对于人类听力感知的研究, 人类听力感知的研究 对于人类听力感知的研究,其范围从人耳的生理 设计到大脑对听觉信息的解释。当前, 设计到大脑对听觉信息的解释。当前,大部分感 知音频的编码算法都是基于心理声学模型的。 知音频的编码限曲线
13
2.1.1 人类听觉特性
5.临界频带 指一个纯音可以被以它为中心频率, 指一个纯音可以被以它为中心频率,并且具有一定 频带宽度的连续噪声所掩蔽, 频带宽度的连续噪声所掩蔽,在这一频带内噪声 功率等于该纯音的功率。 功率等于该纯音的功率。使该纯音处于刚能被听 到的临界状态,即称这一带宽为临界频带宽度。 到的临界状态,即称这一带宽为临界频带宽度。 临界频带的单位为巴克(Bark)。 临界频带的单位为巴克(Bark)。
24
2.1.3 语音
语音是一种特殊的媒体,语音是人类所特有的,但 语音是一种特殊的媒体,语音是人类所特有的, 也是一种波形 一种波形, 也是一种波形,在计算机中表示方式与波形声音 的文件格式相同。 的文件格式相同。 语音处理的研究已经有一百多年的历史, 语音处理的研究已经有一百多年的历史,其研究范 围主要涉及:语音合成、语音编码、语音识别的 围主要涉及:语音合成、语音编码、语音识别的 基本算法和应用。 基本算法和应用。 计算机处理语音过程如图所示。 计算机处理语音过程如图所示。
19
2.1.2 数字音频 1.采样 采样
采样(Sampling)指把模拟信号在时域上以固定的时间间隔 采样(Sampling)指把模拟信号在时域上以固定的时间间隔 对波形的值进行抽取,再用若干位二进制数表示。 对波形的值进行抽取,再用若干位二进制数表示。 对声音波形采样的频率直接影响声音的质量 采样频率越高, 采样的频率直接影响声音的质量, 对声音波形采样的频率直接影响声音的质量,采样频率越高, 声音保真度越好,但所要求的数据存储量也越大。 声音保真度越好,但所要求的数据存储量也越大。 根据采样定理, 采样频率大于信号最高频率的两倍时, 根据采样定理,当采样频率大于信号最高频率的两倍时,在 采样过程中就不会丢失信息,并且可以用采样后的信号重 采样过程中就不会丢失信息, 构原始信号,从而不失真地还原出原始的声音信号。 构原始信号,从而不失真地还原出原始的声音信号。 对于音频,最常用的采样频率有三种:44.1kHz、22.05 kHz 对于音频,最常用的采样频率有三种:44.1kHz、 kHz,其中44.1kHz采样频率是最常用的。 44.1kHz采样频率是最常用的 和11.025 kHz,其中44.1kHz采样频率是最常用的。 声道数是声音通道的个数,指一次采样的声音波形个数 声音波形个数。 声道数是声音通道的个数,指一次采样的声音波形个数。
21
2.1.3 声音
声学是研究声音的学科,包括声波的产生、 声学是研究声音的学科,包括声波的产生、传播和 接收。物体振动在弹性体里的传播称为波 接收。物体振动在弹性体里的传播称为波,而在 空气中传播的波就称为声波,能被人的听觉器官 空气中传播的波就称为声波, 声波 所感觉到的声波叫声音 其频率一般在20Hz 声音, 20Hz~ 所感觉到的声波叫声音,其频率一般在20Hz~ 20kHz之间 之间。 20kHz之间。
8.感知熵 感知熵( Entropy) 感知熵(Perceptual Entropy)指利用心理声学的掩 蔽现象和信号能量化原理来测量音频信号中感知 相关的信息。一般以位(bit)作为单位, 相关的信息。一般以位(bit)作为单位,实际上 表示了音频信号压缩的理论极限。 表示了音频信号压缩的理论极限。
14
2.1.1 人类听觉特性
6.同时掩蔽
掩蔽效应是指当两个响度不等的声音作用于 人耳时, 人耳时,响度较高的频率成分的存在会影 响到对响度较低的频率成分的感知。 响到对响度较低的频率成分的感知。 当两个或更多的音频信号到达人内耳时,掩 当两个或更多的音频信号到达人内耳时, 蔽声与被掩蔽声同时作用发生掩蔽效应, 蔽声与被掩蔽声同时作用发生掩蔽效应, 就称同时掩蔽。 就称同时掩蔽。
10
图2-2 人耳可听最小响度曲线
11
2.1.1 人类听觉特性
4.绝对听觉门限 绝对听觉门限( Hearing, 绝对听觉门限(Absolute Threshold of Hearing, ATH)指一个人在没有噪声的环境下, ATH)指一个人在没有噪声的环境下,能够产生 听觉,感知到一个纯音信号(某频率点) 听觉,感知到一个纯音信号(某频率点)的最小 能量幅度。 能量幅度。 绝对听觉门限用声压级表示,静音为0dB 0dB, 绝对听觉门限用声压级表示,静音为0dB,痛阈为 140dB。 140dB。
20
2.1.2 数字音频 2.量化 量化
量化(Quantity) 量化(Quantity)的目的是将采样后的信号波形的 幅度值(样本)进行离散化处理, 幅度值(样本)进行离散化处理,样本从模拟量 转化成了数字量。 转化成了数字量。 量化位数越多, 量化位数越多,所得到的量化值越接近原始波形的 采样值。 采样值。 量化方式有三种:零记忆量化、分组量化和 量化方式有三种:零记忆量化、分组量化和序列量 化。
22
2.1.3 声音
声音的三要素是音调、音色和音强。 声音的三要素是音调、音色和音强。 音调 音调是指声音的高低,音调与频率有关。 音调是指声音的高低,音调与频率有关。 音色是指具有特色的声音。 音色是指具有特色的声音。 音强是指声音的强度,也称为声音的响度, 音强是指声音的强度,也称为声音的响度,音强与 声波的振幅成正比 。
2
第二章 音频处理技术
2.1 音频基本原理
2.1.1 人类听觉特性 2.1.2 数字音频 2.1.3 声音 2.1.4 语音
3
近十年来,随着计算机技术的高速发展, 近十年来,随着计算机技术的高速发展,以及能同 时满足数字信号的高压缩率和数字信号的高保真 透明重放质量的压缩算法及标准得到大量开发与 使用,数字音频已经广泛应用于因特网、 使用,数字音频已经广泛应用于因特网、多媒体 及无线通信系统,CD品质的数字音频 品质的数字音频已经从根本 及无线通信系统,CD品质的数字音频已经从根本 上替代了模拟音频。因此, 上替代了模拟音频。因此,人们对音频信号数字 化处理提出了越来越高的要求, 化处理提出了越来越高的要求,相应软硬件实现 手段的效率也在不断提高。 手段的效率也在不断提高。
5
2.1.1 人类听觉特性
1.听阈与听域 2.音调 3.响度和响度级 4.绝对听觉门限 5.临界频带 6.同时掩蔽 7.异时掩蔽 8.感知熵
6
2.1.1 人类听觉特性
1.听阈与听域 听阈( Threshold)就是指人能听到的最低 听阈(Auditory Threshold)就是指人能听到的最低 声压级( Level,SPL)。 声压级(Sound Power Level,SPL)。 听域( Area)是指人能感知的声音的范围 人能感知的声音的范围, 听域(Audible Area)是指人能感知的声音的范围, 正常人耳能够感知的频率范围大致是20Hz~ 正常人耳能够感知的频率范围大致是20Hz~ 20Hz 20kHz;正常人能感知声音的声压级范围是0 20kHz;正常人能感知声音的声压级范围是0~ 128dB。 128dB。