声音图形图像视频共39页文档

3.3多媒体信息处理(图像声音视频)

视频大小=每幅图像(帧)的大小×每秒播放的帧数 (制式)×视频播放的时间
二、声音处理
• 1.数字声音获取: ⑴ 网上下载 ⑵ 自己录制在计算机声卡的输入口插入话筒，然后利用附件中的录音机软件即可录制声音。 • 2.声音处理：利用录音机软件可以进行一些简单的声音处理如剪辑、加大减小音量、混响等。可以使用工具软件更改声音文件类型。
获取原始图像途径：
• • • • • • 1）用绘图软件绘制 2）用数码相机拍摄 3）用扫描仪扫描 4）从屏幕上截取 5）从网上下载 6）从光盘的图像库中复制。
文件大小的计算Biblioteka • 图像文件图像大小=分辨率(像素数)×所占位数 • 声音文件音频大小=采样频率×量化位数× 声道数 ×音频的时间 • 视频文件
三、视频处理
• 1.数字视频获取： ⑴ 网上下载 ⑵ DV拍摄 ⑶ 采集卡采集 • 2.视频处理: 视频处理通常都需要专用软件才行,常见的有超级解霸、Adobe Premier、Pinnacle Edition和Ulead Media Studio Pro等。 • 在WindowsXP中自带一款简易视频编辑软件 Movie Maker，对于简单的视频处理完全能够胜任。 • 一套完整的数字视频系统包括：摄像机、视频采集卡、视频编辑软件、光盘刻录机等。
3.3多媒体信息处理
图像、声音、视频
一、图像处理
• 多媒体信息包含：文字、图形、图像、声音和视频等信息。 • • (1)分辨率 • 分辨率：图像是由像素构成的，换句话说描述图像的最小单位是像素。图像分辨率：是指单位长度（或面积）的像素数。单位是DPI(dots per inch)：每英寸中有几个点的意思。水平分辨率×垂直分辨率 • 图像分辨率高，画质越好，则存储容量也大。

声音ppt课件

响度
响度是指声音的强弱，由声波的振幅决定。振幅越大，响度越强；振幅越小，响度越弱。
人类听觉系统对响度的感知是相对的，即声音的响度会受到周围环境的影响，例如在安静的环境下，轻微的声音会被感知为响亮的声音。
响度的变化可以用来强调或突出某些信息，例如在演讲中提高音量可以强调重点内容或引起听众的注意。
音量控制
调整录音设备的音量，避免过载或音量不足。
音质选择
根据需求选择不同的音质设置，如采样率、位深度等。
音频播放设备介绍
1 2
耳机
适用于个人使用，便于随身携带。
扬声器适Leabharlann 于多人同时收听，提供更广泛的音效体验。
3
电脑音频输出
通过电脑的音频输出来播放声音PPT课件。
06
声音的艺术与文化
声音在艺术中的表现
噪声控制
对于不可避免的噪声，应采取有效的控制措施。例如，使用降噪软件或硬件设备，以减少噪声对演示的干扰。
04
声音的合成与处理
声音的合成
01
02
03
声音合成概述
声音合成是一种利用数字技术生成人类可听语音的技术。
语音合成方法
语音合成的方法包括波形合成法、参数合成法和规则合成法等。
语音合成应用
声音的未来发展
01
虚拟现实与增强现实
随着虚拟现实和增强现实技术的发展，声音将在这些领域发挥更加重要
的作用，如环境音效、语音交互等。
02
人工智能与语音技术
人工智能和语音技术的发展，将使得声音的应用更加广泛和深入，如智
能语音助手、语音识别技术等。
03
跨媒体融合
随着媒体融合的趋势，声音将与其他媒体形式更加紧密地结合，如音频

图形图像声音

如果换成256级灰度的800×600的图像又该如何计算呢？
上面讲的都是黑白图像，但现实生活中的黑白图像不仅仅是单纯的用黑和白表示，而是用灰度来表示灰度级越多组成的图像就越真实。一般计算机用256级灰度来显示图像。即在一个像素里有256种不同的灰度来表示。我们知道 28＝256，即存储一个像素要8个比特即一个字节的存储空间。
位图文件常见的扩展名： *.bmp、*.pcx、*.gif、*.jpg、*.tif、psd.....等
位图图像的缺陷
位图放大和缩小都会引起像素的增加和减小，这样会使得原由的图象的线条和形状变的参差不齐，与原图像相比出现失真；出现”锯齿形“。
位图得另一个缺点就是数据量太大。
（如：长和宽分别为1024像素和768像素得24位色彩深度的图象就需要（1024×768×24÷8÷1024）=2304K个字节存储文件）
BMP 是（Windows 位图） Windows 位图可以用任何颜色深度（从黑白到 24 位颜色）存储单个光栅图像。
GIF的图像深度从lbit到8bit，也即GIF最多支持256种色彩的图像。
JPEG格式压缩的主要是高频信息，对色彩的信息保留较好，适合应用于互联网，可减少图像的传输时间，可以支持24bit真彩色，也普遍应用于需要连续色调的图像。是bmp格式的 1/10至1/40的容量。
所以 256级灰度（即2的8次方）的800×600的图像需要的存储空间为：
总像素＝ 800×600×8＝3840000 个比特所需存储空间＝3840000÷8 ＝480000 字节
图像的格式（阅读材料）
/link?url=A8qgQ1DBCnIheQqx60Q -U2BRTlMaRN3o1Ct2KIEqCDb3h1PeDrbREfXQUHsB_kz6

1多媒体,波形声音、图形和图像

定义：
波形声音
波形声音信息是一个用来表示声音振幅的数据序列。
是通过对模拟声音按一定间隔采样获得的幅度值，再经过量化和编码后得到的便于计算机存储和处理的数据格式。
波形声音（续）
数据传输率：单位：b/s 计算方法： (未压缩的数字音频) 数据传输率=采样频率×量化位数×声道数（公式1）单位分别为：b/s、Hz、b
HSI彩色空间更适合人的视觉特性
图形和图像（续）
彩色空间 ——YUV
——Y为亮度信号， U（B-Y）和V（R-Y）是色差信号
——YUV的最初作为电视系统信号编
视系统与只对亮度敏感的黑白电视机亮度信号兼容；否则，如果用RGB传输，虽然黑白电视机可以正常接受彩色电视信号（只显示出黑白图像），但YUV系色感较均匀，当不发生偏移时色调饱和度上的变化近似相同。
图形和图像（续）
计算机中的图形数据表示：矢量和位图位图图像 --是指用像素点来描述的图。 --它在计算机内存中由一组二进制位组成，这些位
定义图像中每个像素点的颜色和亮度。 --位图图像适合于表现比较细腻、层次较多、色彩
较丰富、包含大量细节的图像，并且可以直接、快速的再屏幕上显示出来 --但占用存储空间较大，一般情况下，要进行压缩的。
——中国和西欧采用的PAL制式电视系统就采用该空间进行传输，电视机接收到后，再转换成RGB空间
图形和图像（续）
计算机中的图形数据表示：矢量和位图矢量图形： --是用一系列计算机指令来描述和记录的一幅图的
内容，即通过指令描述构成一幅图的所有直线、曲线、圆、圆弧、矩形等图元的位置。 --实质是用数学的方法来描述一幅图形图像在处理图形图像时根据图元对应的数学表达式进行编辑和处理。 --矢量图形主要用于表示线框型的图画、工程制图、美术字等。

图片声音视频动画

录音
思考：通常情况下，Windows中的“录音机”程序只能录音1分钟，现在如果要用“录音机”录制一段两分钟的音频文件，有什么办法吗？
视频
• 视频是由一连串连续变化的画面组成的动态场景。 • 视频信息集文字、声音、图像于一体，内容丰富、表现力强，在信息作品中被广泛使用。 • 常见的视频信息的格式有AVI、RM、 RMVB、MPEG等几种。
干静态画面（称为帧）连续呈现而形成的。
• 常见的动画制作软件有：Adobe
ImageReady、Flash、3D Studio等。
图的分类
• 在计算机中，图一般分为图形和图像。
• 在Word中，用绘图工具画的直线、圆、方
框等就属于图形，而通过图像输入设备捕
捉的实际画面如通过扫描仪、数码相机等
工具输入计算机的图片属于图像。
图的扫描
• 使用扫描仪，在扫描软件的支持下将图扫
描输入计算机。
• 扫描后的图片可保存为JPEG、TIF和BMP
等文件格式。
图像的效果处理
• 对图像的处理包括对图像大小、亮度、对
比度、色彩等进行设置，还包括给图像添
加各种滤镜效果，如模糊、锐化、扭曲、
纹理等。
• 图像ห้องสมุดไป่ตู้理软件的分类
声音信息
• 信息作品中的声音主要包括背景音乐、旁
白解说、音效等几种。
• 对声音的加工主要有两种：
一是声音信息的数字化；二是对已有的数字化音频信息进行编辑。
视频信息的加工
• 对视频信息进行加工，有三个方面：
• 一是视频信息的采集； • 二是视频信息的编辑； • 三视频信息的合成。
• 常用的加工软件：Moviemaker、Premiere、绘声绘影等。

图形图像动画声音

4.1.1多媒体定义

多媒体计算机技术
计算机综合处理的多种媒体信息（采样量化、编码压缩、编辑修改、存储传输和重建显示等），使其具有逻辑关系，并集成为交互系统

多媒体计算机：主要功能是处理数字化的声音、图像及视频信号等。小结

多媒体技术是用计算机综合处理多种媒体并使各种媒体建立逻辑链接的技术多媒体技术是信息传播技术、信息处理技术和信息存储技术的组合 5
– NTSC制（National Television Standards Committee） 30帧/秒、每帧525行 – 和PAL制（Phase Alternation Line） 25帧/秒，每帧625行
三、视频信息的数字化
– 包括采样、量化、模数转换、色彩空间变换等过程 – 视频信号的采集与数字化只有通过视频采集卡 – 采集方式：单帧采集、连续采集 19
六、多媒体信息检索技术
– 主要研究从大量多媒体信息中心快速定位所需信息的方法。 – MPEG-7的正式名称是“多媒体内容描述接口”，由 MPEG开发的一个ISO/IEC标准，目标是创建一种对多媒体数据的描述标准 – MPEG-7的描述符不依赖于它所描述的内容的编码方式和存储方式。 – 对一个事物的描述可分不同的细节层次，可用不同类型的特征进行描述（如对视频信息、低层次的描述可有外形、大小、颜色等，而最高层次的描述则给出语义上的信息）。建立在这些描述基础上的模型可使信息的检索、过滤更加方便和容易，以便于快速地检索有用信息。 10
– 只能读出本区的DVD影片 – 不能读出未被授权的不同区码(表5-3-1 )的DVD光盘 25
4.3.1多媒体硬件系统
五、DVD驱动器
单头单眼
1. DVD驱动器的工作原理

图形图像声音

BMP 是（Windows 位图） Windows 位图可以用任何颜色深度（从黑白到 24 位颜色）存储单个光栅图像。 GIF的图像深度从lbit到8bit，也即GIF最多支持256种色彩的图像。 JPEG格式压缩的主要是高频信息，对色彩的信息保留较好，适合应用于互联网，可减少图像的传输时间，可以支持24bit真彩色，也普遍应用于需要连续色调的图像。是bmp格式的 1/10至1/40的容量。
声卡的位是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数。声卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2 的8次方——256，16位则代表2的16次方——64K。比较一下，一段相同的音乐信息，16位声卡能把它分为64K 个精度单位进行处理，而8位声卡只能处理256个精度单位，造成了较大的信号损失，最终的采样效果自然是无法相提并论的。
矢量图和位图的比较
– 在空间上
• 矢量图占用空间少 • 位图占用空间大 • 位图比矢量图性能好， • 处理图象速度快。
– 在性能上
常见的矢量图像处理软件简介： Flash、CorelDRAW、Adobe illustrate等
常见的矢量文件扩展名： .wmf 、emf等
动画的原理
人类具有“视觉暂留”的特性，就是说人的眼睛看到一幅画或一个物体后，在0.34秒内不会消失。利用这一原理，在一幅画还没有消失前播放下一幅画，就会给人造成一种流畅的视觉变化效果。因此，电影采用了每秒24幅画面的速度拍摄和播放，电视采用了每秒25幅（PAL制，中国电视就用此制式）或30幅（NTSC制）画面的速度拍摄、播放。如果以每秒低于10幅画面的速度拍摄播放，就会出现停顿现象。
频率
三、音频的数字表示

声音图形图像视频PPT文档共41页

26、要使整个人生都过得舒适、愉快，这是不可能的，因为人类必须具备一种能应付逆境的态度。——卢梭
▪
27、只有把抱怨环境的心情，化为上进的力量，才是成功的保证。——罗曼·罗兰
▪
28、知之者不如好之者，好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
▪Hale Waihona Puke 30、意志是一个强壮的盲人，倚靠在明眼的跛子肩上。——叔本华
声音图形图像视频
51、山气日夕佳，飞鸟相与还。 52、木欣欣以向荣，泉涓涓而始流。
53、富贵非吾愿，帝乡不可期。 54、雄发指危冠，猛气冲长缨。 55、土地平旷，屋舍俨然，有良田美池桑竹之属，阡陌交通，鸡犬相闻。
▪
谢谢！
41

视,音,图.

文件大小失真情况
制作软件
文件容量相对较大缩放和旋转时容易失真
Photoshop , 画图等
文件容量相对较小缩放和旋转时不会失真
Flash 等
数字化图像的采集
• 数字化图像的获取一般有哪些途径？ 1.使用数码相机拍摄，直接把外界的景像转换成数字信号，可以方便地传送到计算机中。
• 2.已有的印刷图片，可以借助扫描仪转换成计算机可以处理的数字图像。
•
3.从网络上或者是其他数字化资源中获取需要的图像素材
音频视频动画的信息加工
音频、视频、动画者是信息的重要表达方式，由于数字化音频，视频和动画在加工、存储、传递等方面较便利，因此，它们正日益成为信息社会人们进行信息交流的重要手段
数字化音频的采集
• 采集： – 可以已有的音频资源中寻找或者截取。 – 也可以将传统的以磁带介质记录的声音信号转换成数字信号。 – 还可以采用数字化音频设备进行现场录音。
音频、视频、图像信息加工
图像的独特魅力
1.信息丰富、形象直观 2.跨
概念
由许多点组成的，组成图像的点也叫矢量图，以数学的向量方称为像素，足够多的不同色彩的式来记录图片的内容（如线段点组合在一起可以制作出层次分只需要记录两个端点的坐标，明，色彩丰富的图像线段的粗细和色彩）
采集的过程
• 用计算机录或是用录音笔MP3等录音设备： • 设置好参数就可以。注意过程中的仔细观察声音参数的变化。实时调整以保证音效。
什么是动画？
什么是视频？
• 连续 • 画面 • 实际拍摄
视频的采集
• 直接采集:数码摄像机
分步采集:录像带-视频采集卡-信号转换

多媒体：图形图像音频视频

双声道所谓双声道：通俗的说就是有两个声音通道，在电路上它们往往各自传递的电信号是不一样的，电声学家在追求立体声的过程中，由于技术的限制，在最早的时候只有采用双声道来实现，所以现在立体声和双声道好像变成一个东西了。

双声道实现立体声的原理大概是这样的，在空间放置两个互成一定角度的扬声器，每个扬声器单独由一个声道提供信号。

而每个声道的信号在录制的时候就经过了处理：处理的原则就是模仿人耳在自然界听到声音时的生物学原理（人是双耳的，听到声音时可以根据左耳和右耳对声音相位差来判断声源的具体位置），表现在电路上基本也就是两个声道信号在相位上有所差别，这样当站到两个扬声器的轴心线相交点上听声音时就可感受到立体声的效果（专家这样认为）。

所以音乐发烧友要求听音乐时不可搞错左耳塞和右耳塞（鄙人试过，没有感觉到有什么区别，也可能用的器材和带子太差），事实上用双声道实现立体声太幼稚，所以现在又有多声道，常见的5.1声道和现在的AC-3好像都在向立体声进军，但谈何容易呢？？？双声目前最常用途：卡拉OK中，一个是奏乐，一个是歌手的声音；VCD中,一个是普通话配音，一个是粤语配音5.1声道输出定义5.1声道输出是指影碟机是否可以以5.1声道方式输出音频。

各种声场解码、声场技术中，最常见，或者说最标准的就是5.1声道输出，比如杜比5.1、DTS5.1、THX5.1等，其他标准的解码方式也都可以很好的通过5.1声道输出。

5.1声道输出包括中央声道、前置主左/右声道、后置左/右环绕声道，及所谓的“0.1”重低音声道，总共至少可连接6个音箱。

中央声道大部份时间负责重放人物对白的部份；前置主左/右声道则是用来弥补在屏幕中央以外或不能从屏幕看到的动作及其它声音；后置环绕音效则是负责外围及整个背景音乐，让人感觉置身于整个场景的正中央，万马奔腾的震撼、喷射机从头顶呼啸而过的效果，就是拜它所赐；而马达声、轰炸机的声音或是大鼓等震人心弦的重低音，则是由重低音喇叭一手包办。

乐音课件(视频+动画+多种声音)-绝对精品

因素有关时,小丽做
了以下实验,但忘了
记录,请你帮她把记
录填写完整:
(1)使音叉发出不同响度的声音时,乒乓球被弹开的幅度是不同
的,说明响度与
有关;
(2)使音叉发出相同响度的声音,距离不同时,听到音叉的声音
的响度不同,说明响度与
有关;
(3)使用听诊器和不用听诊器在同样远近听心脏跳动声音的响
度不同,说明响度与声音的
音调
人和一些动物的听觉范围
20 Hz
人
15 Hz
狗
60 Hz
猫
1 000 Hz
150 Hz

20 000 Hz
50 000 Hz
65 000 Hz
蝙蝠 120 000 Hz
海豚
150 000 Hz
音调

蝴蝶的翅膀每秒钟振动5～6次，蜜蜂的翅膀每秒钟振动300～ 420次。所以，蝴蝶飞过悄无声息，蜜蜂飞过嗡嗡作响。
一、音调 1.音调:声音的_高__低__。 2.频率: (1)定义:每秒内物体_振__动__的__次__数__。 (2)物理意义:描述物体_振__动__快__慢__的物理量。 (3)单位:_H_z_。 (4)超声波:频率高于_2_0__0_0_0__H_z_的声波。 (5)次声波:频率低于_2_0__H_z_的声波。 3.音调与频率的关系: 音调主要由发声体振动的频率决定。发声体振动的频率越高, 音调越__高___。 4.波形:高音调的波形密__集___,低音调的波形稀__疏___。
音色：声音的品质、特色
音色
二胡圆号
音色指物体发出的声音特有的品质。音色取决于发声体的材料、结构、振动方式（如弹奏的手法）等。
考听力

声音图形图像视频共39页文档

3.3多媒体信息处理(图像声音视频)

声音ppt课件

图形图像声音

1多媒体,波形声音、图形和图像

图片声音视频动画

图形图像动画声音

图形图像声音

声音图形图像视频PPT文档共41页

视,音,图.

多媒体：图形图像 音频视频

乐音课件(视频+动画+多种声音)-绝对精品

多媒体：图形图像音频视频