上海大学875多媒体技术基础考研专业课笔记

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

µ 律压扩算法(应用于北美和日本等地区的数字电话通信中) ������ € ������ = ������������������(������) x:输入信号幅度,规格化为-1<x<=1 sgn(x):x 的极性 µ:确定压缩量的参数,具体计算时µ=255,它反映最大量化间隔于最小量化间隔之比,取 100<=µ<=500
( 2)
A 律压扩算法(欧洲和中国大陆) ������† ������ = ������������������ ������ ������† ������ = ������������������ ������ x: 输入信号幅度,规格化为-1<x<=1 sgn(x): x 的极性 A: 确定压缩量的参数,反映最大量化间隔于最小量化间隔之比,具体计算时 A=87.56 ������ ������ 1 0 ≤ |������| ≤ 1 + ������������������ ������
⑤数据冗余(决策量超过熵的量) 信息量 I = 数据量 D − 冗余量 R
信息熵就是对于一个不确定事件集合信息量的平均值
二、统计编码 ①香农-范诺编码 目的:产生具有最小冗余的码词 基本思想:产生编码长度可变的码词 估计码词长度的准则:符号出现的概率,概率越大,码词长度越短。 算法: 1、按照符号出现的概率减少的顺序将待编码的符号排成序列 2、将符号分成两组,使两组符号概率近似或相等 3、将第一组赋为 0,第二组赋为 1 4、对每组重复步骤(2) ,直至每组剩下一个信源符号 ②霍夫曼编码 算法: 1、按出现概率排序 2、将两个最小的概率相加作为新的概率与余下的概率重新排队,每次相加都将“0”和“1”赋予相加的两个概率 3、重复步骤(2)直到最后概率相加得 1 Ø Ø 霍夫曼编码没有错误保护功能。 霍夫曼编码是可变长度码, 在编码时不需要在生成码流中附加同步码, 因此也难以随意查找或调用压缩文件中的内容, 然后再译码。 ③算数编码 编码:将整个要编码的数据依照其出现的概率映射到一个位于[0,1)的实数区间中。并且输出一个小于 1 同时大于 0 的小数来 表示全部数据。 1、从实数区间[0,1)开始,按照信源符号的频度将当前区间分割为若干个子区间 2、根据当前输入的符号选择对应的子区间,从选择的子区间中继续下一轮的分割 3、重复步骤(2)知道所有符号编码完毕
解码: 1、输入一个小数 2、对区间[0,1)按照初始的符号频度进行分割 3、观察输入的小数属于哪个子区间,输出对应的符号 4、选择对应的区间,从子区间中继续下一轮的分割 5、重复步骤(4)知道所有符号解码出来 注意: 1、 算数编码的效率接近于熵 2、 算数/霍夫曼编码都对错误敏感 3、 信源概率固定,须事先统计 4、 有相应的“自适应编码” 三、RLE 编码(行程长度编码,Run-Length Encoding,RLE) 行程长度编码是无损压缩技术,编码时,对重复出现的数值只编码一次,同时计算相同数值重复连续的次数,成为行程长 度。 Ø 尤其适用于计算机生成的图像。 四、词典编码 ①第一类算法思想:企图查找正在压缩的字符序列是否在以前输入的数据中出现过,用已经出现过的字符串替换重复部分,它的 输出仅仅是指向早期出现过的字符串的“指针” 。 输入: 输出: ②第二类算法思想:企图从输入的数据中创建一个“短语词典”编码数据过程中当遇到已经在词典中出现的“短语”时,编码器 就输出这个词典中短语的“索引号”而非短语本身。 1、LZ77 算法: 用( p , l ) c 表示前向缓冲存储器中字符的最长匹配结果 p:最长匹配时,字典中字符开始的位置 l:最长匹配字符串的长度 c:前向缓冲存储器最长匹配结束时的下一个字符 LZ77 算法冗余: 1、 编码器输出包含空指针。 2、 编码器可能输出额外字符(包含在下一个匹配串中的字符) 。 2、LZSS 算法: 思想:若匹配串长度比指针本身长度长,则输出指针,否则输出真是字符。 3、LZ78 算法: 压缩过程中就是重复( p , l ) c,并将 l=l+1。 a b c d x p m a b c d x a b c m
ijDkElm iEnDjo
男声 300~3000 Hz 女声 300~3400 Hz 高保真声音(high-fidelity audio) 10—20 KHz
= 20������������
ijDkElm ijDkElm(;/:p )
= 20 lg 2E = 6.02������
数据无损压缩
一、数据冗余 ①概念: 人为冗余 冗余 试听冗余 数据冗余 ②决策量(事件数的对数值) ������# = ������������������ (������),其中,n 是事件数(互斥时间) ( 1) ( 2) ( 3) Sh,以 2 为底的对数 Nat,以 e 为底的对数 Hart,以 10 为底的对数
1 + ln (������ ������ ) 1 ≤ |������| ≤ 1 1 + ������������������ ������
5、 PCM 在通信中的应用 ( 1) 频分多路复用(frequency-division multiplexing, FDM) 概念:在一条通信线路上使用不同频段同时传送多个独立信号,是模拟载波通信的主要方法。 核心思想:把传输信道划分为 n 个窄带,每个窄带传送一路信号。 ( 2) 时分多路复用(time-division multiplexing, TDM) 概念:在一条通信线路上使用不同时段传送多个独立信号的方法,是数字通信的主要方法。 核心思想:将时间分成等间隔的时段,为每对用户指定一个时间间隔,每个间隔传输信号的一部分,这样便可使多 用户同时使用一条传输线路。 ①、24 路制的重要参数: l l l l l l l 每秒传送 8000 帧,每帧 125������s 12 帧组成 1 复帧(用于同步) 每帧由 24 个时间片(信道)和 1 位同步位组成 每个信道每次传送 8 位代码,1 帧有 24×8+1=193 位 数据传输率 R=8000×8=64 kb/s 每秒传送 8000 帧,每帧 125������s 16 帧组成 1 复帧(用于同步)
Vsignal:信号电压 Vnoise:量化噪声压
n:采样精度的位数 3、 声音质量与数据率 按频带可将声音质量划分为五个等级: (由低到高) 电话(telephone) 调幅广播(amplitude modulation, AM) 调频广播(frequency modulation, FM) 激光唱片(CD-Audio) 数字录音带(digital audio tape, DAT) P48 表 3-1 声音质量的 MOS 评分: 由若干实验者对声音质量好坏进行评分,求其平均值作为对声音质量的评价,这种方法叫做主观平均判分法。所得的 分数叫做主观平均分(mean opinion score, MOS) 4、 脉冲编码调制(pulse code modulation, PCM) ① PCM 的概念: 输入:模拟声音信号
数ቤተ መጻሕፍቲ ባይዱ声音编码
一、 声音 1、 声音是听觉器官对声波的感知,声波是通过空气或其他媒体传播的连续震动。 声音的强弱:声波压力的大小 音调的高低:声音的频率 反射(reflection) 声波具有的普通波特性: 折射(refraction) 衍射(diffraction) 2、 声音的频率范围 亚音(subsonic) < 20Hz 声音(audio/sound) 20—20KHz 300—3400Hz >20 KHz (有些题目的答案是 50—20KHz) 话音(speech/voice) 超声(ultrasonic) 二、 声音信号的数字化 1、 模拟信号:时间和幅度上都是连续的信号。 声音的数字化: 采样:在特定时刻对模拟信号进行测量,等时间间隔采样叫做均匀采样 量化:将信号的强度划分成一小段一小段,若划分是等间隔的叫线性量化,否则叫做非线性量化 2、 声音信号数字化需要注意的两个问题 ( 1) 采样频率——每秒采集声音样本的数量 奎特斯特理论:采样率不低于声音信号最高频率的 2 倍,这样就能把以数字表达的声音还原为原来的声音。 (无损 数字化[lossless digitization] ) ( 2) 采样精度 精度是在模拟信号数字化过程中度量模拟信号的最小单位,也称“量化阶”(quantization step size) 样本位数大小反映度量声音波形的精度,位数越多,声音质量越高,所需存储空间越多。 采样精度的另一种表示方法:信号噪声比(signal-to-noise ratio, SNR) SNR=20������������
输出:PCM 样本 防失真滤波器:滤除声音频带以外的信号(低通滤波器) 波形编码器:可理解为采样器 量化器:量化阶大小生成器,或量化间隔生成器 ② 均匀量化 概念:采用相等的量化间隔对采样得到的信号进行量化 Ø 为适应幅度大的输入信号,同时又满足精度要求,就需要增加样本位数,但对话音信号来说,大信号出现的机会不多, 增加的样本位数没有充分利用,为克服此不足,便引入了非均匀量化,也叫非线性量化。 ③ 非均匀量化 概念:对输入信号进行量化时,大信号采用大的量化间隔,小的输入信号采用小的量化间隔。 采样输入信号幅度和量化输出数据之间的两种对应关系: ( 1) µ 律压扩算法 运用于北美和日本数字电话通信中 A 律压扩算法(运用于欧洲和中国大陆数字电话通信中) ln (1 + ������|������|) ln (1 + ������)
③信息量(具有确定概率事件的信息的定量度量) ������ ������ = ������������������:
; < =
= −������������������: ������(������),p(x)是事件 x 出现的概率
☆对于等概率事件的集合,其每个事件的信息量=该集合的决策量 ④熵(事件信息的平均值) ������ ������ =
E DF; ℎ
������D =
E DF; ������
������D ������ ������D = −
E DF; ������
������D ������������������: ������ ������D
其中: ℎ ������D 为事件������D 的熵 ������ ������D 为事件������D 的信息量 Ø ������ = ������# − ������ ������ ������D 为事件������D 发生的概率
②、30 路制的重要参数
l l l l
每帧由 32 个时间片(信道)组成 每个信息每次传送 8 位代码 数据传输率 R=32×8×8000=2048 kb/s 每一个话路的数据传输率=8000×8=64 kb/s
Ø 由于当信道无数据传输时仍给那个信道分配时间槽,因此线路利用率较低,为解决此问题开发了统计时分多路复用技术 (statistical time division multiplexing, STDM) ,按照每个传输信道的传输需要来分配时间间隔, 提高了传输线路的效率。 6、 增量调制与自适应增量调制 ( 1) 增量调制(delta modulation, DM) 是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成“0”和“1”两种可能的取值,若 实际采样信号与预测的采样信号之差为“正” ,则用“1”表示,相反则用“0”表示。 ①斜率过载: 增量调制器的输出不能保持跟踪输入信号的快速变化,一般,当输入 信号的变化速度超过反馈回路输出信号的最大变化速度时就会发生斜率过载(主要原因:量化阶固定不变) ②粒状噪声: 在输入信号缓慢变化部分, 即输入信号与预测信号的差值接近零的区域, 增量调制器的输出出现随机交变的 “ 0” 和“1” ,这种噪声不可消除。 Ø ( 2) 自适应增量调制(adaptive delta modulation, ADM) 基本方法:检测到斜率过载时增大量化阶∆,而在输入信号的斜率减小时降低量化阶∆。 7、 自适应差分脉冲编码调制 ( 1) 自适应差分编码调制(adaptive pulse code modulation, APCM) 基本方法:根据输入信号幅度大小来改变量化阶大小。 瞬时自适应:量化阶大小每隔几个样本就改变 音节自适应:量化阶的大小在较长时间周期里发生改变 改变量化阶大小的两种方法: 前向自适应(forward adaption) 后向自适应(backward adaption) ( 2) 差分脉冲编码调制(differential pulse code modulation, DPCM) 基本方法:利用样本与样本之间存在的信息冗余来进行编码,根据过去的样本来估算下一个样本信号的幅度大小, 这个值成为预测值,然后对实际信号值与预测值之差进行量化编码,从而减少了表示每个样本信号的位数。 ( 3) 自适应差分脉冲编码调制(adaptive differential pulse code modulation, ADPCM) ①、利用自适应的思想改变量化阶大小,即用小的量化阶去编码小的差值,用大的量化阶去编码大的差值。 ②、使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。 8、 子带编码(sub-band coding, SBC) 基本思想:使用一组带通滤波器(band-pass filter, BPF)把输入声音信号的频带划分成若干个连续的频段,每个频段称为子 带,对每个子带的声音信号采用单独的编码方式去编码,在信道上传输时,将每个子带的代码复合起来,接收端译码时,将 每个子带单独译码,然后再进行重组,还原成原来的声音信号。 子带编码的两个好处: ①:对每个子带信号分别进行自适应控制,量化阶的大小可按照每个子带的能量电平加以调节 ②:根据每个子带信号在感觉上的重要性,对每个子带分配不同的位数,用来表示每个样本值。 Ø 由于分割频带的滤波器不是理想滤波器,经过分带、编码、译码后合成输出的声音信号会有混迭效应,采用正交滤波器 (quadrature mirror filter, QMF)来划分频带,混迭效应在最后合成时会消失。 9、 线性预测编码(linear predictive coding, LPC) 宋 :输出不变时量化阶增大 50%,改变时减小 50% 格林弗斯基:连续出现三个同样的值,量化阶加一个较大的增量,反之,加一个较小的增量 增大量化阶 ⟹ 斜率过载改善 ⟹ 粒状噪声加重 减小量化阶 ⟹ 斜率过载严重 ⟹ 粒状噪声改善
相关文档
最新文档