医学图像压缩技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
Medical Image Compression
表2 图像压缩编码分类
图 像 压 缩 编 码 方 法 无失真编码 (熵编码) 统计编码 霍夫曼编码、Shannon-Fano编码、游程编码 算术编码 基于字典的编码:LZW编码等 其它编码 限失真编码 (熵压缩) 特征提取 完全可逆的小波变换+统计编码等 分析/综合编码 子带、小波、分形、模型基等 其它 量 化 有 记 忆 量 化 无记忆量化 序列量化 预测编码 其它方法 分组量化 直接映射 变换编码 均匀量化、Max量化等 线性预测、非线性预测、自适应预测 序贯量化 矢量量化、神经网络、方块截尾编码 正交变换:KLT、DCT、DFT、WHT 非正交变换 其它函数变换
26
Medical Image Compression
霍夫曼编码— Case Study 2 霍夫曼编码举例2 编码前 N = 8 symbols: {a,b,c,d,e,f,g,h}, 3 bits per symbol (N =23=8) P(a) = 0.01, P(b)=0.02, P(c)=0.05, P(d)=0.09, P(e)=0.18, P(f)=0.2, P(g)=0.2, P(h)=0.25 计算 (1) 该字符串的霍夫曼码 (2) 该字符串的熵 (3) 该字符串的平均码长 (4) 编码效率
24
Medical Image Compression
香农-范诺编码
图2-1 香农-范诺算法编码举例
(3)压缩比的实际值 按照这种方法进行编码需要的总位数为 30+14+14+18+15=91, 实际的压缩比为120:91≈1.32 : 1
25
Medical Image Compression
H ( X ) p ( xi ) log 2 p ( xi )
i 1 n
p ( A) log 2 ( p ( A)) p ( B ) log 2 ( p ( B )) p ( E ) log 2 ( p ( E )) = (15/40) log 2 (40/15)+(7/40) log 2 (40/7)+ +(5/40) log 2 (40/5) 2.196
Medical Image Compression 医学图像压缩专题详细讲座
Medical Image Compression
1、图像数据压缩的概念 图像数据压缩,就是以尽量少的比特数表征图像数据信号,减少容纳 给定消息集合或数据采样集合的信号空间,同时保证重建图像的质量。 所谓信号空间,亦即被压缩对象,是指: 物理空间,如存储器、磁盘
这个数值表明,每个符号不需要用3位构成的代码表示,而用 2.196位就可以,因此40个像素只需用87.84位就可以,因此在理 论上,这幅图像的的压缩比为120:87.84≈1.37:1,实际上就是 3:2.196≈1.37
23
Medical Image Compression
香农-范诺编码 (2) 符号编码 对每个符号进行编码时采用―从上到下‖的方法。首先按照符号 出现的频度或概率排序,如A,B,C,D和E,见表2-2。然后 使用递归方法分成两个部分,每一部分具有近似相同的次数, 如图所示.
1
Medical Image Compression
2、医学图像数据压缩的必要性 多种成像方式,如 X 线图像、 CT 、 MRI 、 US 、 ECT(PET 、 SPECT) 等,且成像速度和分辨率逐渐提高,层厚逐渐减少; 常规 X 线正在从胶片转向无胶片 化的计算机放射摄影( Computed Radiography , CR ) 或 更 为 先 进 的 数 字 化 放 射 摄 影 ( Digital Radiography,DR)的数字化时代。 医学图像的数字化使得图像的数据量呈几何级数地增长。 表1列出了目前医学成像设备及其生成的图像数据量大小。
34
Medical Image Compression
霍夫曼编码— Case Study 2
35
Medical Image Compression
霍夫曼编码— Case Study 2 (1) Average length per symbol (before coding):
L i 1 3 P ( i ) 3 bits/symbol
混合编码 — 对图像数据同时使用两种或两种以上的编码方 法,能大大提高数据压缩的效率。
12
Medical Image Compression
数据的冗余 冗余概念 人为冗余 在信息处理系统中,使用两台计算机做同样的工作是提 高系统可靠性的一种措施 在数据存储和传输中,为了检测和恢复在数据存储或数 据传输过程中出现的错误,根据使用的算法的要求,在 数据存储或数据传输之前把额外的数据添加到用户数据 中,这个额外的数据就是冗余数据。 视听冗余 由于人的视觉系统和听觉系统的局限性,在图像数据和 声音数据中,有些数据确实是多余的,使用算法将其去 掉后并不会丢失实质性的信息或含义,对理解数据表达 的信息几乎没有影响。 数据冗余 不考虑数据来源时,单纯数据集中也可能存在多余的数 据,去掉这些多余数据并不会丢失任何信息,这种冗余 称为数据冗余,而且还可定量表达。
22
B 7 7/40
C 7 7/40
D 6 6/40
E 5 5/40
Medical Image Compression
香农-范诺编码 (1) 压缩比的理论值 按照常规的编码方法,表示5个符号最少需要3位,如用000表 示A,001表示B,…,100表示E,其余3个代码 (101,110, 111)不用。这就意味每个像素用3位,编码这幅图像总共需要 120位。按照香农理论,这幅图像的熵为
、磁带、光盘等数据存储介质; 时间区间,如传输给定消息集合所需
要的时间; 频谱区域,如为传输给定消息集合所要求的带宽等。 也 就是指某数据信号集合所占的空域、时域和频域空间。 信号空间的
这几种形式是相互关联的,存储空间的减少也意味着传输 效率的提高与占用带宽的节省。这就是说,只要采用某种方法来减少某一 种信号空间,都能压缩数据。
最早阐述和实现―从上到下‖的熵编码方法的人是 Shannon(1948年)和Fano(1949年),因此称为香农-范诺 (Shannon- Fano)编码法
21
Medical Image Compression
2.2.1 香农-范诺编码 香农-范诺编码举例 有一幅40个像素组成的灰度图像,灰度共有5级,分别用符号 A,B,C,D和E表示。40个像素中出现灰度A的像素数有15 个,出现灰度B的像素数有7个,出现灰度C的像素数有7个, 其余情况见表2-1。 (1) 计算该图像可能获得的压缩比的理论值 (2) 对5个符号进行编码 (3) 计算该图像可能获得的压缩比的实际值 表2-1 符号在图像中出现的数目 符号 出现的次数 出现的概率 A 15 15/40
H / L Huf 98%
36
Medical Image Compression
5、压缩图像质量的评价和压缩技术比较方法 对压缩图像质量评价和压缩技术 比较方法,主要分两种:主观和客观。 常见的客观方法有归一化的均方 差(Normalized Mean Squared Error, NMSE)、峰值信噪比( Peak Signal-to-Noise Ratio,PSNR)、比特率(Bit Rate)和压缩比(Compression Ratio,CR)。
15
Medical Image Compression
数据的冗余 决策量(decision content) 在有限数目的互斥事件集合中,决策量是事件数的对数值 在数学上表示为 H0=log(n) 其中,n是事件数 决策量的单位由对数的底数决定 Sh (Shannon): 用于以2为底的对数 Nat (natural unit): 用于以e为底的对数 Hart (hartley):用于以10为底的对数
16
Medical Image Compression
数据的冗余 信息量(information content) 具有确定概率事件的信息的定量度量 在数学上定义为
I ( x) log 2 [1/ p( x)] log 2 p ( x) 其中,p ( x ) 是事件出现的概率
8
(2) Entropy:
ห้องสมุดไป่ตู้
H i1 P(i )log2 P(i ) 2.5821 bits/symbol
8
(3) Average length per symbol (with Huffman coding):
L Huf 2.63 bits/symbol
(4) Efficiency of the code:
对于医学图像,主观评价方法有主观分级(Subjective Rating)评价、双 盲双选项强迫选择(Double-blinded two-alternative forced-choice)和诊断精 确性(Diagnostic Accuracy)评价。
统计编码——霍夫曼编码 霍夫曼编码(Huffman coding) 霍夫曼(D.A. Huffman)在1952年提出和描述的―从下到上‖的熵 编码方法 根据给定数据集中各元素所出现的频率来压缩数据的一种统计 压缩编码方法。这些元素(如字母)出现的次数越多,其编码的 位数就越少 广泛用在JPEG, MPEG, H.26X等各种信息编码标准中
一个等概率事件的集合,每个事件的信息量等于该集合的决 策量
17
Medical Image Compression
数据的冗余 数据的冗余量
19
Medical Image Compression
统计编码 统计编码 给已知统计信息的符号分配代码的数据无损压缩方法 编码方法 香农-范诺编码 霍夫曼编码 算术编码 编码特性 香农-范诺编码和霍夫曼编码的原理相同,都是根据符号集中各 个符号出现的频繁程度来编码,出现次数越多的符号,给它分 配的代码位数越少 算术编码使用0和1之间的实数的间隔长度代表概率大小,概率 越大间隔越长,编码效率可接近于熵。
11
Medical Image Compression
变换编码 — 先对像素数据进行某种函数变换,从一种信号 空间变换到另一种信号空间,然后再对变换后的数据进行 编码。通常存在反变换,以恢复原来的数据。 主要目的: 把统计相关的采样值变换成―某种程度上统计独 立‖的系数 。大多数变换属线性正交变换。变换本身并不提 供压缩 ,而只是将信号映射到另一域内,在所映射的域中 压缩 较易实现。随后通过比特分配的量化过程,把变换后 的 采样值进行压缩,以供存储或传输。
举例:假设X={a,b,c}是由3个事件构成的集合,p(a)=0.5, p(b)=0.25,p(b)=0.25分别是事件a, b和c出现的概率,这些事 件的信息量分别为, I(a)=log2(1/0.50)=1 sh I(b)=log2(1/0.25)=2 sh I(c)=log2(1/0.25)=2 sh
10
Medical Image Compression
统计编码 — 根据像素数据出现概率的分布特性而进行的压 缩编码。 编码思想:在原始数据和编码数据之间找到明确的一一对 应关系,以便在恢复时能准确无误地再现出来,使平均码 长或码率压低到最低限度。
预测编码 — 预测编码法主要是在时域内进行的一种压缩编 码法。 大致过程:先对下一个采样值预测,并把该预测值与下一 个采样的实际值之差进行编码。理由是:大部分信号集合 中,用上述方式得到的差值的方差总小于原始信号的方差 。这样可藉较小的量化级进行有效量化,获得较大的压缩 比。
20
Medical Image Compression
统计编码——香农-范诺编码 香农-范诺编码(Shannon–Fano coding) 在香农的源编码理论中,熵的大小表示非冗余的不可压缩的 信息量 在计算熵时,如果对数的底数用2,熵的单位就用―香农 (Sh)‖,也称―位(bit)‖ 。―位‖是1948年Shannon首次使用的术 语。例如