DCT--离散余弦变换
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
离散余弦变换
维基百科,自由的百科全书
离散余弦变换(DCT for Discrete Cosine Transform)是与傅里叶变换相关的一 种变换,它类似于离散傅里叶变换 (DFT for Discrete Fourier Transform),但 是只使用实数。离散余弦变换相当于 一个长度大概是它两倍的离散傅里叶 变换,这个离散傅里叶变换是对一个 实偶函数进行的(因为一个实偶函数的 傅里叶变换仍然是一个实偶函数),在 有些变形里面需要将输入或者输出的 位置移动半个单位(DCT有8种标准类 型,其中4种是常见的)。
和离散傅里叶变换类似,变化前面的归一化系数仅仅是常规而已,改变这个系数并不改变变
换的性质。例如,有些人喜欢在DCT-II变换的前面乘以 更相似,而不需要另外的归一化系数。
,这样反变换从形式上就和变换
计算
尽管直接使用公式进行变换需要进行O(n2)次操作,但是和快速傅里叶变换类似,我们有复杂 度为O(nlog(n))的快速算法,这就是常常被称做蝶形变换的一种分解算法。另外一种方法是通 过快速傅里叶变换来计算DCT,这时候需要O(n)的预操作和后操作。
交矩阵 (再乘一个系数的话),但是这样就不能直接和一个有半个抽样位移的实偶离散傅里叶 变换对应了。
所以,DCT-II暗示的边界条件是: xk 相对于
点偶对称,并且相对于
点偶对称; 对 fm 相对于m = 0 点偶对称,并且相对于 m = n 点奇对称。
DCT-III
因为这是DCT-II的逆变换(再乘一个系数的话),这种变形通常被简单的称为逆离散余弦变 换。
xk 相对于k = 0 点偶对称,并且相对于
k = n − 1 点偶对
百度文库DCT-II
DCT-II大概是最常用的一种形式,通常直接被称为DCT。
mhtml:file://C:\Documents%20and%20Settings\Administrator\桌面\FAT3... 2010-10-22
有些人更进一步的将f0再乘以 (参见下面的DCT-III型的对应修改)。这将使得DCT-II成为正
对 fm 相对于
点偶对称,并且相对于
点奇对称。
DCT-IV
DCT-IV对应的矩阵是正交矩阵 (再乘一个系数的话)。
一种DCT-IV的变形,将不同的变换的数据重叠起来,被称为改进的离散余弦变换。
DCT-IV暗示的边界条件是: xk 相对于 对称;对j 类似。
点偶对称,并且相对于 k = ''n'' − 1 / 2 点奇
最常用的一种离散余弦变换的类型是 下面给出的第二种类型,通常我们所 说的离散余弦变换指的就是这种。它 的逆,也就是下面给出的第三种类 型,通常相应的被称为"反离散余弦变 换","逆离散余弦变换"或者"IDCT"。
有两个相关的变换,一个是离散正弦 变换(DST for Discrete Sine Transform), 它相当于一个长度大概是它两倍的实 奇函数的离散傅里叶变换;另一个是 改进的离散余弦变换(MDCT for Modified Discrete Cosine Transform),它 相当于对交叠的数据进行离散余弦变 换。
目录
2d DCT (type II) 与 DFT的比较.
1 应用 2 正式定义
2.1 DCT-I
2.2 DCT-II
2.3 DCT-III
2.4 DCT-IV
2.5 DCT V~VIII 3 反变换 4 计算 5 参考 6 外部链接
应用
离散余弦变换,尤其是它的第二种类型,经常被信号处理和图像处理使用,用于对信号和图
外部链接
离散余弦变换
取自“http://zh.wikipedia.org/zh-cn/离æ����������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
一个类似的变换, 改进的离散余弦变换被用在高级音频编码(AAC for Advanced Audio Coding),Vorbis 和 MP3 音频压缩当中。
离散余弦变换也经常被用来使用谱方法来解偏微分方程,这时候离散余弦变换的不同的变量 对应着数组两端不同的奇/偶边界条件。
正式定义
形式上来看,离散余弦变换一个线性的可逆 函数
mhtml:file://C:\Documents%20and%20Settings\Administrator\桌面\FAT3... 2010-10-22
像(包括静止图像和运动图像)进行有损数据压缩。这是由于离散余弦变换具有很强的"能量集 中"特性:大多数的自然信号(包括声音和图像)的能量都集中在离散余弦变换后的低频部分,而 且当信号具有接近马尔可夫过程(Markov processes)的统计特性时,离散余弦变换的去相关性 接近于K-L变换(Karhunen-Loève 变换--它具有最优的去相关性)的性能。
有些人更进一步的将x0再乘以 (参见上面的DCT-II型的对应修改),这将使得DCT-III成为正 交矩阵 (再乘一个系数的话),但是这样就不能直接和一个结果有半个抽样位移的实偶离散傅
里叶变换对应了。
所以,DCT-III暗示的边界条件是: xk 相对于k = 0 点偶对称,并且相对于 k = n 点奇对称;
Matteo Frigo and Steven G. Johnson: FFTW, http://www.fftw.org/. 一个免费的C语言库 GPL,可以计算DCT-I~IV的1维到多维的任意大小的变换
M. Frigo and S. G. Johnson, "FFTW3的设计和实现," Proceedings of the IEEE 93 (2), 216– 231 (2005).
例如,在静止图像编码标准JPEG中,在运动图像编码标准MJPEG和MPEG的各个标准中都使 用了离散余弦变换。在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进 行量化之后进行熵编码。这时对应第二种类型离散余弦变换中的n通常是8,并用该公式对每 个8x8块的每行进行变换,然后每列进行变换。得到的是一个8x8的变换系数矩阵。其中(0,0) 位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分类。
DCT V~VIII
上面提到的DCT I~IV是和偶数阶的实偶DFT对应的。原则上,还有四种DCT变换(Martucci, 1994)是和奇数阶的实偶DFT对应的,它们在分母中都有一个''n'' + 1 / 2的系数。但是在实际应 用中,这几种变型很少被用到。
最平凡的和奇数阶的实偶DFT对应的DCT是1阶的DCT (1也是奇数),可以说变换只是乘上一 个系数a而已,对应于DCT-V的长度为1的状况。
S. A. Martucci, 对称卷积和离散正弦余弦变换 (Symmetric convolution and the discrete sine and cosine transforms), IEEE Trans. Sig. Processing SP-42, 1038-1051 (1994).
mhtml:file://C:\Documents%20and%20Settings\Administrator\桌面\FAT3... 2010-10-22
反变换
DCT-I的反变换是把DCT-I乘以系数
。 DCT-IV的反变换是把DCT-IV乘以系数 。
DCT-II的反变换是把DCT-III乘以系数 ,反之亦然。
(其中 R 是实数集, 或者
等价的说一个
的方阵。离散余弦变换有几种变形的形式, 它们都是根据下面的某一
个公式把 n 个实数
变换到另外n个实数
的操作。
DCT-I
有些人认为应该将 x0 和 xn − 1 乘以 ,相应的将 f0 和 fn − 1 乘以 。这样做的结果是这
种 DCT-I 矩阵变为了 正交矩阵 (再乘一个系数的话),但是这样就不能直接和一个实偶离散 傅里叶变换对应了。
一个n = 5的对实数abcde的DCT-I型变换等价于一个8点的对实数abcdedcb(偶对称)的DFT变 换,结果再除以2(对应的,DCT-II~DCT-IV相对等价的DFT有一个半个抽样的位移)。需要指 出的是,DCT-I不适用于n < 2的情况(其它的DCT类型都适用于所有的整数n)。
所以,DCT-I暗示的边界条件是: 称; 对 fm 的情况也类似。
参考
K. R. Rao and P. Yip, 离散余弦变换 : 算法、优点和应用 (Discrete Cosine Transform: Algorithms, Advantages, Applications) (Academic Press, Boston, 1990).
A. V. Oppenheim, R. W. Schafer, and J. R. Buck, 时间离散信号处理 (Discrete-Time Signal Processing), second edition (Prentice-Hall, New Jersey, 1999).
维基百科,自由的百科全书
离散余弦变换(DCT for Discrete Cosine Transform)是与傅里叶变换相关的一 种变换,它类似于离散傅里叶变换 (DFT for Discrete Fourier Transform),但 是只使用实数。离散余弦变换相当于 一个长度大概是它两倍的离散傅里叶 变换,这个离散傅里叶变换是对一个 实偶函数进行的(因为一个实偶函数的 傅里叶变换仍然是一个实偶函数),在 有些变形里面需要将输入或者输出的 位置移动半个单位(DCT有8种标准类 型,其中4种是常见的)。
和离散傅里叶变换类似,变化前面的归一化系数仅仅是常规而已,改变这个系数并不改变变
换的性质。例如,有些人喜欢在DCT-II变换的前面乘以 更相似,而不需要另外的归一化系数。
,这样反变换从形式上就和变换
计算
尽管直接使用公式进行变换需要进行O(n2)次操作,但是和快速傅里叶变换类似,我们有复杂 度为O(nlog(n))的快速算法,这就是常常被称做蝶形变换的一种分解算法。另外一种方法是通 过快速傅里叶变换来计算DCT,这时候需要O(n)的预操作和后操作。
交矩阵 (再乘一个系数的话),但是这样就不能直接和一个有半个抽样位移的实偶离散傅里叶 变换对应了。
所以,DCT-II暗示的边界条件是: xk 相对于
点偶对称,并且相对于
点偶对称; 对 fm 相对于m = 0 点偶对称,并且相对于 m = n 点奇对称。
DCT-III
因为这是DCT-II的逆变换(再乘一个系数的话),这种变形通常被简单的称为逆离散余弦变 换。
xk 相对于k = 0 点偶对称,并且相对于
k = n − 1 点偶对
百度文库DCT-II
DCT-II大概是最常用的一种形式,通常直接被称为DCT。
mhtml:file://C:\Documents%20and%20Settings\Administrator\桌面\FAT3... 2010-10-22
有些人更进一步的将f0再乘以 (参见下面的DCT-III型的对应修改)。这将使得DCT-II成为正
对 fm 相对于
点偶对称,并且相对于
点奇对称。
DCT-IV
DCT-IV对应的矩阵是正交矩阵 (再乘一个系数的话)。
一种DCT-IV的变形,将不同的变换的数据重叠起来,被称为改进的离散余弦变换。
DCT-IV暗示的边界条件是: xk 相对于 对称;对j 类似。
点偶对称,并且相对于 k = ''n'' − 1 / 2 点奇
最常用的一种离散余弦变换的类型是 下面给出的第二种类型,通常我们所 说的离散余弦变换指的就是这种。它 的逆,也就是下面给出的第三种类 型,通常相应的被称为"反离散余弦变 换","逆离散余弦变换"或者"IDCT"。
有两个相关的变换,一个是离散正弦 变换(DST for Discrete Sine Transform), 它相当于一个长度大概是它两倍的实 奇函数的离散傅里叶变换;另一个是 改进的离散余弦变换(MDCT for Modified Discrete Cosine Transform),它 相当于对交叠的数据进行离散余弦变 换。
目录
2d DCT (type II) 与 DFT的比较.
1 应用 2 正式定义
2.1 DCT-I
2.2 DCT-II
2.3 DCT-III
2.4 DCT-IV
2.5 DCT V~VIII 3 反变换 4 计算 5 参考 6 外部链接
应用
离散余弦变换,尤其是它的第二种类型,经常被信号处理和图像处理使用,用于对信号和图
外部链接
离散余弦变换
取自“http://zh.wikipedia.org/zh-cn/离æ����������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
一个类似的变换, 改进的离散余弦变换被用在高级音频编码(AAC for Advanced Audio Coding),Vorbis 和 MP3 音频压缩当中。
离散余弦变换也经常被用来使用谱方法来解偏微分方程,这时候离散余弦变换的不同的变量 对应着数组两端不同的奇/偶边界条件。
正式定义
形式上来看,离散余弦变换一个线性的可逆 函数
mhtml:file://C:\Documents%20and%20Settings\Administrator\桌面\FAT3... 2010-10-22
像(包括静止图像和运动图像)进行有损数据压缩。这是由于离散余弦变换具有很强的"能量集 中"特性:大多数的自然信号(包括声音和图像)的能量都集中在离散余弦变换后的低频部分,而 且当信号具有接近马尔可夫过程(Markov processes)的统计特性时,离散余弦变换的去相关性 接近于K-L变换(Karhunen-Loève 变换--它具有最优的去相关性)的性能。
有些人更进一步的将x0再乘以 (参见上面的DCT-II型的对应修改),这将使得DCT-III成为正 交矩阵 (再乘一个系数的话),但是这样就不能直接和一个结果有半个抽样位移的实偶离散傅
里叶变换对应了。
所以,DCT-III暗示的边界条件是: xk 相对于k = 0 点偶对称,并且相对于 k = n 点奇对称;
Matteo Frigo and Steven G. Johnson: FFTW, http://www.fftw.org/. 一个免费的C语言库 GPL,可以计算DCT-I~IV的1维到多维的任意大小的变换
M. Frigo and S. G. Johnson, "FFTW3的设计和实现," Proceedings of the IEEE 93 (2), 216– 231 (2005).
例如,在静止图像编码标准JPEG中,在运动图像编码标准MJPEG和MPEG的各个标准中都使 用了离散余弦变换。在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进 行量化之后进行熵编码。这时对应第二种类型离散余弦变换中的n通常是8,并用该公式对每 个8x8块的每行进行变换,然后每列进行变换。得到的是一个8x8的变换系数矩阵。其中(0,0) 位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分类。
DCT V~VIII
上面提到的DCT I~IV是和偶数阶的实偶DFT对应的。原则上,还有四种DCT变换(Martucci, 1994)是和奇数阶的实偶DFT对应的,它们在分母中都有一个''n'' + 1 / 2的系数。但是在实际应 用中,这几种变型很少被用到。
最平凡的和奇数阶的实偶DFT对应的DCT是1阶的DCT (1也是奇数),可以说变换只是乘上一 个系数a而已,对应于DCT-V的长度为1的状况。
S. A. Martucci, 对称卷积和离散正弦余弦变换 (Symmetric convolution and the discrete sine and cosine transforms), IEEE Trans. Sig. Processing SP-42, 1038-1051 (1994).
mhtml:file://C:\Documents%20and%20Settings\Administrator\桌面\FAT3... 2010-10-22
反变换
DCT-I的反变换是把DCT-I乘以系数
。 DCT-IV的反变换是把DCT-IV乘以系数 。
DCT-II的反变换是把DCT-III乘以系数 ,反之亦然。
(其中 R 是实数集, 或者
等价的说一个
的方阵。离散余弦变换有几种变形的形式, 它们都是根据下面的某一
个公式把 n 个实数
变换到另外n个实数
的操作。
DCT-I
有些人认为应该将 x0 和 xn − 1 乘以 ,相应的将 f0 和 fn − 1 乘以 。这样做的结果是这
种 DCT-I 矩阵变为了 正交矩阵 (再乘一个系数的话),但是这样就不能直接和一个实偶离散 傅里叶变换对应了。
一个n = 5的对实数abcde的DCT-I型变换等价于一个8点的对实数abcdedcb(偶对称)的DFT变 换,结果再除以2(对应的,DCT-II~DCT-IV相对等价的DFT有一个半个抽样的位移)。需要指 出的是,DCT-I不适用于n < 2的情况(其它的DCT类型都适用于所有的整数n)。
所以,DCT-I暗示的边界条件是: 称; 对 fm 的情况也类似。
参考
K. R. Rao and P. Yip, 离散余弦变换 : 算法、优点和应用 (Discrete Cosine Transform: Algorithms, Advantages, Applications) (Academic Press, Boston, 1990).
A. V. Oppenheim, R. W. Schafer, and J. R. Buck, 时间离散信号处理 (Discrete-Time Signal Processing), second edition (Prentice-Hall, New Jersey, 1999).