信息论与编码课程设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息论与编码课程设计报告
设计题目:统计信源熵、香农编码与费诺编码
专业班级:XXXXXXXXXXXX
姓名:XXXXXXXXXXXX
学号:XXXXXXXXXXXX
指导老师:XXXXXXXXXXXX
成绩:
时间:2015年3月31日
目录
一、设计任务与要求 (2)
二、设计思路 (2)
三、设计流程图 (5)
四、程序及结果 (7)
五、心得体会 (11)
六、参考文献 (12)
附录 (13)
一、 设计任务与要求
1. 统计信源熵
要求:统计任意文本文件中各字符(不区分大小写)数量,计算字符概率,并计算信源熵。 2. 香农编码
要求:任意输入消息概率,利用香农编码方法进行编码,并计算信源熵和编码效率。 3. 费诺编码
要求:任意输入消息概率,利用费诺编码方法进行编码,并计算信源熵和编码效率。
二、 设计思路
1、统计信源熵:
统计信源熵就是对一篇英文文章中的i 种字符(包括标点符号及空格,英文字母不区分大小写)统计其出现的次数count i (),然后计算其出现的概率()p i ,最后由信源熵计算公式:
1()()log ()n
i i n H x p x p x ==-∑
算出信源熵()H x 。所以整体步骤就是先统计出文章中总的字符数,然后统计每种字符的数目,直到算出所有种类的字符的个数,进而算出每种字符的概率,再由信源熵计算公式计算出信源熵。在这里我选择用Matlab 来计算信源熵,因为Matlab 中系统自带了许多文件操作和字符串操作函数,其计算功能强大,所以计算信源熵很是简单。
2、香农编码
信源编码模型:
信源编码就是从信源符号到码符号的一种映射f ,它把信源输出的符号i a 变换成码元序列i x 。 1,2,...,,i i N f a i q x =→:
1:{,...,}
q S s a a ∈ 信源 1
2
{,...,}li
i i i i X x x x = 码元
1{,...,}
1,2,...,i q S a a i N ∈= 1,2,...,N i q =
1:{,...,}
r X x x x ∈ 码符号
N 次扩展信源无失真编码器
凡是能载荷一定的信息量,且码字的平均长度最短,可分离的变长码的码字集合都可以称为最佳码。为此必须将概率大的信息符号编以短的码字,概率小的符号编以长的码字,使得平均码字长度最短。能获得最佳码的编码方法主要有:香农(Shannon )、费诺(Fano )、哈夫曼(Huffman )编码等。 香农第一定理: 离散无记忆信源为
1
21
2......()()()......
q q s s s S p s p s p s P ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦
熵()H S ,其N 次扩展为
1212......
()()()......N q q S p p p P αααααα⎡⎤⎡⎤=⎢⎥
⎢⎥⎢⎣⎦⎦
⎣
熵为()N H S ,码符号集为12(,,...,)r X
x x x =。先对信源N S 进行编码,总
可以找到一种编码方法,构成唯一可译码,使S 中每个信源符号所需的平均码长满足
()1()
log log N L H S H S r N N r
+>≥ 且当N →∞时有()
()log lim N r N L H S H S N r →∞=
=
,
L 是平均码长1
()N
q i i i L p αλ==∑,
i λ是i α对应的码字长度。
香农编码方法:
(1) 将信源消息符号按其出现的概率大小依次排列:12...n p p p ≥≥ (2)确定满足下列不等式整数码长i K 为
()()1i i i lb p K lb p -≤≤-+
(3)为了编成唯一可译码,计算第i 个消息的累加概率为
1
1()i i k k P p a -==∑
(4)将累加概率i P 变成二进制数。
(5)取i P 二进制数小数点后i K 位即为该消息符号的二进制码字。
3、费诺编码方法
(1)将信源消息符号按其出现的概率大小依次排列:12...n
p p p ≥≥
(2)将依次排列的信源符号按概率值分为两大组,使两个组的概率之和近似相同,并对各组赋予一个二进制码元“0”和“1”。(3)将每一大组的信源符号再分为两组,使划分后的两个组的概率之和近似相同,并对各组赋予一个二进制符号“0”和“1”。 (4)如此重复,直至每个组只剩下一个信源符号为止。 (5)信源符号所对应的码字即为费诺码。
三、 设计流程图
① ②
由信源熵计算公式1()()log ()n
i i n H x p x p x ==-∑计算出信源熵
⑤ 2、香农编码
输入概率矩阵
将概率由大到小排列
3、费诺编码
开始
输入概率矩阵
在两组概率之和近似相等的条件下将
概率分为两组,各赋予0,1两个码元
四、程序及结果
1、统计信源熵的Matlab程序
function h=entropy(p)
clc
fid=fopen('shuju.txt','r');%打开txt文件
[ex,num]=fscanf(fid,'%c',inf)%读取二进制文件的数据,并将数据存入矩阵
str1=lower(ex)%将字符串中的大写字母转换成小写字母
sort_str1=sort(str1);%按照字符的ASCII值对字符串排序
j=1;
for i=1:length(sort_str1)-1%计算出字符串的种类
if strcmp(sort_str1(i),sort_str1(i+1))~=1%比较两个字符串是否完全相等,相等是1,否则0 j=j+1;
str2(j)=sort_str1(i);
end
str2(j+1)=sort_str1(i+1);
end