信息论与编码课程设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息论与编码课程设计报告

设计题目:统计信源熵、香农编码与费诺编码

专业班级:XXXXXXXXXXXX

姓名:XXXXXXXXXXXX

学号:XXXXXXXXXXXX

指导老师:XXXXXXXXXXXX

成绩:

时间:2015年3月31日

目录

一、设计任务与要求 (2)

二、设计思路 (2)

三、设计流程图 (5)

四、程序及结果 (7)

五、心得体会 (11)

六、参考文献 (12)

附录 (13)

一、 设计任务与要求

1. 统计信源熵

要求:统计任意文本文件中各字符(不区分大小写)数量,计算字符概率,并计算信源熵。 2. 香农编码

要求:任意输入消息概率,利用香农编码方法进行编码,并计算信源熵和编码效率。 3. 费诺编码

要求:任意输入消息概率,利用费诺编码方法进行编码,并计算信源熵和编码效率。

二、 设计思路

1、统计信源熵:

统计信源熵就是对一篇英文文章中的i 种字符(包括标点符号及空格,英文字母不区分大小写)统计其出现的次数count i (),然后计算其出现的概率()p i ,最后由信源熵计算公式:

1()()log ()n

i i n H x p x p x ==-∑

算出信源熵()H x 。所以整体步骤就是先统计出文章中总的字符数,然后统计每种字符的数目,直到算出所有种类的字符的个数,进而算出每种字符的概率,再由信源熵计算公式计算出信源熵。在这里我选择用Matlab 来计算信源熵,因为Matlab 中系统自带了许多文件操作和字符串操作函数,其计算功能强大,所以计算信源熵很是简单。

2、香农编码

信源编码模型:

信源编码就是从信源符号到码符号的一种映射f ,它把信源输出的符号i a 变换成码元序列i x 。 1,2,...,,i i N f a i q x =→:

1:{,...,}

q S s a a ∈ 信源 1

2

{,...,}li

i i i i X x x x = 码元

1{,...,}

1,2,...,i q S a a i N ∈= 1,2,...,N i q =

1:{,...,}

r X x x x ∈ 码符号

N 次扩展信源无失真编码器

凡是能载荷一定的信息量,且码字的平均长度最短,可分离的变长码的码字集合都可以称为最佳码。为此必须将概率大的信息符号编以短的码字,概率小的符号编以长的码字,使得平均码字长度最短。能获得最佳码的编码方法主要有:香农(Shannon )、费诺(Fano )、哈夫曼(Huffman )编码等。 香农第一定理: 离散无记忆信源为

1

21

2......()()()......

q q s s s S p s p s p s P ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦

熵()H S ,其N 次扩展为

1212......

()()()......N q q S p p p P αααααα⎡⎤⎡⎤=⎢⎥

⎢⎥⎢⎣⎦⎦

熵为()N H S ,码符号集为12(,,...,)r X

x x x =。先对信源N S 进行编码,总

可以找到一种编码方法,构成唯一可译码,使S 中每个信源符号所需的平均码长满足

()1()

log log N L H S H S r N N r

+>≥ 且当N →∞时有()

()log lim N r N L H S H S N r →∞=

=

L 是平均码长1

()N

q i i i L p αλ==∑,

i λ是i α对应的码字长度。

香农编码方法:

(1) 将信源消息符号按其出现的概率大小依次排列:12...n p p p ≥≥ (2)确定满足下列不等式整数码长i K 为

()()1i i i lb p K lb p -≤≤-+

(3)为了编成唯一可译码,计算第i 个消息的累加概率为

1

1()i i k k P p a -==∑

(4)将累加概率i P 变成二进制数。

(5)取i P 二进制数小数点后i K 位即为该消息符号的二进制码字。

3、费诺编码方法

(1)将信源消息符号按其出现的概率大小依次排列:12...n

p p p ≥≥

(2)将依次排列的信源符号按概率值分为两大组,使两个组的概率之和近似相同,并对各组赋予一个二进制码元“0”和“1”。(3)将每一大组的信源符号再分为两组,使划分后的两个组的概率之和近似相同,并对各组赋予一个二进制符号“0”和“1”。 (4)如此重复,直至每个组只剩下一个信源符号为止。 (5)信源符号所对应的码字即为费诺码。

三、 设计流程图

① ②

由信源熵计算公式1()()log ()n

i i n H x p x p x ==-∑计算出信源熵

⑤ 2、香农编码

输入概率矩阵

将概率由大到小排列

3、费诺编码

开始

输入概率矩阵

在两组概率之和近似相等的条件下将

概率分为两组,各赋予0,1两个码元

四、程序及结果

1、统计信源熵的Matlab程序

function h=entropy(p)

clc

fid=fopen('shuju.txt','r');%打开txt文件

[ex,num]=fscanf(fid,'%c',inf)%读取二进制文件的数据,并将数据存入矩阵

str1=lower(ex)%将字符串中的大写字母转换成小写字母

sort_str1=sort(str1);%按照字符的ASCII值对字符串排序

j=1;

for i=1:length(sort_str1)-1%计算出字符串的种类

if strcmp(sort_str1(i),sort_str1(i+1))~=1%比较两个字符串是否完全相等,相等是1,否则0 j=j+1;

str2(j)=sort_str1(i);

end

str2(j+1)=sort_str1(i+1);

end

相关文档
最新文档