信息论课程设计报告

合集下载

信息论课程设计报告(唯一可译码 lzw编码 算数编码) (1)

信息论课程设计报告(唯一可译码 lzw编码 算数编码) (1)

1.判定唯一可译码2.LZw 编码3.算数编码 一 判定唯一可译码1.任务说明输入:任意的一个码(即已知码字个数及每个具体的码字) 输出:判决结果(是/不是)输入文件:in1.txt ,含至少2组码,每组的结尾为”$”符 输出文件:out1.txt ,对每组码的判断结果说明:为了简化设计,可以假定码字为0,1串2.问题分析、实现原理、流程图参考算法伪代码:For all ,i j W W C ∈ do if i W 是j W 的前缀 then将相应的后缀作为一个尾随后缀放入集合0F 中 End if End forLoopFor all i W C ∈ doFor all j n W F ∈ doif i W 是j W 的前缀 then将相应的后缀作为一个尾随后缀放入集合1n F +中 Else if j W 是i W 的前缀 then将相应的后缀作为一个尾随后缀放入集合1n F +中End if End for End fori i F F ←If ,i i W F W C ∃∈∈ thenReturn falseElse if F 中未出现新的元素 thenReturn true End if//能走到这里,说明F 中有新的元素出现,需继续End loop3.实现源码#include <iostream> #include <string> using namespace std; struct strings {char *string;struct strings *next; };struct strings Fstr, *Fh, *FP; //输出当前集合void outputstr(strings *str) { do { cout<<str->string<<endl; str = str->next; }while(str); cout<<endl; }inline int MIN(int a, int b) { return a>b?b:a; } inline int MAX(int a, int b) { return a>b?a:b; } #define length_a (strlen(CP)) #define length_b (strlen(tempPtr))//判断一个码是否在一个码集合中,在则返回0,不在返回1 int comparing(strings *st_string,char *code) {while(st_string->next) { st_string=st_string->next; if(!strcmp(st_string->string,code)) return 0; }return 1;}//判断两个码字是否一个是另一个的前缀,如果是则生成后缀码void houzhui(char *CP,char *tempPtr){if (!strcmp(CP,tempPtr)){cout<<"集合C和集合F中有相同码字:"<<endl<<CP<<endl<<"不是唯一可译码码组!"<<endl;exit(1);}if (!strncmp(CP, tempPtr, MIN(length_a,length_b))){struct strings *cp_temp;cp_temp=new (struct strings);cp_temp->next=NULL;cp_temp->string=new char[abs(length_a-length_b)+1];char *longstr;longstr=(length_a>length_b ? CP : tempPtr);//将长度长的码赋给longstr //取出后缀for (int k=MIN(length_a,length_b); k<MAX(length_a,length_b); k++) cp_temp->string[k - MIN(length_a,length_b)]=longstr[k];cp_temp->string[abs(length_a-length_b)]=NULL;//判断新生成的后缀码是否已在集合F里,不在则加入F集合if(comparing(Fh,cp_temp->string)){FP->next=cp_temp;FP=FP->next;}}}void main(){//功能提示和程序初始化准备cout<<"\t\t唯一可译码的判断!\n"<<endl;struct strings Cstr,*Ch, *CP,*tempPtr;Ch=&Cstr;CP=Ch;Fh=&Fstr;FP=Fh;char c[]="C :";Ch->string=new char[strlen(c)];strcpy(Ch->string, c);Ch->next=NULL;char f[]="F :";Fh->string=new char[strlen(f)];strcpy(Fh->string, f);Fh->next=NULL;//输入待检测码的个数int Cnum;cout<<"输入待检测码的个数:";cin>>Cnum;cout<<"输入待检测码"<<endl;for(int i=0; i<Cnum; i++){cout<<i+1<<" :";char tempstr[10];cin>>tempstr;CP->next=new (struct strings);CP=CP->next;CP->string=new char[strlen(tempstr)] ;strcpy(CP->string, tempstr);CP->next = NULL;}outputstr(Ch);CP=Ch;while(CP->next->next){CP=CP->next;tempPtr=CP;do{tempPtr=tempPtr->next;houzhui(CP->string,tempPtr->string);}while(tempPtr->next);}outputstr(Fh);struct strings *Fbegin,*Fend;Fend=Fh;while(1){if(Fend == FP){cout<<"是唯一可译码码组!"<<endl;exit(1);}Fbegin=Fend;Fend=FP;CP=Ch;while(CP->next){CP=CP->next;tempPtr=Fbegin;for(;;){tempPtr=tempPtr->next;houzhui(CP->string,tempPtr->string);if(tempPtr == Fend)break;}}outputstr(Fh);//输出F集合中全部元素}}4.运行结果:输入、输出及结果分析5.设计体会通过对判定唯一可译码算法的实现,我进一步了解判定唯一可译码缩的基本原理及过,体会到了其重要性,同时也锻炼了我独立分析问题以及解决问题的能力,这次课程设计让我深刻认识到了自己编程能力的不足,在以后的学习中要加强自己的编程能力。

信息论课程设计报告书

信息论课程设计报告书

信息论基础课程设计报告书班级: 计算331 姓名: 王宇(200909014217) 设计题目:课程设计软件设计时间: 2012.7.4 至2012.7.8指导教师:评语:_________________________________________ _________________________________________ _________________________________________ _________________________________________ 评阅成绩:____评阅教师:_____目录华北科技学院课程设计说明书设计总说明 (1)前言 (2)第1章总体设计方案 (3)1.1 软件结构设计 (3)第2章算法思想及设计 (5)2.1香农编码 (5)2.1.1香农编码思想: (5)2.1.2香农编码算法设计: (6)2.2费诺编码 (6)2.2.1费诺编码思想 (6)2.2.2费诺编码算法设计 (7)第3章软件详细设计 (8)3.1主界面设计 (8)3.2功能设计 (8)3.2.1香农编码的实现 (8)3.2.2费诺编码的实现 (15)3.2.3有关文档的链接 (22)3.2.4皮肤切换的设计 (23)第4章软件测试 (26)4.1香农编码的测试 (26)4.1.1 软件运行及结果测试 (26)4.2费诺编码的测试 (27)4.2.1 软件运行及结果测试 (27)4.3测试结果 (29)第5章总结 (30)参考文献 (31)附录 (32)设计总说明早期的数据压缩起源于人们对概率的认识。

当对文字信息进行编码时,如果为出现概率较高的字母赋予较短的编码,为出现概率较低的字母赋予较长的编码,平均编码长度就能缩短不少。

印象中的著名的Morse电码就是一个范例。

信息论之父C.E.Shannon曾指出,任何信息都存在冗余,冗余大小与信息中每个符号的出现概率(不确定性)有关。

信息论课程实验报告—哈夫曼编码

信息论课程实验报告—哈夫曼编码
else if(T[j].weight < T[*p2].weight)
*p2 = j;
}
}
void CreateHuffmanTree(HuffmanTree T)
{
int i,p1,p2;
InitHuffmanTree(T);
InputWeight(T);
for(i = n;i < m;i++)
4)依次继续下去,直至信源最后只剩下两个信源符号为止,将这最后两个信源符号分别用二元码符号“0”和“1”表示;
5)然后从最后—级缩减信源开始,进行回溯,就得到各信源符号所对应的码符号序列,即相应的码字。
四、实验目的:
(1)进一步熟悉Huffman编码过程;(2)掌握C语言递归程序的设计和调试技术。以巩固课堂所学编码理论的知识。
#include "stdio.h"
#include "stdlib.h"
#include <float.h>
#include <math.h>
#define n 8
#define m 2*n-1
typedef struct
{
float weight;
int lchild,rchild,parent;
}
}
void InputWeight(HuffmanTree T)
{
float temp[n] = {0.20,0.18,0.17,0.15,0.15,0.05,0.05,0.05};
for(int i = 0;i < n;i++)
T[i].weight = temp[i];
}

信息论实验报告实验1

信息论实验报告实验1

信息论实验报告一实验一1、实验内容(1)英文信源由26个英文字母和1个空格组成,假定字符从中等概选取,那么一条100个字符的信息提供的信息量为多少?(2)若将27个字符分为三类,9个出现概率占2/7,13个出现概率占4/7,5个出现占1/7,而每类中符号出现等概,求该字符信源的信息熵。

2、设计思路及步骤I=log2P iH(X)=∑−P i log2Pii26个字母和一个空格,因等概选取可以先求得其中一个字符的信息量,通过扩展实现计算100个字符的信息量。

对于第二问,可以将字符分为三组,又因每组字符的概率相等,因此可以求出每组每一个字符的概率。

通过信息熵的定义可以求出结果。

3、程序代码及调试过程1.H1=log2(27)*100 %求其中一个字符的信息量2.H2=-9*(1/9*2/7)*log2(1/9*2/7)-13*(1/13*4/7)*log2(1/13*4/7)-5*(1/5*1/7)*log2(1/5*1/7) %根据定义求出信息熵3.H3=-2/7*log2(2/7)-4/7*log2(4/7)-1/7*log2(1/7) %通过将三组看作整体计算4、出现的问题及解决方法(1)没有看清题目要求,漏掉空格(2)是否可以将三组字符看作整体5、结果及说明通过实验结果可以看出100个字符的信息量,以及字符信源熵。

比较H2与H3可以看出,并不可以简单的将三组数据看作整体。

6、实验总结本实验通过计算多字符的信息量与分组信息熵,让我们加深了信息论中有关信息量与信息熵的概念与定义,同时也让我们熟悉了matlab的基本操作。

实验二1、实验内容绘制二进制信源熵函数曲线。

2、设计思路及步骤根据信源熵的定义以及公式计算出熵,通过matlab的矩阵运算计算出熵数组,然后通过plot函数画出图像。

3、程序代码及调试过程1.clear all%清除数据2.w=0:0.00001:1;%步进,取0到1之间的数组3.H=-w.*log2(w)-(1-w).*log2(1-w);%计算熵4.plot(w,H)%画出图像5.xlabel('w')%给坐标轴设置标签6.ylabel('H')4、出现的问题及解决方法矩阵乘法出错,,需要使用matlab中的点乘5、结果及说明信源熵的图像为凸形曲线,熵在信源等概分布时取最大值,先增大再减小。

信息论课程实验报告

信息论课程实验报告

中国地质大学(武汉)CHINA UNIV ERSIT Y OF GEOSCIENCES信息论课程实验报告指导老师:严军姓名:刘一龙班级:71082-14学号:20081002007中国地质大学(武汉)2011年6月实验一构造(7,4)系统码一、实验题目Construct a systematic (7,4) linear block code. Y ou can use c / MA TLAB / HDL (VHDL or Verilog-HDL) to describe it. Please write the detail of how to realize it in computer language. And list the program lines.二、实验程序算法设计:利用H的线性独立,通过n的二进制形式构造出H,然后利用H构造出G。

本算法具有通用性,不仅可以计算出(7,4)的生成矩阵,还可以构造出(15,11),(31,26)的生成矩阵。

Matlab程序:clc;disp('请输入系统码n的值');n = input('n=');disp('请输入系统码k的值');k = input('k=');r = n-k;temp=[];for i=1:ny=dec2bin(i,r);for j=1:rtemp(i,j)=mod(y(j),2);endendfor i=1:rt = temp(i,:);temp(i,:)=temp(2^(i-1),:);temp(2^(i-1),:)=t;endfor i=1:(fix(r/2))t = temp(:,i);temp(:,i)=temp(:,r-i+1);temp(:,r-i+1)=t;endH = temp';%-----构造矩阵G--------%P=H(:,r+1:n);G=[P',eye(k)];disp('生成矩阵');Gdisp('校验矩阵');H三、实验结果请输入系统码n的值n=7请输入系统码k的值k=4生成矩阵G =1 1 0 1 0 0 01 0 1 0 1 0 00 1 1 0 0 1 01 1 1 0 0 0 1校验矩阵H =1 0 0 1 1 0 10 1 0 1 0 1 10 0 1 0 1 1 1请输入系统码n的值n=15请输入系统码k的值k=11生成矩阵G =Columns 1 through 81 0 1 0 1 0 0 00 1 1 0 0 1 0 01 1 1 0 0 0 1 01 1 0 0 0 0 0 11 0 0 1 0 0 0 00 1 0 1 0 0 0 01 1 0 1 0 0 0 00 0 1 1 0 0 0 01 0 1 1 0 0 0 00 1 1 1 0 0 0 01 1 1 1 0 0 0 0 Columns 9 through 150 0 0 0 0 0 00 0 0 0 0 0 00 0 0 0 0 0 00 0 0 0 0 0 01 0 0 0 0 0 00 1 0 0 0 0 00 0 1 0 0 0 00 0 0 1 0 0 00 0 0 0 1 0 00 0 0 0 0 1 00 0 0 0 0 0 1校验矩阵H =Columns 1 through 81 0 0 0 1 0 1 10 1 0 0 0 1 1 10 0 1 0 1 1 1 00 0 0 1 0 0 0 0Columns 9 through 151 0 1 0 1 0 10 1 1 0 0 1 10 0 0 1 1 1 11 1 1 1 1 1 1实验二循环码一、实验题目We have already learned how to encode and decode cyclic codes. Please use the generator polynomial g(x)=1+x+x2+x4to construct a (7,3) code. And if the received code vector is [1 1 0 0 1 1 1], how to decode it? Use c / MATLAB / HDL language to realize the encoding and decoding system.二、实验程序算法设计:通过计算自己将生成矩阵G输入到计算机,然后输入要传输的信息m,利用c=mG 自动生成码字c。

信息论与编码课程设计(哈夫曼编码的分析与实现)..

信息论与编码课程设计(哈夫曼编码的分析与实现)..

吉林建筑大学电气与电子信息工程学院信息理论与编码课程设计报告设计题目:哈夫曼编码的分析与实现专业班级:电子信息工程101学生姓名:学号:指导教师:吕卅王超设计时间:2013.11.18-2013.11.29一、设计的作用、目的《信息论与编码》是一门理论与实践密切结合的课程,课程设计是其实践性教学环节之一,同时也是对课堂所学理论知识的巩固和补充。

其主要目的是加深对理论知识的理解,掌握查阅有关资料的技能,提高实践技能,培养独立分析问题、解决问题及实际应用的能力。

通过完成具体编码算法的程序设计和调试工作,提高编程能力,深刻理解信源编码、信道编译码的基本思想和目的,掌握编码的基本原理与编码过程,增强逻辑思维能力,培养和提高自学能力以及综合运用所学理论知识去分析解决实际问题的能力,逐步熟悉开展科学实践的程序和方法二、设计任务及要求通过课程设计各环节的实践,应使学生达到如下要求:1. 理解无失真信源编码的理论基础,掌握无失真信源编码的基本方法;2. 掌握哈夫曼编码/费诺编码方法的基本步骤及优缺点;3. 深刻理解信道编码的基本思想与目的,理解线性分组码的基本原理与编码过程;4. 能够使用MATLAB 或其他语言进行编程,编写的函数要有通用性。

三、设计内容一个有8个符号的信源X ,各个符号出现的概率为:编码方法:先将信源符号按其出现的概率大小依次排列,并取概率最小的字母分别配以0和1两个码元(先0后1或者先1后0,以后赋值固定),再将这两个概率相加作为一个新字母的概率,与未分配的二进制符号的字母重新排队。

并不断重复这一过程,直到最后两个符号配以0和1为止。

最后从最后一级开始,向前返回得到各个信源符号所对应的码元序列,即为对应的码字。

哈夫曼编码方式得到的码并非唯一的。

在对信源缩减时,两个概率最小的符号合并后的概率与其他信源符号的概率相同时,这两者在缩减中的排序将会导致不同码字,但不同的排序将会影响码字的长度,一般讲合并的概率放在上面,12345678,,,,,()0.40.180.10.10.070.060.050.04X x x x x x x x x P X ⎡⎤⎧⎫=⎨⎬⎢⎥⎣⎦⎩⎭这样可获得较小的码方差。

信息论与编码课程设计.docx

信息论与编码课程设计.docx

信息论与编码课程设计报告设计题目:统计信源熵与香农编码专业班级:学号:学生姓名:指导老师:教师评分:2015年3月24日目录一、设计任务与要求 (3)二、设计思路 (3)三、设计流程图 (4)四、程序运行及结果 (5)五、心得体会 (6)参考文献 (7)附录:源程序 (7)一、设计任务与要求1、统计信源熵要求:统计任意文本文件中各字符(不区分大小写)数量 ,计算字符概率 ,并计算信源熵。

2、香农编码要求:任意输入消息概率 ,利用香农编码方法进行编码 ,并计算信源熵和编码效率。

二、设计思路1、统计信源熵在VC++环境中进行编程:(1)打开一篇文章 ,将26个英文字母作为信源。

(2)计算每个字母出现的次数(不区分大小写) ,再通过计算信源总大小来计算在本篇文章中每个字母出现的频率。

(3)通过信源熵计算公式来计算信源熵。

2、香农编码设计思路香农编码主要是通过一系列步骤支出平均码长与信源之间的关系 ,同时是平均码长达到极限值 ,即选择的每个码字的长度k 满足下式: I (x )≤k <I(x)+1 具体步骤如下:a 、将信源消息符号按其出现的概率大小依次排列为:p1≥p2≥…≥pnb 、确定满足下列不等式的整数码长k 为:-lb(pi) ≤k ≤-lb(pi)+1c 、为了编成唯一可译码 ,计算第i 个消息的累加概率:pi =∑p (ak )i−1k=1d 、将累加概率Pi 变换成二进制。

e 、取Pi 二进制数的小数点后Ki 位即为该消息符号的二进制码字。

在香农编码中对于求解编码效率主要是依靠这个公式:R=H(X)/K,其中k =∑p (ai )ki n i=1对于求解信源熵主要依靠公式:H (X )=−∑p (xi )logp(xi)ni=1三、设计流程图1、统计信源熵:↓↓↓↓2、香农编码:↓↓↓↓↓↓↓四、程序运行及结果1、统计信源熵:2、香农编码:五、心得体会通过本次课程设计的练习,进一步巩固了信源熵、信源编码的基本原理,基本上掌握了编码方法,对编程软件的使用得到了很大的熟悉,有效增强了自主设计、编程调试的开发能力,同时也大大提高了本身的实践创新能力。

信息论与编码课程设计报告统计信源熵与香农编码

信息论与编码课程设计报告统计信源熵与香农编码

信息论与编码课程设计报告统计信源熵与香农编码信息论与编码课程设计报告设计题目:统计信源熵与香农编码专业班级电信 12-06学号学生姓名指导教师教师评分3 月 30日目录一、设计任务与要求 (2)二、设计思路 (2)三、设计流程图 (3)四、程序运行及结果 (4)五、心得体会 (6)参考文献 (7)附录:源程序 (8)一、设计任务与要求1.统计信源熵要求:统计任意文本文件中各字符(不区分大小写)数量,计算字符概率,并计算信源熵。

2.香农编码要求:任意输入消息概率,利用香农编码方法进行编码,并计算信源熵和编码效率。

二、设计思路本次课程设计中主要运用C 语言编程以实现任务要求,分析所需要的统计量以及相关变量,依据具体公式和计算步骤编写语句,组成完整C 程序。

1、信源熵定义:信源各个离散消息的自信息量的数学期望为信源的平均信息量,一般称为信源的信息熵,也叫信源熵或香农熵,有时称为无条件熵或熵函数,简称熵,记为H ()。

计算公式:)(log )(-)x (i i i x p x p H ∑=2、香农编码过程:(1)将信源消息符号按其出现的概率大小依次排列为n p p ≥⋅⋅⋅≥≥21p(2)确定满足下列不等式的整数码长i K 为1)()(+-<≤-i i i p lb K p lb(3)为了编成唯一可译码,计算第i 个消息的累加概率∑-==11)(i k k i a p P(4)将累计概率i P 变换成二进制数。

(5)取i P 二进制数的小数点后i K 位即为该消息符号的二进制码字。

三、设计流程图1、统计信源熵开始计算字符概率输出结束2、香农编码开始计算信源熵计算编码效率输出结束四、程序运行及结果1、统计信源熵2、香农编码五、心得体会经过这次课程设计明显的体会到知识匮乏所带来的种种问题,首先是对C语言编程的不熟练,课程知识在与C语言的结合中没有清晰的思路,具体实现程序语言的编写较为困难。

在程序的调试中出现的问题无法及时快速的解决,有些错误甚至无法找到合适的解决方法,以至于不断的修改程序,浪费了大量的时间。

信息论与编码课程设计

信息论与编码课程设计
printf("\n");
n=0;
}
}
for(i=0;i<=25;i++)
{
if(p[i]!=0)
H=H-p[i]*((log(p[i]))/(log(2)));
}
printf("\n");
printf("信源熵=%f\n",H);
printf("字符长度:%d\n",sum);
//printf("\n");
课程设计是培养学生综合运用所学知识,发现、提出、分析和解决实际问题,锻炼实践能力的重要环节,是对学生实际工作能力的具体训练和考察过程。在这个过程中不仅锻炼了我们坚持不懈的毅力,更磨练了一个队伍的团结互助的精神,只有大家一起努力才能将课程设计圆满的完成,设计中遇到和解决问题的过程对我们的探索解决问题能力有了一个提高,对我们以后的学习有很大的好处。
#include<math.h>
void main()
{
int i,sum=0,n=0,ch[50]={0};
double p[50]={0},H=0;
char c,zm;
printf("输入文字:\n");
while((c=getchar())!='\n')
{
sum++;
for (i=97;i<=122;i++)
在香农编码中对于求解编码效率主要是依靠这个公式:R=H(X)/K,其中
对于求解信源熵主要依靠公式:H(X)=
三、设计流程图
1、统计信源熵:
开始

先输入一段英文文章

信息论和编码课程设计

信息论和编码课程设计

信息论和编码课程设计一、课程目标知识目标:1. 理解信息论的基本概念,包括信息量、熵、信道等;2. 掌握常见编码方法(如:哈夫曼编码、算术编码)的基本原理及特点;3. 了解数字通信系统中误码的产生原因及其纠正方法。

技能目标:1. 能够运用信息论的基本原理分析简单通信系统;2. 能够运用编码方法对信息进行压缩和还原;3. 能够运用所学知识解决实际通信过程中的问题。

情感态度价值观目标:1. 培养学生严谨的科学态度和良好的学习习惯;2. 增强学生的团队协作意识和沟通能力;3. 激发学生对信息科学和通信技术的兴趣,培养创新精神。

分析课程性质、学生特点和教学要求,本课程旨在帮助学生掌握信息论和编码的基本知识,培养解决实际通信问题的能力。

课程目标具体、可衡量,便于教学设计和评估。

通过本课程的学习,使学生能够运用所学知识分析、解决实际问题,并为后续相关课程打下坚实基础。

二、教学内容1. 信息论基本概念:信息量、熵、信道容量、互信息等;教材章节:第一章 信息论基础2. 编码方法:- 哈夫曼编码:原理、构造方法及应用;- 算术编码:原理、算法流程及应用;教材章节:第二章 编码方法3. 误码纠正:- 误码产生原因及纠正方法;- 简单误码纠正码:奇偶校验、海明码等;教材章节:第三章 误码纠正4. 信息论与编码在实际通信系统中的应用案例分析。

教学内容安排和进度:1. 第1周:信息论基本概念;2. 第2-3周:编码方法(哈夫曼编码、算术编码);3. 第4周:误码纠正;4. 第5周:应用案例分析及讨论。

教学内容确保科学性和系统性,与课程目标紧密关联,涵盖信息论和编码的主要知识点。

通过以上教学安排,使学生全面掌握信息论和编码的基本知识,提高解决实际通信问题的能力。

三、教学方法本课程将采用以下多样化的教学方法,以激发学生的学习兴趣和主动性:1. 讲授法:通过系统的讲解,使学生掌握信息论和编码的基本概念、原理和方法。

在教学过程中,注重启发式教学,引导学生主动思考问题,提高课堂互动效果。

最新《信息论基础》实验报告-实验1

最新《信息论基础》实验报告-实验1

最新《信息论基础》实验报告-实验1实验目的:1. 理解信息论的基本概念,包括信息熵、互信息和编码理论。

2. 通过实验掌握香农信息熵的计算方法。

3. 学习并实践简单的数据压缩技术。

实验内容:1. 数据集准备:选择一段英文文本作为实验数据集,统计各字符出现频率。

2. 信息熵计算:根据字符频率计算整个数据集的香农信息熵。

3. 编码设计:设计一种基于频率的霍夫曼编码方案,为数据集中的每个字符分配一个唯一的二进制编码。

4. 压缩与解压缩:使用设计的霍夫曼编码对原始文本进行压缩,并验证解压缩后能否恢复原始文本。

5. 性能评估:比较压缩前后的数据大小,计算压缩率,并分析压缩效果。

实验步骤:1. 从文本文件中读取数据,统计每个字符的出现次数。

2. 利用统计数据计算字符的相对频率,并转换为概率分布。

3. 应用香农公式计算整个数据集的熵值。

4. 根据字符频率构建霍夫曼树,并为每个字符生成编码。

5. 将原始文本转换为编码序列,并记录压缩后的数据大小。

6. 实现解压缩算法,将编码序列还原为原始文本。

7. 分析压缩前后的数据大小差异,并计算压缩率。

实验结果:1. 原始文本大小:[原始文本大小]2. 压缩后大小:[压缩后大小]3. 压缩率:[压缩率计算结果]4. 霍夫曼编码表:[字符与编码的对应表]实验讨论:- 分析影响压缩效果的因素,如字符集大小、字符频率分布等。

- 讨论在实际应用中,如何优化编码方案以提高压缩效率。

- 探讨信息论在数据压缩之外的其他应用领域。

实验结论:通过本次实验,我们成功地应用了信息论的基本原理,通过霍夫曼编码技术对文本数据进行了有效压缩。

实验结果表明,基于字符频率的霍夫曼编码能够显著减少数据的存储空间,验证了信息论在数据压缩领域的有效性和实用性。

信息论与编码课程设计(哈夫曼编码的分析与实现)

信息论与编码课程设计(哈夫曼编码的分析与实现)

吉林建筑大学电气与电子信息工程学院信息理论与编码课程设计报告设计题目:哈夫曼编码的分析与实现专业班级:电子信息工程101学生姓名:学号:指导教师:吕卅王超设计时间:2013.11.18-2013.11.29一、设计的作用、目的《信息论与编码》是一门理论与实践密切结合的课程,课程设计是其实践性教学环节之一,同时也是对课堂所学理论知识的巩固和补充。

其主要目的是加深对理论知识的理解,掌握查阅有关资料的技能,提高实践技能,培养独立分析问题、解决问题及实际应用的能力。

通过完成具体编码算法的程序设计和调试工作,提高编程能力,深刻理解信源编码、信道编译码的基本思想和目的,掌握编码的基本原理与编码过程,增强逻辑思维能力,培养和提高自学能力以及综合运用所学理论知识去分析解决实际问题的能力,逐步熟悉开展科学实践的程序和方法二、设计任务及要求通过课程设计各环节的实践,应使学生达到如下要求:1. 理解无失真信源编码的理论基础,掌握无失真信源编码的基本方法;2. 掌握哈夫曼编码/费诺编码方法的基本步骤及优缺点;3. 深刻理解信道编码的基本思想与目的,理解线性分组码的基本原理与编码过程;4. 能够使用MATLAB 或其他语言进行编程,编写的函数要有通用性。

三、设计内容一个有8个符号的信源X ,各个符号出现的概率为:编码方法:先将信源符号按其出现的概率大小依次排列,并取概率最小的字母分别配以0和1两个码元(先0后1或者先1后0,以后赋值固定),再将这两个概率相加作为一个新字母的概率,与未分配的二进制符号的字母重新排队。

并不断重复这一过程,直到最后两个符号配以0和1为止。

最后从最后一级开始,向前返回得到各个信源符号所对应的码元序列,即为对应的码字。

哈夫曼编码方式得到的码并非唯一的。

在对信源缩减时,两个概率最小的符号合并后的概率与其他信源符号的概率相同时,这两者在缩减中的排序将会导致不同码字,但不同的排序将会影响码字的长度,一般讲合并的概率放在上面,12345678,,,,,()0.40.180.10.10.070.060.050.04X x x x x x x x x P X ⎡⎤⎧⎫=⎨⎬⎢⎥⎣⎦⎩⎭这样可获得较小的码方差。

信息论课程设计

信息论课程设计

电子科技大学电子工程学院信息论课程设计报告课程名称:信息编码与加密课程设计报告学生姓名:农瀚学号:2014020908021 指导教师:李万春一、课程设计名称:编程实现霍夫曼、费诺、香农编码二、课设原理:1)霍夫曼编码:霍夫曼编码的平均码长最短,是最佳编码。

编码步骤如下:(1)将信源符号按概率大小排序;(2)对概率最小的两个符号求其概率之和,同时给两幅号分别赋予码元0和1;(3)将概率之和当做一个新符号的概率。

与剩下的概率一起,形成一个缩减信源,再重复上述步骤,直到概率和为1为止;(4)按上述步骤实际上构成了一个码树,从根到端点经过的树枝即为码字。

2)费诺编码:编码步骤如下:(1)将信源概率从大到小排序;(2)将信源符号分成两组,使两组信源符号的概率之和近似相等,并给两组信源符号分别赋0和1;(3)再把各个小组的信源符号细分为两组并赋码元,方法与第一次分组相同;(4)如此一直下去,直到每一个小组只含一个信源符号为止;(5)由此可构造成一个码树,所有终端节点上的码字组成费诺码。

3)香农编码:编码方法如下:⑴将信源消息符号按其出现的概率大小依次排列p(u1)≥p(u2)≥…≥p(un)⑵确定码长Ki (整数) :Ki= []——取整⑶为了编成唯一可译码,计算第i个消息的累加概率⑷将累加概率Pi变换成二进制数。

⑸取pi二进制数的小数点后Ki位即为该消息符号的二进制数。

三、课设目的:通过编程实现三种方式的编码,掌握三种编码方式的步骤。

四、课设内容:三种编码方式的编程思路:1、霍夫曼编码:(1)对给定的n个权值{W1,W2,W3,...,Wi,...,Wn}构成n棵二叉树的初始集合F= {T1,T2,T3,...,Ti,...,Tn},其中每棵二叉树Ti中只有一个权值为Wi的根结点,它的左右子树均为空。

(为方便在计算机上实现算法,一般还要求以Ti的权值Wi的升序排列。

)(2)在F中选取两棵根结点权值最小的树作为新构造的二叉树的左右子树,新二叉树的根结点的权值为其左右子树的根结点的权值之和。

信息论课程设计实验报告

信息论课程设计实验报告

《信息论课程设计》实验报告题目 1:实现香农编码及计算其编码效率题目 2:实现有噪信道编码中的循环码院系(部):计算机科学与技术学院专业及班级:信息与计算科学1301班姓名:唐诗韵学号: 1308060105 日期: 2016/01/10目录1. 课题描述 (1)2. 信源编码的相关介绍 (2)3. 香农编码(题目一) (3)3.1. 香农编码算法 (3)3.2. 香农编码特点 (4)4. 香农编码的C++程序实现 (4)4.1. 程序设计 (4)4.2. 运行结果 (6)5. 实现有噪信道中的循环码编码方法(题目二) (6)5.1. 循环码编码算法 (6)5.2. 循环码编码特点 (7)6. 循环码编码的C++程序实现 (7)6.1. 程序设计 (7)6.2. 运行结果 (9)7. 总结 (10)8. 参考文献 (11)1.课题描述信息论是一门理论和实践相结合的专业,因此相关题目都是来自于实践,同时具有上机练习的可操作性,此门科目是通信的基础。

香农1984年发表的一篇论文标志着信息论诞生,在他的论文中主要用概率来描述有效传输信息的问题,用概率给予了信息的定量描述方法,并提出了信源熵的概念,在现实生活中,人们经常把消息和信息分不清,认为消息就是信息,实则不是,消息是描述实物,而信息是定量描述一个消息所传输的信息量,通常用自信息量来描述一个消息所传达的信息量,它取值为此事件发生的概率的负对数,它表示一个事件发生之前此事件发生的不确定性大小,也表示一个事件发生后它所能提供的信息量,两个相互独立的消息所提供的信息量等于各自信息量之和。

此外,还可用互信息来描述信息的传达,为一个事件给出关于另一个事件的信息量,也表示事件y出现后信宿获得的关于x的信息量,互信息的引出,使信息的传递得到了定量的表示。

如果事件是以序列的形式表示的,及事件集,则用平均自信息量来表示信源所传递的信息,平均信息量表示信源的平均不确定性,比如抛掷一枚硬币的试验所包含的平均信息量。

信息论与编码课程设计报告(语音编码与测试)

信息论与编码课程设计报告(语音编码与测试)

语音编码及测试一、摘要利用手机录制18份小语音样本共3分钟,利用Matlab读取语音音频,并使用其统计函数对音频进行数据种类,个数及概率统计,利用统计得到的数据种类和概率进行概率密度函数拟合,拟合得到两段概率密度函数。

同时使用Lloyds分类算法对统计好的数据进行分类,共分为nR2个类别,即512类,得到其相应区间及质心。

对概率密度函数进行对应区间的积分得到区间对应的概率,然后使用Huffman编码进行二元编码,得到512个码字与质心对应。

测试阶段利用码字库,对随机录制的一段小语音进行编码得到音频对应的码字。

关键字:概率密度函数、Lloyds分类算法、Huffman编码、码字二、问题重述2.1语音编码录制一份语音,使用相应的工具对其音频进行提取,对提取到的音频进行概2个类率统计拟合出概率密度函数。

选取适当的方法将统计好的音频数字分为nR2个区间及区间对应的质心,既码字,概率密度函数进行别,分类后相应得到nRnR2个区间积分,由此得到nR2个码字及其概率对应,最后选取适当的编码方法得到质心对应的码字,都成编码库2.2编码测试录制一段小语音利用上诉的码字及其编码库,最终得到每个音频数对应的码字。

三、问题分析3.1语音编码由于录制的语音是作为实验得到码书的样本,因此语音的录制面要广且量应尽可能的多才能保证实验的合理性。

使用Matlab对语音进行音频读取及相应的概率统计,对统计后的结果利用Matlab中cftool工具箱对数据及其概率进行拟合,得到概率密度函数。

考虑到数据量及其较大的重复性,对于分类阶段采用统计好的音频数据,利用Matlab 中Lloyds 算法函数按nR 2分类,其结果会得到nR 2个区间及区间对应的质心,既码字。

利用密度函数对nR 2个区间进行积分得到nR 2个码字对应的概率,最后利用Matlab 中Huffman 编码程序对其概率进行0、1编码。

得到nR 2个码书构成本次实验的码字库。

信息论课程实验报告—唯一可译码的判定

信息论课程实验报告—唯一可译码的判定

return ISUDC; } /************************************************************************/ /* 该函数是用来对每个 pPostfix 和原码字序列进行比较, 如果重复了则在 pRetnBuf 中 /* 返回本身.并返回 1.否则如果没有得到新的后缀码的话返回 0 表示无重复*/ /* Stack 用来存储递归中产生的后缀码集合,这样确保每次得到的后缀码不会重复 /* 防止进去死循环 /************************************************************************/ int GetBacktraceSeq(const pCharVector& pCode,char* pPostfix,pCharVector& Stack,char** pRetnBuf) { char* iter1; for (int i = 0; i < pCode.size(); i++) { iter1 = pCode.at(i); int nRetn = IsPrefix(iter1,pPostfix); if (nRetn == ISSAME) { //第一次进来的话由于是码字序列内部的比较,所以 //肯定会遇到自己跟自己比较然后相等的情况,对该情况不允考虑 if(Stack.size() == 0) continue; *pRetnBuf = new char[strlen(pPostfix) + 1]; strcpy(*pRetnBuf,pPostfix); return 1; } if (ISPREFIX == nRetn) { //新得到的后缀码已经重复了,跳过对他的处理 if(PushBackUniqueValue(Stack,iter1) == false) continue; char* pTemp = NULL; //递归处理下一个后缀码 if(GetBacktraceSeq(pCode,pPostfix+strlen(iter1),Stack,&pTemp) == 0) { *pRetnBuf = NULL; Stack.pop_back(); continue; } Stack.pop_back(); //递归过程中遇到重复码字,算法应立即返回. //将自身和递归得到的后面的后缀码组合成一个歧义序列返回 char* pNewTraceSeq = new char[strlen(iter1) + strlen(pTemp) + 1]; pNewTraceSeq[0] = 0; strcat(pNewTraceSeq,iter1); strcat(pNewTraceSeq + strlen(iter1),pTemp); delete[] pTemp;
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

成绩:2016-2017学年第1学期《信息论》课程设计学院名称:班级学号:学生姓名:教师姓名:2016年 12 月一、判定唯一可译码1. 任务说明输入:任意的一个码(即已知码字个数及每个具体的码字) 输出:判决结果(是/不是)输入文件:in1.txt ,含至少2组码,每组的结尾为”$”符 输出文件:out1.txt ,对每组码的判断结果说明:为了简化设计,可以假定码字为0,1串2. 实现原理判断方法:将码C 中所有码字可能的尾随后缀组成一个集合F ,当且仅当集合F 中没有 包含任一码字,则可判断此码C 为唯一可译变长码。

构成集合F :首先观察码C 中最短的码字是否是其他码字的前缀。

若是,将其所有可能 的尾随后缀排列出。

就是将其他码字序列中截去与其最短码字相同的前缀 部分,将余下的序列为尾随后缀。

而这些尾随后缀又可能是某些码字的前 缀,或者最短码字又仍是这些尾随后缀的前缀,再将由这些尾随后缀产生 的新的尾随后缀列出。

然后再观察这些新的尾随后缀是否是某些码字的前 缀,或观察有否其他码字是这些新的尾随后缀的前缀,再将产生的尾随后 缀列出,依次下去,直至没有一个尾随后缀是码字的前缀或没有新的尾随 后缀产生为止。

这样,首先获得的是由最短码字能引起的所有尾随后缀。

接着,按照上述步骤将次短的码字、......所有码字可能产生的尾随后缀前部 列出。

由此得到由码C 的所有可能的尾随后缀组成的集合F 。

参考算法伪代码:For all ,i j W W C ∈ doif i W 是j W 的前缀 then将相应的后缀作为一个尾随后缀放入集合0F 中 End if End for LoopFor all i W C ∈ doFor all j n W F ∈ doif i W 是j W 的前缀 then将相应的后缀作为一个尾随后缀放入集合1n F +中 Else if j W 是i W 的前缀 then将相应的后缀作为一个尾随后缀放入集合1n F +中End if End for End for i i F F ←If ,i i W F W C ∃∈∈ thenReturn falseElse if F 中未出现新的元素thenReturn trueEnd if//能走到这里,说明F中有新的元素出现,需继续End loop3. 实现源码#include<iostream>#include<fstream>#include<stdio.h>#include<string.h>using namespace std;#pragma warning(disable:4996)char c[100][50]; //保存码字char f[300][50]; //保存尾随后缀int N, sum = 0; //N为码字的个数,sum为尾随后缀个数int flag; //判断是否唯一可译标志位//检测尾随后缀void patterson(char c[], char d[]){int i, j, k;for (i = 0;; i++){If (c[i] == '\0'&&d[i] == '\0')//两字符串一样长,跳出break;if (c[i] == '\0') //d比c长,将d的尾随后缀放入f中{for (j = i; d[j] != '\0'; j++)f[sum][j - i] = d[j];f[sum][j - i] = '\0';for (k = 0; k<sum; k++){if (strcmp(f[sum], f[k]) == 0) /*查看当前生成的尾随后缀在f集合中是否存在*/{sum--; break;}}sum++;break;}if (d[i] == '\0') //c比d长,将c的尾随后缀放入f中{for (j = i; c[j] != '\0'; j++)f[sum][j - i] = c[j];f[sum][j - i] = '\0';for (k = 0; k<sum; k++){if (strcmp(f[sum], f[k]) == 0) /*查看当前生成的尾随后缀在f集合中是否存在*/{sum--; break;}}sum++;break;}if (c[i] != d[i])//字符不一样了也退出(前缀不同)break;}}void main(){int k = 0, N = 0, m = 0, a[50], z = 0;a[m] = N; m++;fstream file1;file1.open("out1.txt");//码字读取FILE *file;file = fopen("in1.txt", "r+");int num = fgetc(file) - 48;for (int n = 0; n < num; n++){int i = 0, j;if (fgetc(file) == ' ')N += (fgetc(file) - 48);else N += (fgetc(file) - 48);a[m] = N; m++;fgetc(file);for (k; k < N; k++){for (int q = 0;; q++){char temp = fgetc(file);c[k][q] = temp;if (temp == ' ' || temp == '$'){c[k][q] = '\0';break;}}}//生成尾随后缀flag = 0;for (i = a[z]; i<N - 1; i++)//判断码本身是否重复for (j = i + 1; j<N; j++){if (strcmp(c[i], c[j]) == 0){flag = 1; break;}}if (flag == 1)//如果码本身有重复,就可以断定它不是唯一可译码{for (int y = a[z]; y < N; y++)file1 << c[y] << ' ';file1 << "不是唯一可译码。

\n";}else{for (i = a[z]; i<N - 1; i++) /*将原始码字生成的尾随后缀集合s[1]放入f中*/{for (j = i + 1; j<N; j++){patterson(c[i], c[j]);}}for (i = 0;; i++) //根据原始码与s[i]生成s[i+1]也放入f[i]{int s = 0;for (j = a[z]; j<N; j++) /*判断s[i+1]中的字符串是否与s[i]中一样,重复的则不再添加*/{if (i == sum){s = 1; break;}elsepatterson(f[i], c[j]);}if (s == 1)break;}for (i = 0; i<sum; i++) /*判断尾随后缀与原始码字是否相同,相同则不是唯一可译码*/ {for (j = a[z]; j<N; j++){if (strcmp(f[i], c[j]) == 0){flag = 1;break;}}}if (flag == 1){for (int y = a[z]; y < N; y++)file1 << c[y] << ' ';file1 << "不是唯一可译码。

\n";}else{for (int y = a[z]; y < N; y++)file1 << c[y] << ' ';file1 << "是唯一可译码。

\n";}}file1 << "尾随后缀集合为:";for (i = 0; i < sum; i++)file1 << f[i] << ' ';file1 << "\n";z++;sum = 0;}}4. 运行结果输入文件:in1.txt说明:输入文件中第一个数字表示码的组数,第二个数字表示一组码码字的个数,一组码结束以“$”符号结尾;“$”符号后的数字表示下一组码的码字个数。

此例以两组码输入为例,多组码判断同上。

输出文件:out1.txt结果分析:程序首先读取第一组码,进行是否唯一可译码的判断,在输出文件第一行输出判断结果,在第二行输出该码字产生的尾随后缀集合(若只是输出是否唯一可译码的判断结果,不能完全说明程序的正确性,可能存在偶然性;若是输出的尾随后缀集合是正确的,则能说明程序的正确性,由于选取的两组数据来自课本,可以准确的知道尾随后缀集合是否正确,则可验证此程序的正确性,即可用于判断码是否为唯一可译码)。

5. 设计体会通过此实验的设计,进一步加深了我对唯一可译码判别方法的理解。

此实验在设计完成的过程中出现两大难点,第一点就是,作为此程序的核心,两个码字生成尾随后缀的函数编写,选取两个字符数组保存码字和后缀,通过码字长度和单个字符比较来生成尾随后缀;第二个难点是码字的文件读取,起初考虑的是整个码字一起读取,发现实现过程较为复杂,经过修改,改为单个字符读取能简化程序的设计。

其他部分按照唯一可译码的判断方法进行设计,关键部分调用尾随后缀生成函数即可,再将判断结果输出到输出文件。

此实验总体而言较为简单,实现时注意细节、没有逻辑误区即可。

二、游程编码+Huffman码1. 任务说明要求:一无记忆二元信源,0符号的出现概率为1/4, 1符号的出现概率为3/4。

现要求对该信源连续出现的n个符号序列,先进行游程编码,再对结果进行Huffman编码。

然后,再进行Huffman译码和游程译码。

假定,连续出现的0或1序列的长度不超过16,n不小于256。

输入:长为n的0/1串输出:1. 游程编码结果,2. Huffman编码结果,3. Huffman译码结果4. 游程译码结果输入文件:in2.txt,含至少两组输入输出文件:out2.txt,对每组输入的处理结果2. 实现原理游程编码:信源输出的字符序列中各种字符连续地重复出现而形成一段一段的字符串,这种字符串的长度称为游程。

相关文档
最新文档