北京邮电大学信通院数据结构实验三——哈夫曼树实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2009级数据结构实验报告
实验名称:实验三——哈夫曼编/解码器的实现
学生姓名:陈聪捷
日期:2010年11月28日
1.实验要求
一、实验目的:
了解哈夫曼树的思想和相关概念;
二、实验内容:
利用二叉树结构实现哈夫曼编/解码器
1.初始化:能够对输入的任意长度的字符串s进行统计,统计每个字符的频度,并建立哈夫曼树。
2.建立编码表:利用已经建好的哈夫曼树进行编码,并将每个字符的编码输出。
3.编码:根据编码表对输入的字符串进行编码,并将编码后的字符串输出。
4.译码:利用已经建好的哈夫曼树对编码后的字符串进行译码,并输出译码结果。
5.打印:以直观的方式打印哈夫曼树。
6.计算输入的字符串编码前和编码后的长度,并进行分析,讨论哈夫曼编码的压缩效果。
7.用户界面可以设计成“菜单”方式,能进行交互,根据输入的字符串中每个字符出现的次数统计频度,对没有出现的字符一律不用编码。
2. 程序分析
2.1 存储结构
二叉树
template
class BiTree
{
public:
BiTree(); //构造函数,其前序序列由键盘输入
~BiTree(void); //析构函数
BiNode
protected:
BiNode
};
//声明类BiTree及定义结构BiNode
Data:
二叉树是由一个根结点和两棵互不相交的左右子树构成
二叉树中的结点具有相同数据类型及层次关系
哈夫曼树类的数据域,继承节点类型为int的二叉树
class HuffmanTree:public BiTree
data:
HCode* HCodeTable;//编码表
int tSize; //编码表中的总字符数
二叉树的节点结构
template
struct BiNode //二叉树的结点结构
{
T data; //记录数据
T lchild; //左孩子
T rchild; //右孩子
T parent; //双亲
};
编码表的节点结构
struct HCode
{
char data; //编码表中的字符
char code[100]; //该字符对应的编码
};
待编码字符串由键盘输入,输入时用链表存储,链表节点为struct Node
{
char character; //输入的字符
unsigned int count;//该字符的权值
bool used; //建立树的时候该字符是否使用过
Node* next; //保存下一个节点的地址
};
示意图:
2.2 关键算法分析
1.初始化函数(void HuffmanTree::Init(string Input))
算法伪代码:
1.初始化链表的头结点
2.获得输入字符串的第一个字符,并将其插入到链表尾部,n=1(n记录的是链表
中字符的个数)
3.从字符串第2个字符开始,逐个取出字符串中的字符
3.1 将当前取出的字符与链表中已经存在的字符逐个比较,如果当前取出
的字符与链表中已经存在的某个字符相同,则链表中该字符的权值加1。
3.2 如果当前取出的字符与链表中已经存在的字符都不相同,则将其加入
到链表尾部,同时n++
4.tSize=n(tSize记录链表中字符总数,即哈夫曼树中叶子节点总数)
5.创建哈夫曼树
6.销毁链表
源代码:
void HuffmanTree::Init(string Input)
{
Node *front=new Node; //初始化链表的头结点
if(!front)
throw exception("堆空间用尽");
front->next=NULL;
front->character=NULL;
front->count=0;
Node *pfront=front;
char ch=Input[0]; //获得第一个字符
Node* New1=new Node;
if(!New1)
throw exception("堆空间用尽");
New1->character=ch; //将第一个字符插入链表
New1->count=1;
New1->next=pfront->next;
pfront->next=New1;
bool replace=0; //判断在已经写入链表的字符中是否有与当前读出的字符相同的字符int n=1; //统计链表中字符个数
for(int i=1;i { ch=Input[i]; //获得第i个字符 do { pfront=pfront->next; if((int)pfront->character == (int)ch) //如果在链表中有与当前字符相同的字符, 该字符权值加1 { pfront->count++; replace=1; break; } }while(pfront->next); if(!replace) //如果在链表中没找到与当前字符相同的字符,则将该字符作为新成员插入链表 { Node* New=new Node; if(!New) throw exception("堆空间用尽"); New->character=ch; New->count=1; New->next=pfront->next; pfront->next=New; n++; } pfront=front; //重置pfront和replace变量为默认值 replace=0; } tSize=n; //tSize记录的是编码表中字符个数CreateHTree(front,n); //创建哈夫曼树 pfront=front; while(pfront) //销毁整个链表 { front=pfront; pfront=pfront->next; delete front; } 时间复杂度: 若输入的字符串长度为n,则时间复杂度为O(n) 2.创建哈夫曼树(void HuffmanTree::CreateCodeTable(Node *p)) 算法伪代码: 1.创建一个长度为2*tSize-1的三叉链表 2.将存储字符及其权值的链表中的字符逐个写入三叉链表的前tSize个结点